論文まとめ:An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion
1.9k{icon} {views} タイトル:An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inver […]...
cv2.rectangleのBounding Boxの指定でハマった
7.2k{icon} {views} OpenCVのrectangleはBounding Boxを描画する際によく使う関数ですが、引数の数によって座標指定のフォーマットが違います。これを知らなくてえらいハマったので忘備録 […]...
論文まとめ:Patching open-vocabulary models by interpolating weights
892{icon} {views} タイトル:Patching open-vocabulary models by interpolating weights 著者:Gabriel Ilharco, Mitchell W […]...
NumPy関数だけでTopKを求め、多次元のインデックスをスライスするための方法
4.7k{icon} {views} NumPy関数を使って多次元配列のTopKを求める方法を検証します。PyTorchの関数を使えば簡単にできますが、NumPyだけで行う場合は工夫が必要です。いつも忘れるので自分用忘備 […]...
論文まとめ:Collaborative Neural Rendering using Anime Character Sheets
984{icon} {views} タイトル:Collaborative Neural Rendering using Anime Character Sheets 論文URL:https://arxiv.org/abs […]...
論文まとめ:Few-Shot Font Generation by Learning Fine-Grained Local Styles
1.4k{icon} {views} タイトル:Few-Shot Font Generation by Learning Fine-Grained Local Styles 論文URL:https://openacces […]...
PyTorchのDataLoaderで動画を並列化して読み込むためのハック
5k{icon} {views} 動画の前処理はフレーム単位の画像処理をするためとても重いですが、特にOpenCVで動画を読み込む場合、OpenCVの特性上並列化が難しいという面倒くさい状況に遭遇します。この記事では、全 […]...
論文まとめ:Decoder Denoising Pretraining for Semantic Segmentation
967{icon} {views} タイトル:Decoder Denoising Pretraining for Semantic Segmentation 論文:https://arxiv.org/abs/2205.1 […]...
3DのポーズやUVマップのとれるトラッキングPHALPを試してみた
1.2k{icon} {views} 3Dの位置、外観、姿勢といったパラメーターは3Dモデルをレンダリングする際には必須です。CVPR2022にあった「PHALP」が、それらのパラメーターを推定しつつ、トラッキングしてく […]...
YOLOX+ByteTrackでお手軽トラッキングやってみた
8.4k{icon} {views} YOLOX+ByteTrackでトラッキングをやってみました。「とりあえずサクッと訓練済みモデルでトラッキングしたい」というときに使える手法です。 背景 トラッキング、需要ある割に個 […]...