論文まとめ:SAM 2: Segment Anything in Images and Videos
255{icon} {views} タイトル:SAM 2: Segment Anything in Images and Videos 著者:Nikhila Ravi, Valentin Gabeur, Yuan-Tin […]...
論文まとめ:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection
695{icon} {views} 論文URL:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection 著者:B […]...
論文まとめ:UniVTG: Towards Unified Video-Language Temporal Grounding
348{icon} {views} タイトル:UniVTG: Towards Unified Video-Language Temporal Grounding 著者:Kevin Qinghong Lin, Pengch […]...
論文まとめ:Flamingo: a Visual Language Model for Few-Shot Learning
1.8k{icon} {views} タイトル:Flamingo: a Visual Language Model for Few-Shot Learning 著者:Jean-Baptiste Alayrac, Jeff […]...
ディープラーニングの動画読み込みをいい感じにしてくれる「Decord」の紹介
2.5k{icon} {views} ディープラーニングでの動画解析向けの読み込みライブラリ、Decordを紹介します。OpenCVよりもフレーム間のスキップやバッチ化が簡単にできるようになっています。PyTorchと連 […]...
Text4Visを使ったオープンセットな動画認識をやってみた
655{icon} {views} オープンセットな行動認識のできるText4VisというモデルをHMDB51で試し撃ちしてみました。訓練済みモデルが公開されており、すぐ利用することができます。 はじめに Text4Vi […]...
論文まとめ:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval
622{icon} {views} タイトル:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval 著者:F […]...
ffmpeg-pythonでサクッとNumPy配列から動画を出力する
7.3k{icon} {views} ffmpeg-pythonを使って、NumPy配列から動画を生成する方法を説明します。OpenCVのVideoWriterよりも、コーデックの問題が発生しづらかったり、画質を柔軟に選 […]...
PyTorchのDataLoaderで動画を並列化して読み込むためのハック
4.4k{icon} {views} 動画の前処理はフレーム単位の画像処理をするためとても重いですが、特にOpenCVで動画を読み込む場合、OpenCVの特性上並列化が難しいという面倒くさい状況に遭遇します。この記事では […]...
OpenCVで作成した動画がブラウザで正常に表示できない場合の解決法
25.3k{icon} {views} OpenCVで作成した動画をサイトで表示する場合、ローカルで再生できていても、ブラウザ上では突然プレビューがでなり、ハマることがあります。原因の特定が難しい現象ですが、動画を作成す […]...