Gradioでセッションの概念を導入する
1.5k{icon} {views} Gradioでユーザー名などセッションごとに変数を記録したいときはよくあります。gr.Stateで簡単にできるので、アンチパターンとセットで紹介していきます。 アンチパターン:グロー […]...
Gradioでログイン認証を入れる方法
3.5k{icon} {views} Gradioで作ったアプリにログイン認証を入れる必要があったので、方法を調べてみました。launchの引数にauthを追加するだけで簡単にできます。 はじめに Hugging-Fac […]...
Text4Visを使ったオープンセットな動画認識をやってみた
560{icon} {views} オープンセットな行動認識のできるText4VisというモデルをHMDB51で試し撃ちしてみました。訓練済みモデルが公開されており、すぐ利用することができます。 はじめに Text4Vi […]...
論文まとめ:StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech Synthesis
792{icon} {views} タイトル:StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech Synthes […]...
論文まとめ:OCR-free Document Understanding Transformer
3k{icon} {views} タイトル:OCR-free Document Understanding Transformer 著者:Geewook Kim, Teakgyu Hong, Moonbin Yim, J […]...
論文まとめ:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval
520{icon} {views} タイトル:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval 著者:F […]...
OpenCVで「 (-5:Bad argument) in function ‘rectangle’」と怒られた
8.7k{icon} {views} OpenCVでcv2.rectangleを実行したところ、「-1: error: (-5:Bad argument) in function ‘rectangleR […]...
ffmpeg-pythonでサクッとNumPy配列から動画を出力する
6.1k{icon} {views} ffmpeg-pythonを使って、NumPy配列から動画を生成する方法を説明します。OpenCVのVideoWriterよりも、コーデックの問題が発生しづらかったり、画質を柔軟に選 […]...
DockerでGPU版ONNXを使ってみる
2.4k{icon} {views} DockerでGPU版をONNXを動かしてみました。比較的に簡単に動かせたので、いろいろ便利だと思います。YOLOXを例に検証します。 概要 ONNXRuntimeのGPU版をDoc […]...
論文まとめ:Large Language Models are Zero-Shot Reasoners
5.9k{icon} {views} タイトル:Large Language Models are Zero-Shot Reasoners 著者:Takeshi Kojima, Shixiang Shane Gu, Ma […]...