論文まとめ:InstructPix2Pix: Learning to Follow Image Editing Instructions
19{icon} {views} タイトル:InstructPix2Pix: Learning to Follow Image Editing Instructions 著者:Tim Brooks, Aleksander […]...
いろんなT5からSentence Embeddingをとって遊ぶ
99{icon} {views} 自然言語処理モデルT5を使って文章単位の埋め込み量(Sentence Embedding)を取得することを考えます。T5のEmbeddingはトークン単位ですが、平均を取ることで、簡単に […]...
Text4Visを使ったオープンセットな動画認識をやってみた
69{icon} {views} オープンセットな行動認識のできるText4VisというモデルをHMDB51で試し撃ちしてみました。訓練済みモデルが公開されており、すぐ利用することができます。 はじめに Text4Vis […]...
論文まとめ:StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech Synthesis
51{icon} {views} タイトル:StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech Synthesi […]...
論文まとめ:OCR-free Document Understanding Transformer
317{icon} {views} タイトル:OCR-free Document Understanding Transformer 著者:Geewook Kim, Teakgyu Hong, Moonbin Yim, […]...
論文まとめ:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval
92{icon} {views} タイトル:Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval 著者:Fa […]...
論文まとめ:Large Language Models are Zero-Shot Reasoners
290{icon} {views} タイトル:Large Language Models are Zero-Shot Reasoners 著者:Takeshi Kojima, Shixiang Shane Gu, Mac […]...
論文まとめ:Extremely Simple Activation Shaping for Out-of-Distribution Detection
286{icon} {views} タイトル:Extremely Simple Activation Shaping for Out-of-Distribution Detection 著者:Andrija Djuris […]...
論文まとめ:Domino: Discovering Systematic Errors with Cross-Modal Embeddings
64{icon} {views} タイトル:Domino: Discovering Systematic Errors with Cross-Modal Embeddings 著者:Sabri Eyuboglu, May […]...
論文まとめ:Exploring Visual Prompts for Adapting Large-Scale Models
283{icon} {views} タイトル:Exploring Visual Prompts for Adapting Large-Scale Models 著者:Hyojin Bahng, Ali Jahanian, […]...