論文読み | Shikoan's ML Blog

論文まとめ：Generalized Decoding for Pixel, Image, and Language

2023-02-09

927{icon} {views} タイトル：Generalized Decoding for Pixel, Image, and Language 著者：Xueyan Zou, Zi-Yi Dou, Jianwei Y […]...

2023-02-02

10.6k{icon} {views} タイトル：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Larg […]...

2023-01-26

1.6k{icon} {views} タイトル：InstructPix2Pix: Learning to Follow Image Editing Instructions 著者：Tim Brooks, Aleksand […]...

2023-01-12

1.2k{icon} {views} タイトル：StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech Synthe […]...

2022-12-11

3.8k{icon} {views} タイトル：OCR-free Document Understanding Transformer 著者：Geewook Kim, Teakgyu Hong, Moonbin Yim, […]...

2022-12-08

854{icon} {views} タイトル：Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval 著者：F […]...

2022-12-01

7.9k{icon} {views} タイトル：Large Language Models are Zero-Shot Reasoners 著者：Takeshi Kojima, Shixiang Shane Gu, Ma […]...

2022-11-23

1.3k{icon} {views} タイトル：Extremely Simple Activation Shaping for Out-of-Distribution Detection 著者：Andrija Djuri […]...

2022-11-16

484{icon} {views} タイトル：Domino: Discovering Systematic Errors with Cross-Modal Embeddings 著者：Sabri Eyuboglu, Ma […]...

2022-11-10

2.3k{icon} {views} タイトル：Exploring Visual Prompts for Adapting Large-Scale Models 著者：Hyojin Bahng, Ali Jahanian […]...