論文まとめ:Flamingo: a Visual Language Model for Few-Shot Learning
2k{icon} {views} タイトル:Flamingo: a Visual Language Model for Few-Shot Learning 著者:Jean-Baptiste Alayrac, Jeff D […]...
CoCaとBLIP2を使ってみた:ImageNet、キャプション生成
7.5k{icon} {views} CoCaとBLIP2の訓練済みモデルで遊んでみました。「ImageNet 1Kのゼロショット精度」と「キャプション生成」の2点について検証してみました。 きっかけ ほぼ同時期にBLI […]...
論文まとめ:BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models
9.9k{icon} {views} タイトル:BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large […]...
論文まとめ:Patching open-vocabulary models by interpolating weights
827{icon} {views} タイトル:Patching open-vocabulary models by interpolating weights 著者:Gabriel Ilharco, Mitchell W […]...