基盤モデル | Shikoan's ML Blog

論文まとめ：EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

2023-06-01

2k{icon} {views} タイトル：EVA: Exploring the Limits of Masked Visual Representation Learning at Scale 著者：Yuxin Fan […]...

2023-04-06

2.3k{icon} {views} タイトル：Flamingo: a Visual Language Model for Few-Shot Learning 著者：Jean-Baptiste Alayrac, Jeff […]...

2023-02-08

8.1k{icon} {views} CoCaとBLIP2の訓練済みモデルで遊んでみました。「ImageNet 1Kのゼロショット精度」と「キャプション生成」の2点について検証してみました。きっかけほぼ同時期にBLI […]...

2023-02-02

10.7k{icon} {views} タイトル：BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Larg […]...

2022-08-25

914{icon} {views} タイトル：Patching open-vocabulary models by interpolating weights 著者：Gabriel Ilharco, Mitchell W […]...