2023 | Shikoan's ML Blog

論文まとめ：EVA: Exploring the Limits of Masked Visual Representation Learning at Scale

2023-06-01

2k{icon} {views} タイトル：EVA: Exploring the Limits of Masked Visual Representation Learning at Scale 著者：Yuxin Fan […]...

2023-05-25

736{icon} {views} タイトル：ControlVideo: Training-free Controllable Text-to-Video Generation 著者：Yabo Zhang, Yuxian […]...

2023-05-11

1k{icon} {views} タイトル：Guided Image Synthesis via Initial Image Editing in Diffusion Model 著者：Jiafeng Mao, Xuet […]...

2023-04-30

4.4k{icon} {views} Stable DiffusionでAttention Couple（Attentionレイヤーをハックして領域別にプロンプトを適用する手法）をスマートな方法で実装できないかなと思って […]...

2023-04-20

6.7k{icon} {views} タイトル：Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection […]...

2023-04-17

4.4k{icon} {views} 現在使われている拡散モデルの最も基本的なモデルであるDDPM（Denoising Diffusion Probabilistic Models）を使って画像生成を試します。スクラッチ […]...

2023-04-13

667{icon} {views} 論文：Sentence Simplification via Large Language Models 著者：Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...

2023-04-10

24.7k{icon} {views} GPT-4/ChatGPTと画像生成（Stable Diffusion）の組み合わせを試したら、とんでもないクォリティのイラストができたので記事にしました。GPT-4に情景描写をさ […]...

2023-04-08

3.3k{icon} {views} Diffuserでのモデルマージを検証します。Stable Diffusionには、CLIP、U-Net、VAEの3つのモデルからなり、それぞれをマージの効果が違うので、面白い結果に […]...

2023-04-06

2.3k{icon} {views} タイトル：Flamingo: a Visual Language Model for Few-Shot Learning 著者：Jean-Baptiste Alayrac, Jeff […]...