論文まとめ:ControlVideo: Training-free Controllable Text-to-Video Generation
45{icon} {views} タイトル:ControlVideo: Training-free Controllable Text-to-Video Generation 著者:Yabo Zhang, Yuxiang […]...
論文まとめ:Guided Image Synthesis via Initial Image Editing in Diffusion Model
195{icon} {views} タイトル:Guided Image Synthesis via Initial Image Editing in Diffusion Model 著者:Jiafeng Mao, Xue […]...
DiffusersでAttention Coupleを実装して領域別プロンプトを適用
898{icon} {views} Stable DiffusionでAttention Couple(Attentionレイヤーをハックして領域別にプロンプトを適用する手法)をスマートな方法で実装できないかなと思ってや […]...
論文まとめ:Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection
525{icon} {views} タイトル:Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection […]...
DDPMで画像生成してみた
690{icon} {views} 現在使われている拡散モデルの最も基本的なモデルであるDDPM(Denoising Diffusion Probabilistic Models)を使って画像生成を試します。スクラッチか […]...
論文まとめ:Sentence Simplification via Large Language Models
142{icon} {views} 論文:Sentence Simplification via Large Language Models 著者:Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...
Diffusersでモデルマージをする
1k{icon} {views} Diffuserでのモデルマージを検証します。Stable Diffusionには、CLIP、U-Net、VAEの3つのモデルからなり、それぞれをマージの効果が違うので、面白い結果になり […]...
論文まとめ:Flamingo: a Visual Language Model for Few-Shot Learning
396{icon} {views} タイトル:Flamingo: a Visual Language Model for Few-Shot Learning 著者:Jean-Baptiste Alayrac, Jeff […]...
配置をコントロール可能な生成モデルGLIGENを試す
264{icon} {views} Bounding Boxベースの生成や、背景写真を指定したInpaintingができるGLIGENを試してみます。実はControlNetと同様に、様々な条件ベースの生成が可能なモデル […]...
MultiDiffusionを試す(パノラマ生成、空間コントロール)
1.1k{icon} {views} パノラマ生成、空間コントロールできるMultiDiffusionを試してみました。空間コントロールでは、マスク設定し、領域ごとにプロンプトを指定することでレイアウトをある程度定義する […]...