論文まとめ:GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis
664{icon} {views} タイトル:GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis 著者:Ming Tao, Bing-Kun B […]...
論文まとめ:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners
896{icon} {views} タイトル:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation […]...
Kohya版のLoRAをDockerで訓練する
4k{icon} {views} LoRAのデファクトスタンダードとなりつつあるKohya版のLoRA学習スクリプトをDockerで動かしてみました。Diffusersとの連携も可能で、DiffusersオフィシャルのL […]...
論文まとめ:ControlVideo: Training-free Controllable Text-to-Video Generation
655{icon} {views} タイトル:ControlVideo: Training-free Controllable Text-to-Video Generation 著者:Yabo Zhang, Yuxian […]...
論文まとめ:Guided Image Synthesis via Initial Image Editing in Diffusion Model
872{icon} {views} タイトル:Guided Image Synthesis via Initial Image Editing in Diffusion Model 著者:Jiafeng Mao, Xue […]...
DiffusersでAttention Coupleを実装して領域別プロンプトを適用
3.6k{icon} {views} Stable DiffusionでAttention Couple(Attentionレイヤーをハックして領域別にプロンプトを適用する手法)をスマートな方法で実装できないかなと思って […]...
GPT-4と画像生成を組み合わせたらヤバすぎた
23.8k{icon} {views} GPT-4/ChatGPTと画像生成(Stable Diffusion)の組み合わせを試したら、とんでもないクォリティのイラストができたので記事にしました。GPT-4に情景描写をさ […]...
Diffusersでモデルマージをする
3k{icon} {views} Diffuserでのモデルマージを検証します。Stable Diffusionには、CLIP、U-Net、VAEの3つのモデルからなり、それぞれをマージの効果が違うので、面白い結果になり […]...