GPT-4と画像生成を組み合わせたらヤバすぎた
24.1k{icon} {views} GPT-4/ChatGPTと画像生成(Stable Diffusion)の組み合わせを試したら、とんでもないクォリティのイラストができたので記事にしました。GPT-4に情景描写をさ […]...
Diffusersでモデルマージをする
3.1k{icon} {views} Diffuserでのモデルマージを検証します。Stable Diffusionには、CLIP、U-Net、VAEの3つのモデルからなり、それぞれをマージの効果が違うので、面白い結果に […]...
論文まとめ:Flamingo: a Visual Language Model for Few-Shot Learning
2k{icon} {views} タイトル:Flamingo: a Visual Language Model for Few-Shot Learning 著者:Jean-Baptiste Alayrac, Jeff D […]...
LangChainでConversationMemoryBufferのトークン数対策をする
5.5k{icon} {views} LangChainでChatGPTを使っていると、特に長時間や長い文章・指示を入れて会話するときにトークン数が問題になります。プロンプトに入れる会話履歴を選別するプロセスが必要になる […]...
LangChainのChatAgentのデフォルトのプロンプトをのぞく
5.6k{icon} {views} LangChainのAgentをカスタムできると自由度が上がりますが、LangChainのAgentがいまいちブラックボックスだった感があったので、デフォルトのプロンプトを解剖してみ […]...
配置をコントロール可能な生成モデルGLIGENを試す
1.6k{icon} {views} Bounding Boxベースの生成や、背景写真を指定したInpaintingができるGLIGENを試してみます。実はControlNetと同様に、様々な条件ベースの生成が可能なモデ […]...
MultiDiffusionを試す(パノラマ生成、空間コントロール)
2.2k{icon} {views} パノラマ生成、空間コントロールできるMultiDiffusionを試してみました。空間コントロールでは、マスク設定し、領域ごとにプロンプトを指定することでレイアウトをある程度定義する […]...
論文まとめ:Zero-1-to-3: Zero-shot One Image to 3D Object
2.7k{icon} {views} タイトル:Zero-1-to-3: Zero-shot One Image to 3D Object 著者:Ruoshi Liu, Rundi Wu, Basile Van Hoor […]...
Diffusers版のControlNet+LoRAで遊ぶ:理論と実践
11.4k{icon} {views} 前回に引き続き、Stable DiffusionのControlNetで遊んでみます。ControlNetとは画像主に空間方向の強い条件付が可能です。LoRAと組み合わせて動画レン […]...
Stable Diffusion (Diffusers)でLoRA~理論と実践~
27.3k{icon} {views} Stable DiffusionでのLoRAをdiffusersで試してみます。3Dモデルに対して、Unityで透過スクショを撮りLoRAで学習させるというよくあるやり方ですが、L […]...