LangChainでConversationMemoryBufferのトークン数対策をする
5.3k{icon} {views} LangChainでChatGPTを使っていると、特に長時間や長い文章・指示を入れて会話するときにトークン数が問題になります。プロンプトに入れる会話履歴を選別するプロセスが必要になる […]...
LangChainのChatAgentのデフォルトのプロンプトをのぞく
5.4k{icon} {views} LangChainのAgentをカスタムできると自由度が上がりますが、LangChainのAgentがいまいちブラックボックスだった感があったので、デフォルトのプロンプトを解剖してみ […]...
配置をコントロール可能な生成モデルGLIGENを試す
1.4k{icon} {views} Bounding Boxベースの生成や、背景写真を指定したInpaintingができるGLIGENを試してみます。実はControlNetと同様に、様々な条件ベースの生成が可能なモデ […]...
MultiDiffusionを試す(パノラマ生成、空間コントロール)
2k{icon} {views} パノラマ生成、空間コントロールできるMultiDiffusionを試してみました。空間コントロールでは、マスク設定し、領域ごとにプロンプトを指定することでレイアウトをある程度定義すること […]...
論文まとめ:Zero-1-to-3: Zero-shot One Image to 3D Object
2.4k{icon} {views} タイトル:Zero-1-to-3: Zero-shot One Image to 3D Object 著者:Ruoshi Liu, Rundi Wu, Basile Van Hoor […]...
Diffusers版のControlNet+LoRAで遊ぶ:理論と実践
10.5k{icon} {views} 前回に引き続き、Stable DiffusionのControlNetで遊んでみます。ControlNetとは画像主に空間方向の強い条件付が可能です。LoRAと組み合わせて動画レン […]...
Stable Diffusion (Diffusers)でLoRA~理論と実践~
26.3k{icon} {views} Stable DiffusionでのLoRAをdiffusersで試してみます。3Dモデルに対して、Unityで透過スクショを撮りLoRAで学習させるというよくあるやり方ですが、L […]...
CLIPから見るAttentionの有用性
5.5k{icon} {views} Attentionはこれまでの研究から多く有用性は報告されていたのですが、ネットワークの内側で使われることが多く、わかりやすく差を体感できる例を自分は知りませんでした。今回はCLIP […]...
論文まとめ:MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation
1.4k{icon} {views} タイトル:MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation 著者:Omer Bar-Tal […]...
論文まとめ:Zero-shot Image-to-Image Translation
4.1k{icon} {views} タイトル:Zero-shot Image-to-Image Translation 著者:Gaurav Parmar, Krishna Kumar Singh, Richard Zh […]...