4月, 2023 | Shikoan's ML Blog

DiffusersでAttention Coupleを実装して領域別プロンプトを適用

2023-04-30

4.4k{icon} {views} Stable DiffusionでAttention Couple（Attentionレイヤーをハックして領域別にプロンプトを適用する手法）をスマートな方法で実装できないかなと思って […]...

2023-04-20

6.7k{icon} {views} タイトル：Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection […]...

2023-04-17

4.4k{icon} {views} 現在使われている拡散モデルの最も基本的なモデルであるDDPM（Denoising Diffusion Probabilistic Models）を使って画像生成を試します。スクラッチ […]...

2023-04-13

667{icon} {views} 論文：Sentence Simplification via Large Language Models 著者：Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...

2023-04-10

24.7k{icon} {views} GPT-4/ChatGPTと画像生成（Stable Diffusion）の組み合わせを試したら、とんでもないクォリティのイラストができたので記事にしました。GPT-4に情景描写をさ […]...

2023-04-08

3.3k{icon} {views} Diffuserでのモデルマージを検証します。Stable Diffusionには、CLIP、U-Net、VAEの3つのモデルからなり、それぞれをマージの効果が違うので、面白い結果に […]...

2023-04-06

2.3k{icon} {views} タイトル：Flamingo: a Visual Language Model for Few-Shot Learning 著者：Jean-Baptiste Alayrac, Jeff […]...

2023-04-03

5.8k{icon} {views} LangChainでChatGPTを使っていると、特に長時間や長い文章・指示を入れて会話するときにトークン数が問題になります。プロンプトに入れる会話履歴を選別するプロセスが必要になる […]...

2023-04-01

5.8k{icon} {views} LangChainのAgentをカスタムできると自由度が上がりますが、LangChainのAgentがいまいちブラックボックスだった感があったので、デフォルトのプロンプトを解剖してみ […]...