9月, 2023 | Shikoan's ML Blog

asyncioを使ったLangChain＋Streamlitでの非同期処理：複数のストリーミングチャットを同時に動かす

2023-09-30

7k{icon} {views} asyncioを使い、StreamlitのUIを非同期化することを目指します。非同期化することで、複数のストリーミングチャットを同時に動かすことが可能になります。LangChainとの統 […]...

2023-09-29

2.7k{icon} {views} Streamlit＋LangChainでChatGPTのストリーミング表示を実装してみます。PDFの検索ベースで、かつテンプレートの質問を連続的に行うという実践的な例を紹介します。L […]...

2023-09-28

283{icon} {views} タイトル：Generating Images with Multimodal Language Models 著者：Jing Yu Koh, Daniel Fried, Ruslan […]...

2023-09-23

948{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVision & Language（マルチモーダル）なLLMに焦点をあて、Aut […]...

2023-09-21

395{icon} {views} タイトル：Visual Programming: Compositional visual reasoning without training 著者：Tanmay Gupta, An […]...

2023-09-14

350{icon} {views} タイトル：Investigating Emergent Goal-Like Behaviour in Large Language Models Using Experimental […]...

2023-09-03

1.1k{icon} {views} AWSのEC2環境でのLLaMA.cppのスループットをCPU,GPUインスタンスで比較してみました。結論としてはGPUのほうが良さそうということですが、インスタンスあたりのコストを […]...

2023-09-03

2.3k{icon} {views} LLaMA.cppのスループットをローカルで検証してみました。OpenLLaMA 7B/13Bをベースに、CPU/GPUのそれぞれの生成速度（token per second）と量子 […]...