論文まとめ:RTMPose: Real-Time Multi-Person Pose Estimation based on MMPose
2k{icon} {views} タイトル:RTMPose: Real-Time Multi-Person Pose Estimation based on MMPose 著者:Tao Jiang, Peng Lu, L […]...
asyncioを使ったLangChain+Streamlitでの非同期処理:複数のストリーミングチャットを同時に動かす
4.4k{icon} {views} asyncioを使い、StreamlitのUIを非同期化することを目指します。非同期化することで、複数のストリーミングチャットを同時に動かすことが可能になります。LangChainと […]...
Streamlit+LangChainでストリーミング対応しつつPDFに複数の質問をさせる
2.2k{icon} {views} Streamlit+LangChainでChatGPTのストリーミング表示を実装してみます。PDFの検索ベースで、かつテンプレートの質問を連続的に行うという実践的な例を紹介します。L […]...
論文まとめ:Generating Images with Multimodal Language Models
193{icon} {views} タイトル:Generating Images with Multimodal Language Models 著者:Jing Yu Koh, Daniel Fried, Ruslan […]...
MiniGPT4をAutoGPTQ/BitsAndBytesで量子化してAWS上でのスループットを検証する
704{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVision & Language(マルチモーダル)なLLMに焦点をあて、Aut […]...
論文まとめ:Visual Programming: Compositional visual reasoning without training
331{icon} {views} タイトル:Visual Programming: Compositional visual reasoning without training 著者:Tanmay Gupta, An […]...
論文まとめ:Investigating Emergent Goal-Like Behaviour in Large Language Models Using Experimental Economics
238{icon} {views} タイトル:Investigating Emergent Goal-Like Behaviour in Large Language Models Using Experimental […]...
LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(AWS編)
805{icon} {views} AWSのEC2環境でのLLaMA.cppのスループットをCPU,GPUインスタンスで比較してみました。結論としてはGPUのほうが良さそうということですが、インスタンスあたりのコストを考 […]...
LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(ローカル編)
1.8k{icon} {views} LLaMA.cppのスループットをローカルで検証してみました。OpenLLaMA 7B/13Bをベースに、CPU/GPUのそれぞれの生成速度(token per second)と量子 […]...
論文まとめ:Evaluating and Inducing Personality in Pre-trained Language Models
402{icon} {views} タイトル:Evaluating and Inducing Personality in Pre-trained Language Models 著者:Guangyuan Jiang, […]...