Streamlit+LangChainでストリーミング対応しつつPDFに複数の質問をさせる
682{icon} {views} Streamlit+LangChainでChatGPTのストリーミング表示を実装してみます。PDFの検索ベースで、かつテンプレートの質問を連続的に行うという実践的な例を紹介します。La […]...
論文まとめ:Generating Images with Multimodal Language Models
111{icon} {views} タイトル:Generating Images with Multimodal Language Models 著者:Jing Yu Koh, Daniel Fried, Ruslan […]...
MiniGPT4をAutoGPTQ/BitsAndBytesで量子化してAWS上でのスループットを検証する
282{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVision & Language(マルチモーダル)なLLMに焦点をあて、Aut […]...
論文まとめ:Visual Programming: Compositional visual reasoning without training
159{icon} {views} タイトル:Visual Programming: Compositional visual reasoning without training 著者:Tanmay Gupta, An […]...
論文まとめ:Investigating Emergent Goal-Like Behaviour in Large Language Models Using Experimental Economics
100{icon} {views} タイトル:Investigating Emergent Goal-Like Behaviour in Large Language Models Using Experimental […]...
LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(AWS編)
347{icon} {views} AWSのEC2環境でのLLaMA.cppのスループットをCPU,GPUインスタンスで比較してみました。結論としてはGPUのほうが良さそうということですが、インスタンスあたりのコストを考 […]...
LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(ローカル編)
791{icon} {views} LLaMA.cppのスループットをローカルで検証してみました。OpenLLaMA 7B/13Bをベースに、CPU/GPUのそれぞれの生成速度(token per second)と量子化 […]...
論文まとめ:Evaluating and Inducing Personality in Pre-trained Language Models
236{icon} {views} タイトル:Evaluating and Inducing Personality in Pre-trained Language Models 著者:Guangyuan Jiang, […]...
Mini-GPT4をDockerで動かしてバッチ処理する
417{icon} {views} Mini-GPT4というマルチモーダルLLMをDockerを使ってバッチ処理をしてみました。係数を部分的にDockerイメージに組み込んだり、使用するLLMを切り替えられるようにちょっ […]...
論文まとめ:UniVTG: Towards Unified Video-Language Temporal Grounding
196{icon} {views} タイトル:UniVTG: Towards Unified Video-Language Temporal Grounding 著者:Kevin Qinghong Lin, Pengch […]...