GPT-4oのファインチューニングで画像に対する「ボケて」を学習
173{icon} {views} 画像とテキストの組み合わせで「ボケて」を学習させるため、GPT-4oをファインチューニングしてみた。じわじわくる系の面白さは学習できたものの、OpenAIのコンプライアンスが厳しく、多 […]...
論文まとめ:HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA
248{icon} {views} タイトル:HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA 著者:Xinyue Che […]...
論文まとめ:Design2Code: How Far Are We From Automating Front-End Engineering?
190{icon} {views} タイトル:Design2Code: How Far Are We From Automating Front-End Engineering? 著者:Chenglei Si, Yanz […]...
論文まとめ:ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimodal Models
187{icon} {views} 論文タイトル:ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimod […]...
論文まとめ:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection
794{icon} {views} 論文URL:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection 著者:B […]...
MiniGPT4をAutoGPTQ/BitsAndBytesで量子化してAWS上でのスループットを検証する
731{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVision & Language(マルチモーダル)なLLMに焦点をあて、Aut […]...
Mini-GPT4をDockerで動かしてバッチ処理する
749{icon} {views} Mini-GPT4というマルチモーダルLLMをDockerを使ってバッチ処理をしてみました。係数を部分的にDockerイメージに組み込んだり、使用するLLMを切り替えられるようにちょっ […]...