PDFMinerを並列化して読み込みを高速化する
660{icon} {views} PDFMinerというMITライセンスで利用できる、PythonベースのPDFパーサーを並列化する方法を紹介します。このライブラリ、パースが遅いというデメリットがあるのですが、並列化が […]...
論文まとめ:Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets
659{icon} {views} タイトル:Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets 著者:Stab […]...
日本語翻訳で比較するLLMと翻訳API
1.9k{icon} {views} 英語を日本語に翻訳するというタスクから、Amazon TranslateやDeepLのような翻訳APIと、GPTやClaudeのようなLLMを比較します。BLEUによる翻訳性能と、コ […]...
論文まとめ:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection
862{icon} {views} 論文URL:Video-LLaVA: Learning United Visual Representation by Alignment Before Projection 著者:B […]...
MoviePyで一定間隔でフレームを抽出する
1.2k{icon} {views} MoviePyを使い、動画から一定間隔でフレームを抽出する方法を見ていきます。iter_framesを使うとできます。動画編集と組み合わせたいときにこの方法は便利です。 はじめに 動 […]...
論文まとめ:LCM-LoRA: A Universal Stable-Diffusion Acceleration Module
1.7k{icon} {views} タイトル:LCM-LoRA: A Universal Stable-Diffusion Acceleration Module 論文URL:https://arxiv.org/abs […]...
OpenAI DevDayの発表まとめ(2023年11月)
388{icon} {views}2023/11/6(日本時間2022/11/7の3時から)に発表されたOpenAI DevDayの内容をまとめました 1次ソース OpenAI DevDay動画 https://www. […]...
論文まとめ:Improving Image Generation with Better Captions
1.7k{icon} {views} タイトル:Improving Image Generation with Better Captions 著者:James Betker、Gabriel Gohなど(OpenAIの人 […]...
MiniGPT-4をAutoGPTQ/BitsAndBytesで量子化時の生成文章の定量評価
456{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVLMに焦点をあて、AutoGPTQとBitsAndBytesという2つの量子化フレーム […]...
論文まとめ:SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis
1k{icon} {views} * タイトル:SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis * 著者:Dusti […]...