LLMの推論システムの定式化(1):GPU以外のボトルネック
418{icon} {views} LLM推論時にGPU以外が占める遅延要因(SQSのバッチ処理やログ書き込み等)を実験的に検証し、オーバーヘッドは入力トークン数に対してほぼ線形に近似できることを示した。トークナイザーの […]...
GPT-4oのファインチューニングで画像に対する「ボケて」を学習
405{icon} {views} 画像とテキストの組み合わせで「ボケて」を学習させるため、GPT-4oをファインチューニングしてみた。じわじわくる系の面白さは学習できたものの、OpenAIのコンプライアンスが厳しく、多 […]...
Arxiv RAGから見る最近のLLM(2024/8)
1.4k{icon} {views} Arxivの検索APIを使い自動的にサーベイを行うArxiv RAGを最近のLLMで調べてみました。Gemini 1.5が非常に健闘し、またClaude 3.5 Sonnetも面白い […]...
論文要約性能で見る最近のLLM(2024/7)
1.3k{icon} {views} 目的 最近いろいろなLLMが出ているが、論文要約というタスクで見たときにそれぞれがどの程度の性能/コストなのかを見ていく。コスト的と性能両方見て、どれが使いやすいのかを考えたい。 概 […]...
Arxiv RAGによる論文サーベイの自動生成
5.8k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソー […]...
LangChainのRecursiveCharacterTextSplitterの動作がおかしいので自作する
2.1k{icon} {views}LangChainのRecursiveCharacterTextSplitter.from_tiktoken_encoderの動作が思ってたのと違ったので、それに相当するものを自作して […]...
GeminiのアプリケーションとGeminiのAPIは全然出力が違うので気をつけましょうという話
2.7k{icon} {views} Gemini AdvancedやGeminiのようなアプリケーションとしてのGeminiと、Google Cloud上のモデル/LLMとしてのGeminiは全く異なる出力をします。最 […]...
Vertex AIからGeminiのAPIを呼び出す
651{icon} {views} Google Cloudのサービスアカウントがある場合に、Vertex AIからGeminiのAPIをサクッと動かす方法のメモ。とりあえず試したいときに。 前提 サービスアカウントのJ […]...
LLMに検索エンジンの検索ワードを生成させる(AI王データセット)
1.1k{icon} {views} 検索エンジンの結果を利用してRAGをするために、LLMを使って検索ワードを自動生成させたい。AI王データセットの中から、GPTの知識だけでは解けない問題を選択し、定量評価することで、 […]...
OpenAIの新しいEmbeddingAPIをlivedoorニュースコーパスで試す
1.4k{icon} {views} OpenAIの新しいEmbedding APIを試してみました。Embedding APIをテキスト分類のバックボーンとして使用し、ロジスティック回帰を行います。Livedoorニュ […]...