エージェント設計パターンによるRAG品質の改善
18{icon} {views} ICCV2025採択論文2,113本を対象としたサーベイ生成実験により、エージェント設計パターンの違いが出力品質に決定的な差を生むことが明らかになりました。特に「オーケストレーターの排除 […]...
WindowsでClaude CodeにAWS公式のMCPを追加する方法
17{icon} {views} Windows環境で、Claude CodeでユーザースコープでAWS公式のMCPを追加する方法をメモ。忘れがち+LinuxやmacOSの方法ばかり見るので。コマンドプロンプトから追加す […]...
AIエージェントのManusでBTO PCや投信を買ってみた
36{icon} {views} BTO PCの構成検討から投信選びまで、自律型エージェント「Manus」を使ってみたら面倒な調査タスクが劇的に効率化された。 一方で「エアフローの懸念」は正解でも「年利40%」のような嘘 […]...
コーディングエージェントの視座を上げさせるには
60{icon} {views} 今のコーディングエージェントは「優秀だが指示待ちの新卒」であり、つきっきりで指導するコストに人間側が疲弊している現状があります。そんなAIに「つぎはぎコード」を卒業させ、テックリードの視 […]...
日本語技術文書の翻訳に適切なコーディングエージェントはどれか
66{icon} {views} Claude Code、Codex、Antigravityの3大コーディングエージェントを用いて日本語技術文書(Rubyリファレンス)を英訳し、その品質をLLMとGrammarlyで徹底 […]...
LLMの推論システムの定式化(2):価格理論の推論速度の統合
217{icon} {views} LLM推論にかかるGPUインスタンス料金やトークン生成速度、サービス提供単価などを数式で統合し、黒字化の条件を理論的に示した。実験結果では、GPU以外のボトルネックの影響は小さく、高い […]...
GPT4.5でSVG生成を試す
569{icon} {views} OpenAIがGPT-4.5をリリースし、画像入出力やSVG生成などのマルチモーダル機能が大幅に強化された。その一方でモデルの大規模化に伴い高額な利用料金がネックになっている。 解禁さ […]...
LLMの推論システムの定式化(1):GPU以外のボトルネック
409{icon} {views} LLM推論時にGPU以外が占める遅延要因(SQSのバッチ処理やログ書き込み等)を実験的に検証し、オーバーヘッドは入力トークン数に対してほぼ線形に近似できることを示した。トークナイザーの […]...
GPT-4oのファインチューニングで画像に対する「ボケて」を学習
399{icon} {views} 画像とテキストの組み合わせで「ボケて」を学習させるため、GPT-4oをファインチューニングしてみた。じわじわくる系の面白さは学習できたものの、OpenAIのコンプライアンスが厳しく、多 […]...
Arxiv RAGから見る最近のLLM(2024/8)
1.4k{icon} {views} Arxivの検索APIを使い自動的にサーベイを行うArxiv RAGを最近のLLMで調べてみました。Gemini 1.5が非常に健闘し、またClaude 3.5 Sonnetも面白い […]...