論文まとめ:Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks
448{icon} {views} タイトル:Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks 著者:Bin Xia […]...
Arxiv RAGから見る最近のLLM(2024/8)
1.2k{icon} {views} Arxivの検索APIを使い自動的にサーベイを行うArxiv RAGを最近のLLMで調べてみました。Gemini 1.5が非常に健闘し、またClaude 3.5 Sonnetも面白い […]...
論文要約性能で見る最近のLLM(2024/7)
1.1k{icon} {views} 目的 最近いろいろなLLMが出ているが、論文要約というタスクで見たときにそれぞれがどの程度の性能/コストなのかを見ていく。コスト的と性能両方見て、どれが使いやすいのかを考えたい。 概 […]...
論文まとめ:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control
184{icon} {views} タイトル:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control 著者:Ji […]...
論文まとめ:Beyond Aesthetics: Cultural Competence in Text-to-Image Models
161{icon} {views} タイトル:Beyond Aesthetics: Cultural Competence in Text-to-Image Models 著者:Nithish Kannen, Arif […]...
論文まとめ:Unveiling Encoder-Free Vision-Language Models
536{icon} {views} タイトル:Unveiling Encoder-Free Vision-Language Models 著者:Haiwen Diao, Yufeng Cui, Xiaotong Li, […]...
論文まとめ:MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures
248{icon} {views} タイトル:MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures URL:https://mixeval.g […]...
論文まとめ:Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text-to-Image Synthesis
429{icon} {views} * タイトル:Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text […]...
論文まとめ:Style Aligned Image Generation via Shared Attention
373{icon} {views} タイトル:Style Aligned Image Generation via Shared Attention 論文URL:https://arxiv.org/abs/2312.02 […]...
Python(requests)でDiscordにWebhook経由で複数の画像+メッセージ投稿
2k{icon} {views} DiscordにWebhook経由で、複数の画像+メッセージを投稿する例を紹介します。Python+requestsでやったらかなりハマったのでメモがてらに。 やりたいこと こんな感じに […]...