論文まとめ:OmniGen: Unified Image Generation
59{icon} {views} タイトル:OmniGen: Unified Image Generation 著者:Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan, […]...
論文まとめ:SAM 2: Segment Anything in Images and Videos
136{icon} {views} タイトル:SAM 2: Segment Anything in Images and Videos 著者:Nikhila Ravi, Valentin Gabeur, Yuan-Tin […]...
yum for Lambda(yumda)でAWS LambdaのレイヤーにPopplerを入れる
57{icon} {views} yum for Lambda(yumda)を使って、yum installで入れられるライブラリをLambdaのレイヤーとして導入してみました。これを使うと、LambdaのDockerイ […]...
論文まとめ:RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation
183{icon} {views} タイトル:RAGChecker: A Fine-grained Framework for Diagnosing Retrieval-Augmented Generation 著者:D […]...
論文まとめ:Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks
133{icon} {views} タイトル:Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks 著者:Bin Xia […]...
Arxiv RAGから見る最近のLLM(2024/8)
796{icon} {views} Arxivの検索APIを使い自動的にサーベイを行うArxiv RAGを最近のLLMで調べてみました。Gemini 1.5が非常に健闘し、またClaude 3.5 Sonnetも面白い健 […]...
論文要約性能で見る最近のLLM(2024/7)
531{icon} {views} 目的 最近いろいろなLLMが出ているが、論文要約というタスクで見たときにそれぞれがどの程度の性能/コストなのかを見ていく。コスト的と性能両方見て、どれが使いやすいのかを考えたい。 概要 […]...
論文まとめ:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control
95{icon} {views} タイトル:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control 著者:Jia […]...
論文まとめ:Beyond Aesthetics: Cultural Competence in Text-to-Image Models
100{icon} {views} タイトル:Beyond Aesthetics: Cultural Competence in Text-to-Image Models 著者:Nithish Kannen, Arif […]...
論文まとめ:Unveiling Encoder-Free Vision-Language Models
164{icon} {views} タイトル:Unveiling Encoder-Free Vision-Language Models 著者:Haiwen Diao, Yufeng Cui, Xiaotong Li, […]...