CVPRの論文の被引用数の深読み(GitHub, arXiv, Sematic Scholar APIの活用)
36{icon} {views} CVPR2022・2023の論文を対象に、GitHubリポジトリやarXivの公開有無と被引用数の関係を調べた結果、リポジトリを公開している論文ほど被引用数が高い傾向が確認された。さらに […]...
論文まとめ:Cosmos World Foundation Model Platform for Physical AI
103{icon} {views} タイトル:Cosmos World Foundation Model Platform for Physical AI 著者:NVIDIAの方々 論文URL:https://arxiv […]...
論文まとめ:Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
100{icon} {views} タイトル:Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction 著者: […]...
CVPRの論文の被引用数を分析・予測してみた
102{icon} {views} CVPR2022・2023で採択された論文の被引用数を分析し、GitHubリポジトリやArxivでの公開が引用数に与える影響を調査しました。結果、これらの要因が引用数の増加に有意に寄与 […]...
論文まとめ:Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling
56{icon} {views} タイトル:Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and […]...
YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
188{icon} {views} タイトル:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information 著者:Chie […]...
論文まとめ:SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling
81{icon} {views} タイトル:SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling 著者 […]...
論文まとめ:LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation
96{icon} {views} 論文タイトル:LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation 著者:Weiquan Huang […]...
HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems
223{icon} {views} タイトル:HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems […]...
論文まとめ:OmniGen: Unified Image Generation
150{icon} {views} タイトル:OmniGen: Unified Image Generation 著者:Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan […]...