論文読み | Shikoan's ML Blog

LLMで「良い論文」を定義し、サーベイしてみる

2026-02-05

191{icon} {views} 引用数依存からの脱却——LLMによる「独創性」評価で、トップカンファレンスから真に読むべき論文を発掘する。全2119件の論文をTier分類し、「革新性重視」と「トレンド重視」の戦略に […]...

2026-01-25

124{icon} {views} ICCV2025採択論文2,113本を対象としたサーベイ生成実験により、エージェント設計パターンの違いが出力品質に決定的な差を生むことが明らかになりました。特に「オーケストレーターの排 […]...

2025-12-04

272{icon} {views} NVIDIAの「Nemotron Nano V2 VL」は、12Bの軽量かつ高効率な視覚言語モデルです。MambaとTransformerのハイブリッド構成と、動画の静的領域を間引くE […]...

2025-09-12

1k{icon} {views} タイトル：DINO v3 著者：Metaの方々 URL：https://arxiv.org/abs/2508.10104 GitHub: https://github.com/faceb […]...

2025-08-29

237{icon} {views} タイトル：Has GPT-5 Achieved Spatial Intelligence? An Empirical Study 著者：Zhongang Cai, Yubo Wang, […]...

2025-07-04

211{icon} {views} タイトル：Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens URL：https://a […]...

2025-06-27

334{icon} {views} 論文名：Efficient Track anything URL：https://arxiv.org/abs/2411.18933 GitHub：https://github.com/ […]...

2025-06-06

235{icon} {views} タイトル：StarVector: Generating Scalable Vector Graphics Code from Images and Text カンファ：CVPR 202 […]...

2025-05-23

168{icon} {views} モデルサイズを拡大する従来のアプローチに対し、入力画像の解像度を複数スケールで処理する「S2」手法を提案します。既存の小さなビジョンモデルでもパラメータ数を増やすことなく、多くのタスク […]...

2025-05-09

215{icon} {views} ニューラルネットワークにおける要素ごとの積が多項式カーネルと同様に入力を高次元の非線形空間へ写像する理論的根拠を示し、スター演算を活用した効率的な「StarNet」を提案している。Im […]...