タグ: 論文読み

論文まとめ:NVIDIA Nemotron Nano V2 VL

3{icon} {views} NVIDIAの「Nemotron Nano V2 VL」は、12Bの軽量かつ高効率な視覚言語モデルです。MambaとTransformerのハイブリッド構成と、動画の静的領域を間引くEVS […]...

論文まとめ:DINOv3

474{icon} {views} タイトル:DINO v3 著者:Metaの方々 URL:https://arxiv.org/abs/2508.10104 GitHub: https://github.com/face […]...

論文まとめ:When Do We Not Need Larger Vision Models?

127{icon} {views} モデルサイズを拡大する従来のアプローチに対し、入力画像の解像度を複数スケールで処理する「S2」手法を提案します。既存の小さなビジョンモデルでもパラメータ数を増やすことなく、多くのタスク […]...

論文まとめ:Rewrite the Stars

148{icon} {views} ニューラルネットワークにおける要素ごとの積が多項式カーネルと同様に入力を高次元の非線形空間へ写像する理論的根拠を示し、スター演算を活用した効率的な「StarNet」を提案している。Im […]...