論文読み | Shikoan's ML Blog

Wan: Open and Advanced Large-Scale Video Generative Models

2025-04-18

313{icon} {views} 論文タイトル：Wan: Open and Advanced Large-Scale Video Generative Models URL：https://arxiv.org/abs/ […]...

2025-03-27

293{icon} {views} ULIP-2は、3D形状からレンダリングした画像と自動生成された多様な言語記述を組み合わせることで、従来を上回る精度とスケーラビリティを実現した。ゼロショット3D分類や3Dキャプショ […]...

2025-03-14

186{icon} {views} タイトル：Diffusion Self-Distillation for Zero-Shot Customized Image Generation 著者：スタンフォード大の方々カン […]...

2025-02-28

289{icon} {views} Vision TransformerとGrid Transformerを組み合わせ、視覚・テキストの両面からマルチモーダル情報を効果的に活用する手法VGTを提案。多様な文書タイプと詳細 […]...

2025-02-21

93{icon} {views} タイトル：Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity 論文U […]...

2025-02-14

404{icon} {views} 大規模言語モデル(LLM)を強化学習によって訓練し、競争プログラミングにおける高度な推論とコーディング能力を高めたOpenAIによるLRMの研究。特にo3モデルは、人間によるドメイン特 […]...

2025-02-07

168{icon} {views} タイトル：BEN: Using Confidence-Guided Matting for Dichotomous Image Segmentation GitHub：https:// […]...

2025-01-31

168{icon} {views} タイトル：Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling […]...

2025-01-19

590{icon} {views} CVPR2022・2023の論文を対象に、GitHubリポジトリやarXivの公開有無と被引用数の関係を調べた結果、リポジトリを公開している論文ほど被引用数が高い傾向が確認された。さら […]...

2024-12-18

468{icon} {views} CVPR2022・2023で採択された論文の被引用数を分析し、GitHubリポジトリやArxivでの公開が引用数に与える影響を調査しました。結果、これらの要因が引用数の増加に有意に寄与 […]...