LLM | Shikoan's ML Blog

論文まとめ：Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity

2025-02-21

98{icon} {views} タイトル：Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity 論文U […]...

2025-02-14

411{icon} {views} 大規模言語モデル(LLM)を強化学習によって訓練し、競争プログラミングにおける高度な推論とコーディング能力を高めたOpenAIによるLRMの研究。特にo3モデルは、人間によるドメイン特 […]...

2025-01-31

169{icon} {views} タイトル：Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling […]...

2025-01-05

425{icon} {views} 画像とテキストの組み合わせで「ボケて」を学習させるため、GPT-4oをファインチューニングしてみた。じわじわくる系の面白さは学習できたものの、OpenAIのコンプライアンスが厳しく、多 […]...

2024-12-13

415{icon} {views} タイトル：Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and […]...

2024-11-21

256{icon} {views} タイトル：SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling 著 […]...

2024-11-14

282{icon} {views} 論文タイトル：LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation 著者：Weiquan Huan […]...

2024-11-07

428{icon} {views} タイトル：HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems […]...

2024-10-24

344{icon} {views} タイトル：OmniGen: Unified Image Generation 著者：Shitao Xiao, Yueze Wang, Junjie Zhou, Huaying Yuan […]...

2024-08-23

633{icon} {views} タイトル：Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks 著者：Bin Xia […]...