論文読み | Shikoan's ML Blog

論文まとめ：Beyond Aesthetics: Cultural Competence in Text-to-Image Models

2024-07-18

305{icon} {views} タイトル：Beyond Aesthetics: Cultural Competence in Text-to-Image Models 著者：Nithish Kannen, Arif […]...

2024-07-11

784{icon} {views} タイトル：Unveiling Encoder-Free Vision-Language Models 著者：Haiwen Diao, Yufeng Cui, Xiaotong Li, […]...

2024-06-13

313{icon} {views} タイトル：MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures URL：https://mixeval.g […]...

2024-05-22

625{icon} {views} * タイトル：Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text […]...

2024-02-22

302{icon} {views} 論文タイトル：ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimod […]...

2024-02-15

462{icon} {views} * タイトル：COLE: A Hierarchical Generation Framework for Graphic Design * 著者：Peidong Jia, Chenxu […]...

2024-02-08

738{icon} {views} 論文タイトル：Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 著者：Sond […]...

2024-01-18

599{icon} {views} タイトル：Gemini: A Family of Highly Capable Multimodal Models 著者：Gemini Team（(842 additional aut […]...

2023-12-21

586{icon} {views} タイトル：Weak to Strong Generalization: Eliciting Strong Capabilities with Weak SUPERVISION 著者：O […]...

2023-12-15

1.1k{icon} {views} タイトル：Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets 著者：Sta […]...