DeepLearning | Shikoan's ML Blog

論文まとめ：Beyond Aesthetics: Cultural Competence in Text-to-Image Models

2024-07-18

245{icon} {views} タイトル：Beyond Aesthetics: Cultural Competence in Text-to-Image Models 著者：Nithish Kannen, Arif […]...

2024-07-11

719{icon} {views} タイトル：Unveiling Encoder-Free Vision-Language Models 著者：Haiwen Diao, Yufeng Cui, Xiaotong Li, […]...

2024-06-13

290{icon} {views} タイトル：MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures URL：https://mixeval.g […]...

2024-05-22

557{icon} {views} * タイトル：Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text […]...

2024-05-09

429{icon} {views} タイトル：Style Aligned Image Generation via Shared Attention 論文URL：https://arxiv.org/abs/2312.02 […]...

2024-04-11

498{icon} {views} タイトル：HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA 著者：Xinyue Che […]...

2024-04-04

293{icon} {views} タイトル：Design2Code: How Far Are We From Automating Front-End Engineering? 著者：Chenglei Si, Yanz […]...

2024-03-07

510{icon} {views} タイトル：Genie: Generative Interactive Environments 論文URL：https://arxiv.org/abs/2402.15391 著者：De […]...

2024-03-02

2.8k{icon} {views} CLIPに対してLoRAを適用して、いろいろ条件を変えて画像分類モデルを訓練した。Few-shotやパラメーター数に対しては従来のファインチューニングと同じだが、rとαとバランスを考 […]...

2024-02-25

1.3k{icon} {views} HuggingFaceの提供しているpeftを使うと、LoRAが簡単に訓練できますが、transformersのTrainerベースでの訓練であり、画像分類でどうやるのかがよくわかり […]...