論文まとめ:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control
31{icon} {views} タイトル:LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control 著者:Jia […]...
論文まとめ:Beyond Aesthetics: Cultural Competence in Text-to-Image Models
49{icon} {views} タイトル:Beyond Aesthetics: Cultural Competence in Text-to-Image Models 著者:Nithish Kannen, Arif A […]...
論文まとめ:Unveiling Encoder-Free Vision-Language Models
65{icon} {views} タイトル:Unveiling Encoder-Free Vision-Language Models 著者:Haiwen Diao, Yufeng Cui, Xiaotong Li, Y […]...
論文まとめ:MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures
120{icon} {views} タイトル:MixEval: Deriving Wisdom of the Crowd from LLM Benchmark Mixtures URL:https://mixeval.g […]...
論文まとめ:Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text-to-Image Synthesis
205{icon} {views} * タイトル:Human Preference Score v2: A Solid Benchmark for Evaluating Human Preferences of Text […]...
論文まとめ:Style Aligned Image Generation via Shared Attention
148{icon} {views} タイトル:Style Aligned Image Generation via Shared Attention 論文URL:https://arxiv.org/abs/2312.02 […]...
論文まとめ:HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA
134{icon} {views} タイトル:HiQA: A Hierarchical Contextual Augmentation RAG for Massive Documents QA 著者:Xinyue Che […]...
論文まとめ:Design2Code: How Far Are We From Automating Front-End Engineering?
122{icon} {views} タイトル:Design2Code: How Far Are We From Automating Front-End Engineering? 著者:Chenglei Si, Yanz […]...
論文まとめ:Genie: Generative Interactive Environments
216{icon} {views} タイトル:Genie: Generative Interactive Environments 論文URL:https://arxiv.org/abs/2402.15391 著者:De […]...
CLIPに対していろいろ条件を変えてLoRAを訓練してみた(PyTorch Lightning)
569{icon} {views} CLIPに対してLoRAを適用して、いろいろ条件を変えて画像分類モデルを訓練した。Few-shotやパラメーター数に対しては従来のファインチューニングと同じだが、rとαとバランスを考慮 […]...