多変量分布のKLダイバージェンスの実装
2.4k{icon} {views} 分布間の差を定量化する手法として、KLダイバージェンスが機械学習では広く使われますが、多変量への拡張の実装面の話が必要になったので検証してみました。KDTreeを使った推定がノンパラ […]...
論文まとめ:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners
973{icon} {views} タイトル:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation […]...
論文まとめ:EVA-02: A Visual Representation for Neon Genesis
2.8k{icon} {views} タイトル:EVA-02: A Visual Representation for Neon Genesis 著者:Yuxin Fang, Quan Sun, Xinggang Wan […]...
論文まとめ:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale
2k{icon} {views} タイトル:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale 著者:Yuxin Fan […]...
論文まとめ:ControlVideo: Training-free Controllable Text-to-Video Generation
718{icon} {views} タイトル:ControlVideo: Training-free Controllable Text-to-Video Generation 著者:Yabo Zhang, Yuxian […]...
論文まとめ:Guided Image Synthesis via Initial Image Editing in Diffusion Model
961{icon} {views} タイトル:Guided Image Synthesis via Initial Image Editing in Diffusion Model 著者:Jiafeng Mao, Xue […]...
DiffusersでAttention Coupleを実装して領域別プロンプトを適用
4.2k{icon} {views} Stable DiffusionでAttention Couple(Attentionレイヤーをハックして領域別にプロンプトを適用する手法)をスマートな方法で実装できないかなと思って […]...
論文まとめ:Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection
6.6k{icon} {views} タイトル:Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection […]...
論文まとめ:Sentence Simplification via Large Language Models
630{icon} {views} 論文:Sentence Simplification via Large Language Models 著者:Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...
論文まとめ:Flamingo: a Visual Language Model for Few-Shot Learning
2.2k{icon} {views} タイトル:Flamingo: a Visual Language Model for Few-Shot Learning 著者:Jean-Baptiste Alayrac, Jeff […]...