論文まとめ:UniVTG: Towards Unified Video-Language Temporal Grounding
242{icon} {views} タイトル:UniVTG: Towards Unified Video-Language Temporal Grounding 著者:Kevin Qinghong Lin, Pengch […]...
論文まとめ:GRiT: A Generative Region-to-text Transformer for Object Understanding
727{icon} {views} タイトル:GRiT: A Generative Region-to-text Transformer for Object Understanding 著者:Jialian Wu, J […]...
論文まとめ:Shap-E: Generating Conditional 3D Implicit Functions
619{icon} {views} タイトル:Shap-E: Generating Conditional 3D Implicit Functions 著者:Heewoo Jun, Alex Nichol(OpenAI) […]...
論文まとめ:GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis
559{icon} {views} タイトル:GALIP: Generative Adversarial CLIPs for Text-to-Image Synthesis 著者:Ming Tao, Bing-Kun B […]...
EVA-CLIPをOpenCLIPで使う
1.2k{icon} {views} EVA-CLIPがOpenCLIPから使えるようになっていたので試してみました。ViT-L/14相当のモデルでImageNetのゼロショット精度が80%越えでなかなかやばい結果となり […]...
多変量分布のKLダイバージェンスの実装
1.4k{icon} {views} 分布間の差を定量化する手法として、KLダイバージェンスが機械学習では広く使われますが、多変量への拡張の実装面の話が必要になったので検証してみました。KDTreeを使った推定がノンパラ […]...
論文まとめ:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners
712{icon} {views} タイトル:StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation […]...
論文まとめ:EVA-02: A Visual Representation for Neon Genesis
1.1k{icon} {views} タイトル:EVA-02: A Visual Representation for Neon Genesis 著者:Yuxin Fang, Quan Sun, Xinggang Wan […]...
論文まとめ:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale
1.3k{icon} {views} タイトル:EVA: Exploring the Limits of Masked Visual Representation Learning at Scale 著者:Yuxin F […]...
論文まとめ:ControlVideo: Training-free Controllable Text-to-Video Generation
531{icon} {views} タイトル:ControlVideo: Training-free Controllable Text-to-Video Generation 著者:Yabo Zhang, Yuxian […]...