DocumentAI | Shikoan's ML Blog

タグ: DocumentAI

論文まとめ：Vision Grid Transformer for Document Layout Analysis＋OSS紹介

2025-02-28

292{icon} {views} Vision TransformerとGrid Transformerを組み合わせ、視覚・テキストの両面からマルチモーダル情報を効果的に活用する手法VGTを提案。多様な文書タイプと詳細 […]...