論文まとめ:Vision Grid Transformer for Document Layout Analysis+OSS紹介 2025-02-28 12{icon} {views} Vision TransformerとGrid Transformerを組み合わせ、視覚・テキストの両面からマルチモーダル情報を効果的に活用する手法VGTを提案。多様な文書タイプと詳細な […]...