MiniGPT-4をAutoGPTQ/BitsAndBytesで量子化時の生成文章の定量評価
169{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVLMに焦点をあて、AutoGPTQとBitsAndBytesという2つの量子化フレーム […]...
論文まとめ:TinyStories: How Small Can Language Models Be and Still Speak Coherent English?
275{icon} {views} タイトル:TinyStories: How Small Can Language Models Be and Still Speak Coherent English? 著者:Rone […]...
論文まとめ:Sentence Simplification via Large Language Models
304{icon} {views} 論文:Sentence Simplification via Large Language Models 著者:Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...
いろんなT5からSentence Embeddingをとって遊ぶ
3.5k{icon} {views} 自然言語処理モデルT5を使って文章単位の埋め込み量(Sentence Embedding)を取得することを考えます。T5のEmbeddingはトークン単位ですが、平均を取ることで、簡 […]...
論文まとめ:OCR-free Document Understanding Transformer
2.7k{icon} {views} タイトル:OCR-free Document Understanding Transformer 著者:Geewook Kim, Teakgyu Hong, Moonbin Yim, […]...
論文まとめ:Large Language Models are Zero-Shot Reasoners
5.2k{icon} {views} タイトル:Large Language Models are Zero-Shot Reasoners 著者:Takeshi Kojima, Shixiang Shane Gu, Ma […]...
論文まとめ:Extreme Compression for Pre-trained Transformers Made Simple and Efficient
550{icon} {views} タイトル:Extreme Compression for Pre-trained Transformers Made Simple and Efficient 著者:Xiaoxia W […]...