OpenAIの新しいEmbeddingAPIをlivedoorニュースコーパスで試す
267{icon} {views} OpenAIの新しいEmbedding APIを試してみました。Embedding APIをテキスト分類のバックボーンとして使用し、ロジスティック回帰を行います。Livedoorニュー […]...
日本語翻訳で比較するLLMと翻訳API
591{icon} {views} 英語を日本語に翻訳するというタスクから、Amazon TranslateやDeepLのような翻訳APIと、GPTやClaudeのようなLLMを比較します。BLEUによる翻訳性能と、コス […]...
MiniGPT-4をAutoGPTQ/BitsAndBytesで量子化時の生成文章の定量評価
240{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVLMに焦点をあて、AutoGPTQとBitsAndBytesという2つの量子化フレーム […]...
論文まとめ:TinyStories: How Small Can Language Models Be and Still Speak Coherent English?
349{icon} {views} タイトル:TinyStories: How Small Can Language Models Be and Still Speak Coherent English? 著者:Rone […]...
論文まとめ:Sentence Simplification via Large Language Models
353{icon} {views} 論文:Sentence Simplification via Large Language Models 著者:Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...
いろんなT5からSentence Embeddingをとって遊ぶ
4k{icon} {views} 自然言語処理モデルT5を使って文章単位の埋め込み量(Sentence Embedding)を取得することを考えます。T5のEmbeddingはトークン単位ですが、平均を取ることで、簡単に […]...
論文まとめ:OCR-free Document Understanding Transformer
2.9k{icon} {views} タイトル:OCR-free Document Understanding Transformer 著者:Geewook Kim, Teakgyu Hong, Moonbin Yim, […]...
論文まとめ:Large Language Models are Zero-Shot Reasoners
5.7k{icon} {views} タイトル:Large Language Models are Zero-Shot Reasoners 著者:Takeshi Kojima, Shixiang Shane Gu, Ma […]...
論文まとめ:Extreme Compression for Pre-trained Transformers Made Simple and Efficient
576{icon} {views} タイトル:Extreme Compression for Pre-trained Transformers Made Simple and Efficient 著者:Xiaoxia W […]...