NLP | Shikoan's ML Blog

論文まとめ：SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling

2024-11-21

182{icon} {views} タイトル：SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling 著 […]...

2024-01-31

1.1k{icon} {views} OpenAIの新しいEmbedding APIを試してみました。Embedding APIをテキスト分類のバックボーンとして使用し、ロジスティック回帰を行います。Livedoorニュ […]...

2023-12-14

2.2k{icon} {views} 英語を日本語に翻訳するというタスクから、Amazon TranslateやDeepLのような翻訳APIと、GPTやClaudeのようなLLMを比較します。BLEUによる翻訳性能と、コ […]...

2023-10-22

509{icon} {views} LLMをデプロイする際に、LLM部分の量子化が必要になることが多いです。MiniGPT4のようなVLMに焦点をあて、AutoGPTQとBitsAndBytesという2つの量子化フレーム […]...

2023-06-29

727{icon} {views} タイトル：TinyStories: How Small Can Language Models Be and Still Speak Coherent English? 著者：Rone […]...

2023-04-13

601{icon} {views} 論文：Sentence Simplification via Large Language Models 著者：Yutao Feng, Jipeng Qiang, Yun Li, Yu […]...

2023-01-26

5.3k{icon} {views} 自然言語処理モデルT5を使って文章単位の埋め込み量（Sentence Embedding）を取得することを考えます。T5のEmbeddingはトークン単位ですが、平均を取ることで、簡 […]...

2022-12-11

3.7k{icon} {views} タイトル：OCR-free Document Understanding Transformer 著者：Geewook Kim, Teakgyu Hong, Moonbin Yim, […]...

2022-12-01

7.5k{icon} {views} タイトル：Large Language Models are Zero-Shot Reasoners 著者：Takeshi Kojima, Shixiang Shane Gu, Ma […]...

2022-06-10

715{icon} {views} タイトル：Extreme Compression for Pre-trained Transformers Made Simple and Efficient 著者：Xiaoxia W […]...