LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(AWS編)
922{icon} {views} AWSのEC2環境でのLLaMA.cppのスループットをCPU,GPUインスタンスで比較してみました。結論としてはGPUのほうが良さそうということですが、インスタンスあたりのコストを考 […]...
LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証(ローカル編)
2k{icon} {views} LLaMA.cppのスループットをローカルで検証してみました。OpenLLaMA 7B/13Bをベースに、CPU/GPUのそれぞれの生成速度(token per second)と量子化の […]...
論文まとめ:Evaluating and Inducing Personality in Pre-trained Language Models
432{icon} {views} タイトル:Evaluating and Inducing Personality in Pre-trained Language Models 著者:Guangyuan Jiang, […]...
Mini-GPT4をDockerで動かしてバッチ処理する
817{icon} {views} Mini-GPT4というマルチモーダルLLMをDockerを使ってバッチ処理をしてみました。係数を部分的にDockerイメージに組み込んだり、使用するLLMを切り替えられるようにちょっ […]...
論文まとめ:UniVTG: Towards Unified Video-Language Temporal Grounding
411{icon} {views} タイトル:UniVTG: Towards Unified Video-Language Temporal Grounding 著者:Kevin Qinghong Lin, Pengch […]...
HMAC(メッセージ認証)をAWS Lambdaで動かしたときのスループットを確かめる
554{icon} {views} API Gatewayなどに対してLambdaで認証をかける場合に、SHAベースのHMAC(メッセージ認証)のスループットを調べてみました。Lambdaのスペックを変えながら、ペイロー […]...
Gradioにおけるステート管理を考える
2.3k{icon} {views} Gradioは簡単にデモアプリを作るときは便利ですが、アプリケーションが複雑になってきたときにステート管理が問題になってきます。ステート用のクラスを用意して、それでラップするのが良さ […]...
論文まとめ:GRiT: A Generative Region-to-text Transformer for Object Understanding
1.2k{icon} {views} タイトル:GRiT: A Generative Region-to-text Transformer for Object Understanding 著者:Jialian Wu, […]...
Pythonで表をHTMLに変換する
3.5k{icon} {views} Pythonで表をHTML形式に簡単に変換するための手法です。特定条件を強調表示するという、スタイリング周りも込みでPandasで可能です。インデックスの非表示や抽出周りがややこしか […]...
Chrome Driverとバイナリーのバージョンを一致させるためのDockerfileの書き方
2.4k{icon} {views} Seleniumでスクレイピングするには、Chrome Driveとバイナリーの両方が必要になりますが、両者のバージョンの一貫性をDockerfile内で保つことにややハマったので自 […]...