ベンチマーク | Shikoan's ML Blog

LLaMA.cpp+(cu)BLASのCPU/GPUのスループット検証（ローカル編）

2023-09-03

2.3k{icon} {views} LLaMA.cppのスループットをローカルで検証してみました。OpenLLaMA 7B/13Bをベースに、CPU/GPUのそれぞれの生成速度（token per second）と量子 […]...

2020-04-28

8.9k{icon} {views} TensorFlowの前処理では、Numpy配列とTensorFlowの配列を同時に扱うことがあります。サンプル単位のTFの配列を、np.asarrayでバッチ化したら激重になってし […]...

2018-10-01

6.2k{icon} {views} Google ColaboratoryでTPUが使えるようになりましたが、さっそくどのぐらい速いのかベンチマークを取ってみました。以前やったResNetのベンチマークを使います。環 […]...

2018-08-26

17.6k{icon} {views} 前からディープラーニングのフレームワークの実行速度について気になっていたので、ResNetを題材として比較してみました。今回比較するのはKeras（TensorFlow、MXNet […]...