多変量分布のKLダイバージェンスの実装
2k{icon} {views} 分布間の差を定量化する手法として、KLダイバージェンスが機械学習では広く使われますが、多変量への拡張の実装面の話が必要になったので検証してみました。KDTreeを使った推定がノンパラへの […]...
ML Study Jams中級編終わらせてきた
964{icon} {views} ML Study JamsというGoogle Cloudが提供している無料の学習プログラムの第二弾がオープンしています。今度は中級編が追加されており、全部終わらせてきたのでその報告と感 […]...
TensorFlow Data Validationを使ったお手軽で強力な探索的データ解析
4.7k{icon} {views} 特にテーブルデータで、実際の分析に入る前に欠損値やデータの分布の把握といった、探索的データ解析(EDA)というのは重要なプロセスになります。TensorFlow Data Valid […]...
note開設のお知らせ
1k{icon} {views} 本日noteを開設いたしました。 https://note.mu/koshian2 これは自分の記事をより多くの方々に読んでいただき、新たな読者の開拓を図るためであります。 当面は既存の […]...
Scikit-learnのROC/AUCのy_predのスケールについて
5.7k{icon} {views} SklearnのROC曲線/AUCスコアのy_pred側のスケールは実は0~1でなくてもよかったという話。0~1以外の値を放り込んでもちゃんと計算できるか確かめてみました。 公式ドキ […]...
ML Study Jamsを全部終わらせてきたのでその感想を書いてみる
6.3k{icon} {views} ML Study JamsというGoogle Cloudが提供している無料の学習プログラムが期間限定でオープンしています。それを全部終わらせてきたのでその報告と感想を書いていきたいと […]...
ディープラーニング=最小二乗法のどこがダメなのか解説する
21.1k{icon} {views} あるニュース記事で、ディープラーニング=最小二乗法で三次関数なんていう「伝説の画像」が出回っていたので、それに対して突っ込みつつ、非線形関数という立場からディープラーニングの本当の […]...
Pythonでxy座標上の2点間の距離をforループを使わずに計算する方法
34.3k{icon} {views} 機械学習でカーネル法やらクラスタリングをやっていると、何かと「2サンプル(点)間の距離」を計算することが多いです。ここではより一般的に「Pythonで2点間の距離をforループを使 […]...
TensorFlow/Kerasでの分散共分散行列・相関行列、テンソル主成分分析の実装
4.5k{icon} {views} TensorFlowでは分散共分散行列や主成分分析用の関数が用意されていません。訓練を一切せずにTensorFlowとKeras関数だけを使って、分散共分散行列、相関行列、主成分分析 […]...
統計学や機械学習で使われる分散共分散行列、相関行列とグラム行列の関係
14.8k{icon} {views} TensorFlowなど分散共分散行列の計算関数が用意されていない場合は、分散共分散行列や相関行列を計算する際に自分で関数を定義しなければいけません。そこでグラム行列から、分散共分 […]...