Qiita開始1年で2000(訂正:3000)Contribution達成してわかったこと
1.6k{icon} {views} 12/21にQiitaが2000Contribution(いいね)を達成しました。正直Qiita始めたときはここまで行くとは思っていなかったので、素直に驚いているとともに、まずは応援 […]...
One-Hotエンコーディング(ダミー変数)ならPandasのget_dummies()を使おう
53.4k{icon} {views} 特徴量処理(特徴量エンジニアリング)でよく使う処理として、「A,B,C」「1,2,3」といったカテゴリー変数をOne-Hotベクトル化するというのがあります。SkelarnのOne […]...
PandasのDataFrameでグループ別にサンプルをN個抜き出す方法
7.3k{icon} {views} 「PandasでGroupbyでグルーピングしたはいんだけど、そこからグループ別にサンプルを1個、2個…と抜き出す、SQLでよくやるやつってどうやるんだっけ?」ということが気になった […]...
KerasのCallbackを使って継承したImageDataGeneratorに値が渡せるか確かめる
2.9k{icon} {views} Kerasで前処理の内容をエポックごとに変えたいというケースがたまにあります。これを実装するとなると、CallbackからGeneratorに値を渡すというコードになりますが、これが […]...
SIGNATEの個人情報要求がすごかったので経済産業省に電話した話
29k{icon} {views} https://commons.wikimedia.org/wiki/File:Keizaisangyosho1.jpgより CC 表示-継承 3.0 アメリカにはKaggleというデ […]...
Pythonでxy座標上の2点間の距離をforループを使わずに計算する方法
34k{icon} {views} 機械学習でカーネル法やらクラスタリングをやっていると、何かと「2サンプル(点)間の距離」を計算することが多いです。ここではより一般的に「Pythonで2点間の距離をforループを使わず […]...
Numpyの配列に対して「最も多く存在する値」を求める方法
20k{icon} {views} アンサンブル学習などで、Numpyの配列のある軸に対して「最も多く存在する値」を求めたい、つまり「多数決」をしたいことがあります。その方法を見ていきます。 最も大きい値がmax, 最も […]...
KerasのModelCheckpointのsave_best_onlyは何を表すのか?
11.3k{icon} {views} Kerasには「モデルの精度が良くなったときだけ係数を保存する」のに便利なModelCheckpointというクラスがあります。ただこのsave_best_onlyがいまいち公式の […]...
Kerasで重みを共有しつつ、必要に応じて入力の位置を変える方法
7.3k{icon} {views} Kerasで訓練させて、途中から新しく入力を作ってそこからの出力までの値を取りたいということがたまにあります。例えば、Variational Auto Encoderのサンプリングな […]...
Kerasのバックエンドで「○○以上☓☓以下」を計算する方法
2.7k{icon} {views} Kerasのバックエンド関数を使ったときに「○○以上☓☓以下」を求めたい場合があります。しかし、KerasではAndのような論理演算をすると少し困ることがあります。その方法を解説しま […]...