論文まとめ：Extremely Simple Activation Shaping for Out-of-Distribution Detection

Posted On 2022-11-23

1.3k{icon} {views}

ざっくりいうと

これでOODの検知ができる

負のエネルギースコア（negative energy score）を求める。

分類モデルのロジットを使うだけで、OOD検知の部分で新たに訓練はしない。

ASHではASH-P、ASH-B、ASH-Sという3手法を検証。

（共通）活性化関数の値の大部分を除去する。具体的には、表現全体（Global Abverage Poolingの値）のTop-p%にあたるしきい値tを求め、しきい値以下の部分を0で埋める
3つのアルゴリズムからなる
1. ASH-P：何もしない。PruningのPで、「Pruning is all we need」
2. ASH-B：しきい値以上の部分に定数値を埋める。BinaryのB
3. ASH-S：しきい値で除去した割合に応じて、しきい値以上の値に定数倍をかける。ScaleのS

SoTAだった。ASH-Pは悪い。

結局ASH-Sが一番安定する。削りすぎるとIDの精度が悪くなる

pの値を大きくして削らないと、Energy ScoreのID/OODの差が小さくなる。ある程度削ったほうがROCは高くなる（＝ヒストグラムでのIoUが小さくなる）

IDの精度ベースで、Global Average Poolingの直前（4th）が良い。ネットワークの前の値を使うと明確に悪くなるので、セマンティックな空間で取るのが重要。

一方でID/OODのROCを見ると、Global Average Poolingのあとのほうが若干良い。

Shikoan's ML Blogの中の人が運営しているサークル「じゅ～しぃ～すくりぷと」の本のご案内

技術書コーナー

北海道の駅巡りコーナー