RCNNで使われるSelective Searchについてまとめてみる
12.5k{icon} {views} RCNNで用いられる「Selective Search」について中で何をやっているのかまとめてみました。RCNNの論文を読んでいるときによく出てくる「Selective Searc […]...
物体検出で使うMean Average PrecisionをNumpyで実装する
5.6k{icon} {views} 物体検出でよく使われる評価指標・Mean Average Precision(mAP)をNumpyで実装しました。計算に癖があるので注意が必要です。 参考記事 こちらの記事がとてもわ […]...
ImageNetのVal精度を再現するための前処理を考える
4.4k{icon} {views}ImageNetのValidation精度は論文でよく見ますが、その精度をどのようにして再現するのかがよくわからなかったので書きました。10-Cropをするのが最も簡単な方法です。 I […]...
スタイル変換のStyle Lossとは何をやっているか
4.3k{icon} {views} スタイル変換やImage to Imageの損失関数で使われる・Style Lossの実装を詳しく見ていきます。Style Lossの計算で用いているグラム行列の計算方法をTenso […]...
論文メモ:Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully Convolutional Networks
5.2k{icon} {views} Squeeze and Excitationの派生形であるsc-SEを提唱している論文。Squeeze & Excitationの派生形と構成がわかりやすくまとまっており、効 […]...
Numpyでインデックスカラー画像(VOC2012のマスク)→RGB画像への変換をする方法
11.1k{icon} {views} Semantic Segmentationのマスク画像には「インデックスカラー」というRGBとは異なったフォーマットを使っていることが多いです。この形式はPILで扱うことができ、R […]...
[論文メモ]Self-Attention Generative Adversarial Networks(SA-GAN)
6k{icon} {views} SA-GAN(Self attention GAN)の論文を読んで実装したので、自分用メモとして書いておきます。 自分がやった実装の記事はこちら Self-attention GAN(S […]...
画像分類で比較するBatch Norm, Instance Norm, Spectral Normの勾配の大きさ
8.9k{icon} {views} GANの安定化のために、Batch Normalizationを置き換えるということがしばしば行われます。その置き換え先として、Spectral Norm、Instance Norm […]...
pix2pix HDのCoarse to fineジェネレーターを考える
3.6k{icon} {views} pix2pix HDの論文を読んでいたら「Coarse to fineジェネレーター」という、低解像度→高解像度と解像度を分けて訓練するネットワークの工夫をしていました。pix2pi […]...
画像のダウンサンプリングとPSNRの測定
4.6k{icon} {views} U-Netでどこまでの深さが効いているのかを考えるために、画像をダウンサンプリングし、アップサンプリングするという処理を行いPSNRを見ていきます。その結果、PSNRが15~20程度 […]...