Albumentationsとtorchvisionで前処理の挙動を揃えたい
6.7k{icon} {views} AlbumentationsとtorchvisionのToTensorは微妙に挙動が異なります。テンソル化の前処理を揃えないと精度が下がることがあるので、その検証をしていきたいと思い […]...
SwinTransformerで転移学習(EfficientNet/ResNet50との比較)
8.7k{icon} {views} Swin Transformerを転移学習してみます。1から学習させる場合と異なり、そこまで強いData Augmentationをかけなくても訓練は安定します。訓練済み係数も含め、 […]...
Cosine DecayとWarmupを同時にこなすスケジューラー(timm使用)
17.2k{icon} {views} 学習初期は徐々に学習率を上げていく「Warmup」と、学習率をなめらかに下げていく「Cosine Annealing」を1つのオプティマイザーとして楽に実装する方法を、timmライ […]...
NumPy+waveでファミコン風の音色を自作する
5k{icon} {views} NumPyを使って、矩形波、25%/12.5%パルス波、三角波、ノイズなどファミコン音源で使われているような音色を実装してみました。周波数のコントロールと併用すれば、NumPyはシンセサ […]...
VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]
17.4k{icon} {views} PythonからVOICEVOXの音声を合成する方法を紹介します。VOICEVOXの合成音声を、Azure Text to SpeechやGoogle CloudのText-to- […]...
地理院地図から画像を取得し、任意の緯度経度に文字を入れる方法
7.9k{icon} {views} Google Map APIの代替として、無料で使える地理院タイルを使ってみました。Pythonのstaticmapと併用すれば、緯度経度から地図画像に文字を入れられました。地理院地 […]...
tf.keras.models.Modelのsave_weightsのあれこれ:オプティマイザーの値を復元するには
9.8k{icon} {views} Kerasでモデルの保存するとき、save_weightsの関数をよく使います。しかし、オプティマイザーの値を復元して訓練再開しようとするとかなりややこしいことになります。モデルの値 […]...
TFRecordを自作して最低限のCIFAR-10を訓練するまで
4.8k{icon} {views} TFRecordを自作して、とりあえずCIFAR-10を訓練するための最低限の処理を書きました。なんでもBytesListに格納する方法です。 TFRecordについて TFReco […]...
Byte列を通じてNumPy配列からTensorFlowのテンソルへ変換する
6.4k{icon} {views} Byte列を通じてNumPy配列からTensorFlowのテンソルへ変換する方法です。TFRecordで記録したデータを扱う際に役に立つと思われるやり方です。 NumPy配列をByt […]...
Pillow(Python)でRGB→CMYKのプロファイル変換
7k{icon} {views} RGBからCMYKへの変換は印刷をする際に必要になりますが、通常はPhotoshopなどの有料の画像編集ソフトを使います。実はこれはPythonで無料でできます。Pillowを使ったやり […]...