SwinTransformerで転移学習(EfficientNet/ResNet50との比較)
8.6k{icon} {views} Swin Transformerを転移学習してみます。1から学習させる場合と異なり、そこまで強いData Augmentationをかけなくても訓練は安定します。訓練済み係数も含め、 […]...
SwinTransformerでCIFAR-10を一から訓練する
5.3k{icon} {views} 画像のTransformer系で有望なモデルである「Swin Transformer」でCIFAR-10を1から訓練してみました。1からの訓練はCNNほど楽ではありませんが、流行りの […]...
Cosine DecayとWarmupを同時にこなすスケジューラー(timm使用)
16.9k{icon} {views} 学習初期は徐々に学習率を上げていく「Warmup」と、学習率をなめらかに下げていく「Cosine Annealing」を1つのオプティマイザーとして楽に実装する方法を、timmライ […]...
「Patches Are All You Need?」のからくりを読み解く
2.8k{icon} {views} ICLR2022のレビューとして投稿された「Patches Are All You Need?」という論文が気になったので読んでみて、少し試してみました。画像の高周波の成分の活用や、 […]...
NumPy+waveでファミコン風の音色を自作する
4.9k{icon} {views} NumPyを使って、矩形波、25%/12.5%パルス波、三角波、ノイズなどファミコン音源で使われているような音色を実装してみました。周波数のコントロールと併用すれば、NumPyはシン […]...
VOICEVOXをPythonから利用し、wavファイルで保存する方法[AzureとGoogle Cloudの比較あり]
17.2k{icon} {views} PythonからVOICEVOXの音声を合成する方法を紹介します。VOICEVOXの合成音声を、Azure Text to SpeechやGoogle CloudのText-to- […]...
地理院地図から画像を取得し、任意の緯度経度に文字を入れる方法
7.8k{icon} {views} Google Map APIの代替として、無料で使える地理院タイルを使ってみました。Pythonのstaticmapと併用すれば、緯度経度から地図画像に文字を入れられました。地理院地 […]...
Vue.js+Bootstrap+linq.jsでサークルの販売物のダッシュボードをサクッと作ってみた話
893{icon} {views} お久しぶりです。あんまり更新できてなくてごめんなさい。今回は「じゅ~しぃ~すくりぷと」の販売物の一覧(ダッシュボード)をWebあんまり詳しくない自分が作ってみましたという話です。 動機 […]...
ごちうさで始める線画の自動着色(2)~TFRecordの作成~
1.6k{icon} {views}KaggleにあったGochiUsa_Facesデータセットを使って、ごちうさキャラの線画の自動着色で遊んでみました。この投稿では訓練の前段階としてTFRecordを作成していきます。 […]...
ごちうさで始める線画の自動着色(1)~データセットのEDA~
2k{icon} {views} KaggleにあったGochiUsa_Facesデータセットを使って、ごちうさキャラの線画の自動着色で遊んでみました。この投稿では下準備として、データセットのEDAをします。 Gochi […]...