pixcaler: A Python repository from Sickhead Games, LLC

Pixcaler(Pixel-art scaler)

(変換元素材: 白螺子屋様, 学習データ: カミソリエッジ様【オリジナルの素材を配布していたのは First Seed Material 様（サイト閉鎖）】）

ドット絵に特化した拡大ツールです。

既存の手法と比較してより自然な拡大が可能です。

いわゆるディープラーニングと呼ばれる技術を用いて実装されており、pix2pix というネットワーク構造をベースにしています。実装はchainer-pix2pixを改造して制作しました。

以下の素材を機械的に重ね合わせて合成したデータを用いて学習しています
- カミソリエッジ様が配布されている First Seed Material 素材（高解像度版）のカラーバリエーション約7000枚
- M+フォント全種から、light, thin を除いたもの
- コミュ将様の配布されているタイルセット（RTP不使用版）

python3 -m venv venv
source venv/bin/activate
pip -r requirements.txt

pip install cupy

python -m pixcaler.train --composite -i (データセットのディレクトリ) -b 4

上記の手順に従った場合、通常、 result/gen_iter_{iteration}.npz に世代ごとのモデルが出力されます。iteration には学習のイテレーション回数（数値列）が入ります。
以下のコマンドを実行します。

python -m pixcaler.run --generator=result/gen_iter_{iteration}.npz --mode up /path/to/image1.png /path/to/image2.png

Generater/Discriminater の loss 関数を LSGAN に変更(効果があるかは微妙)
- 同時に lam1 倍率を100→10に変更してます（経験上、lsgan に換装すると loss は10分の1ぐらいにスケールされる）
- CycleGAN でも採用されているより安定性の高い loss 関数
adversarial loss 倍率を1/16に変更
- ドット絵の場合、l1-lossが通常の写真などよりもより小さい値に収束するため、adversarial loss をかなり小さく取らないと学習が不安定になります
- なお、この倍率だと、loss の値上は、adversarial loss がほとんど無視されているような挙動になりますが、完全に adversarial loss をなくしてしまうと、出力にノイズが乗るようになり、学習結果が不安定になります
pix2pix ネットワークの encoder, decoder の最上段を kernel size 5x5, stride 1, padding 2 の Convolution2D に換装（効果あるのか微妙）
- もとのネットワークでは画像サイズが128x128以上ないと、画像幅が足りずエラーになります
- そこで、最上段を5x5のConvolution2D(縮小なし)に換装しました
- 3x3 ではなく5x5 なのは既存の手法が5x5のconvolutionをベースとしていたことや、より広い範囲を見たほうが、そのドットのコンテキストを推論しやすいだろうという予想のもとです