これやるためにRTX3090買ったみたいなところはある。
品質がいいとされるJoePenna版。
やり方は主に以下を参照。
補足は後述。
補足
追加のインストール
pip install captionizer
をしないとダメだった気がする。
正則化画像
これはStableDiffusionに下記を入力して259個作成。
1girl
たぶんもっといい方法はある。
学習させるためのコマンド
ちゃんと読めばわかるけども、下記も必要に応じて変更する。
--actual_resumeは使うckpt --reg_data_rootは正則化画像を入れたフォルダ
また、ここではgpusを1にしないとダメ、と言っているが、最新のやつだと1にすると動かないので、0にする。
その他の注意点
- 裏でいろいろ動かしてるとメモリが足りなくなって途中でエラーになるので注意。
- data_rootのフォルダを再帰的に見ていくっぽい。
- さらにpngに限らずあらゆるファイルを参照するので、ツールとか入れているとエラーになる
結果
学習データ12個、4000step RTX3090で1時間半くらい?
ちなみに800stepだと微妙な感じだった。