スタジオおふとん

プログラミング系

ローカル環境(RTX3090)でDreamboothを動かしてメルトリリスを学習させた話

これやるためにRTX3090買ったみたいなところはある。
品質がいいとされるJoePenna版。

やり方は主に以下を参照。
補足は後述。

self-development.info

補足

追加のインストール

pip install captionizer をしないとダメだった気がする。

正則化画像

これはStableDiffusionに下記を入力して259個作成。
1girl
たぶんもっといい方法はある。

学習させるためのコマンド

ちゃんと読めばわかるけども、下記も必要に応じて変更する。

--actual_resumeは使うckpt
--reg_data_rootは正則化画像を入れたフォルダ

また、ここではgpusを1にしないとダメ、と言っているが、最新のやつだと1にすると動かないので、0にする。

その他の注意点

  • 裏でいろいろ動かしてるとメモリが足りなくなって途中でエラーになるので注意。
  • data_rootのフォルダを再帰的に見ていくっぽい。
    • さらにpngに限らずあらゆるファイルを参照するので、ツールとか入れているとエラーになる

結果

m_lilith person wearing kimono

学習データ12個、4000step RTX3090で1時間半くらい?
ちなみに800stepだと微妙な感じだった。