テキストから画像生成するAI、Stable Diffusionに手を出してみました。

ローカル環境のvenvで作成したpython仮想環境にインストール

https://github.com/CompVis/stable-diffusion

https://huggingface.co/CompVis/stable-diffusion-v-1-4-original

torch.cuda.is_available()がfalseになってしまったので検索していたらpytorchの問題らしく、

pytorchの導入は下記からインストールしたらTrueになりました。

https://pytorch.org/get-started/previous-versions/

画像生成はRTX3060無印で12秒ぐらいでした。呪文作成が難しい…時間が出来たらimg2imgとかで遊びたいです

メモ:

メギド72は利用規約により商用利用以外での公式画像の加工・転載が可能なため使用させて頂いております

メギド所持率チェッカーにキャラ画像が欲しいとご要望をいただいたものの、200体以上のキャラの顔を切り抜くのは骨が折れる…ということでOpenCVによる顔検出を試してみました。

顔画像をいくつか学習させる部分から試したみたいと思っていましたが、少ない画像からカスケード分類器を作成する為のツール(opencv_createsamples)などがOpenCV4では終了しており、既存の学習済みの顔検出カスケードモデルを使用して検出を行った所…

ウァサゴの顔検出を試した画像。顔以外の部分が検出されている
こら そこは顔じゃない

続きを読む