10/13最新バージョン用に更新
Stable Diffusion web UIは画像生成AIであるStable Diffusionをブラウザから簡単に使用でき、PCに導入する場合にはバッチファイルを実行するだけで必要なものが自動でインストールされるので、プログラミングの知識が無くても非情に簡単にStable Diffusionを扱うことができます。せっかくなのでPCへの導入方法を記載しました。
のくの備忘録サイトです。
10/13最新バージョン用に更新
Stable Diffusion web UIは画像生成AIであるStable Diffusionをブラウザから簡単に使用でき、PCに導入する場合にはバッチファイルを実行するだけで必要なものが自動でインストールされるので、プログラミングの知識が無くても非情に簡単にStable Diffusionを扱うことができます。せっかくなのでPCへの導入方法を記載しました。
webブラウザ上でStable Diffusionをパラメータ指定しつつ弄れるStable Diffusion web UIを導入しました。
python3.10.6とgitがインストールしてある状態で学習済みモデルを指定のフォルダに置き、バッチファイルを実行するとvenvで仮想環境を立てて色々導入してくれます。これから始めたい人には楽ちん!(Nvidiaのグラボを使用している必要があります/自分はRTX3060無印)
パラメータの詳細や使い方はこちらの記事を参考
ガチャを回してるみたいで楽しい…!
「花畑にいるウォンバット」
「金髪で司祭服を着た青年」メギド72のフォルネウスぽいのが作りたかった模様
人物は難しそうです
呪文:Beautiful blond boy with medium length hair.shining and crown with white feathers, blue eyes, priest’s white habit, full-length portrait , elegant, unity, anime, digital painting, concept art, highly detailed, unreal engine.sharp focus.highly detailed.cinematic lighting.Fantastic
「川を流れる桃」
シードを固定することで構図が固定できるので、プロンプトやパラメータを微妙に変えて試したりもしています
まだ色々触ってない部分があるので遊びたいです。
テキストから画像生成するAI、Stable Diffusionに手を出してみました。
ローカル環境のvenvで作成したpython仮想環境にインストール
https://github.com/CompVis/stable-diffusion
https://huggingface.co/CompVis/stable-diffusion-v-1-4-original
torch.cuda.is_available()がfalseになってしまったので検索していたらpytorchの問題らしく、
pytorchの導入は下記からインストールしたらTrueになりました。
https://pytorch.org/get-started/previous-versions/
画像生成はRTX3060無印で12秒ぐらいでした。呪文作成が難しい…時間が出来たらimg2imgとかで遊びたいです
メモ:
メギド72は利用規約により商用利用以外での公式画像の加工・転載が可能なため使用させて頂いております
メギド所持率チェッカーにキャラ画像が欲しいとご要望をいただいたものの、200体以上のキャラの顔を切り抜くのは骨が折れる…ということでOpenCVによる顔検出を試してみました。
顔画像をいくつか学習させる部分から試したみたいと思っていましたが、少ない画像からカスケード分類器を作成する為のツール(opencv_createsamples)などがOpenCV4では終了しており、既存の学習済みの顔検出カスケードモデルを使用して検出を行った所…
ちょこちょこペリビットを作ろうとしています
〆所持チェッカーはPHPで出力してJSで弄っているけれど、今ならVue.jsで書き直したらもっと色々足せるなあ…とも少し
今年はフライナイツ団長&副団長~
現在10章1節直後、生放送最後に脳を爆破されています…
「おかえり、フォルネウス」
8章でヴィータの形に押し込められた人外とヴィータの目線の違いの描写、「親友」という言葉の解体と再構築に感銘を受けての4月のリジェネレイト、ワインを用意したりバッチリで臨み来てくれました。今も元気に狼藉奥義を連発してくれています。
メギドは「愛」「父性」についてなど、私たちが当たり前に感じている感情etcを人外目線から丁寧に解体&再構築をやってくれるところが大好きです。
仕事の業務ではあんまり弄らないので趣味で弄っている感じです。
小~中学生の頃、多分C++かVB6な感じの時代?、父が業務で使っていたこともあり、ウィンドウやボタンがGUIで視覚的に感覚的に作れるのは子供心に最高の玩具でした
VB6.0でRPGとかを作ろうとしてマップファイルを読込とかまでは作れたけれど途中で飽きて挫折…
RPGツクールはすごいな…と実感しました
その後個人同人サイト全盛期で、HTML4+CSS+JavaScriptをちょっと弄った物の、当時ポップアップ広告etcによりJavaScriptはアドオンで無効にしたりする時代
Flashの時代でもあったのでActionScriptは結構お世話になりました
三角関数とかはこの頃ようやく重要性を理解したり…
ロリポップに移ったのでPHPで自前アクセス解析etcを作ったり(Apacheログ見れば良いのだけれど)
大学(化学科)に入ってからは授業で少しCとJavaに触ったけれどコンパイル要るタイプは面倒な感じもしてファイル処理などはPHPでやってました
あと吉里吉里で同人ゲームもどきを作っていたのでスクリプター担当したりちょっとプラグイン作るのにCも少し触った記憶(朧気)
この頃さくらインターネットのレンタルサーバーに変更
その後Pythonに出会ってファイル操作etcはそちらでやるように
就職して数年、特に業務では(ExcelVBAやメモ帳とブラウザがあれば弄れるJavaScriptは使用しているけれど)使わないけれど、ちょっと真面目に勉強し直したいな…と思い、今JavaScriptを勉強し直してます
HTML4時代の遺物のため、まずHTML5から…個人サイトはでも読めればいいよね…
ES6とかよく分かっていなかったのでオライリーの第7版を読みつつ、pythonでよく使うitem in itemsみたいなのとかも使えるのに感動しました
vue.jsなどの仮想DOM弄る系も触ってみたら便利だったのでツールや簡単なゲームとか作りたいな~と思っています
for letter in words: print (letter)
Syntax highlightもできる
ソースコードなど汚いですが乞うご期待…できるといいなあ
折角なのでサイトを作りました。ゲーム関連やイラスト、プログラム関連などつれづれ書けたらいいな