stable diffusionであそぼう

PCゲームに飽きここしばらくはタイトルのソフトウェアで遊んでいる。

stable diffusionについて詳しい解説は人工知能なりググって調べていただければいいが要はディープラーニング技術を使って単語だけで絵を描くソフトだ。

最近はスマホで単語を並べるとそれに合わせた絵を描いてくれるアプリが一気に出回り始めたがそれの元祖のようなもの。

おそらくスマホアプリの大半はこのソフトをエンジンにして動作しているのだろう。

スマホアプリはクラサバになっておりどこかのサーバーを使って絵を描くがこのソフトはローカル環境でも構築できるのがメリットになる。

ローカルでできるということは自分がイメージして生成した絵が外に出ない。

クラサバのアプリだと他人の生成した絵がそのままアプリに共有されていたりする。

それに生成の枚数制限もないしサクサク出力できて電気代はかかるが月額料金を支払う必要もない。

スペックとしてビジネスPCで動かすのは無理だが最近のゲーミングPCのエントリーモデルなら余裕で動く。

具体的にはnvidiaの30シリーズ推奨だが20でも工夫すれば16でもいける。

Radeon系は非対応で頑張って動かしている方もいるようだがこのソフトも使いたくて新規でゲーミングPC組むならNvidia系のグラボを推奨する。

重要なのはビデオメモリーサイズで最低6GB、できれば12GB以上が推奨だ。

RTX2060の12GB版の中古で昨年PCを組んだので環境としてはバッチリだ。

ただインストールが面倒くさそうで今年はゲームに忙しかったのでいつか入れたいとは思っていながら3月まで持ち越してしまった。

対話式人工知能のChatGPTも急激に進化しているしマイクロソフトも追随してグーグルや百度は失敗気味だが世の中は人工知能を活用する方向に向かっている。

ChatGPTは日常に使っているものの技術革新に乗り遅れるのも癪なので人工知能同様のディープラーニング技術を使ったstable diffusionも導入した。

発表当時は面倒な手順が必要だったが有志によるパッケージ化で1111あたりなら簡単にインストールできる。

簡単になっているものの運悪くハマりやすい手順を見て作業していたので完了しているにも関わらずそれが判定できずインストーラーが止まってしまって動かないなぁと導入方法を何パターンか変えても同じで無駄に3時間悩んでしまった。

1111版は順調なら30分もあれば絵を出力できるようになる。

使い方も割愛するが基本は単語を区切って入力してボタン一発で絵が出力される。

ディープラーニングで揺らぎがあるので同じ単語を並べてもボタンを押せば全く違う雰囲気の絵が完成する。

実写かアニメ調か3Dモデリング風かとかはモデルというものを有志がガンガン生産しているので自分の嗜好にあったものを追加しておく。

アニメ絵は興味がないので実写系と3Dモデリング系で有名なのを3つ程入れている。

最初はある楽曲のイメージ写真作って曲に乗せてPV作りたいと猫の物語を写真風のモデルで作って遊んでいた。

30-40代あたりだと知っている方も多いと思われる曲で少し下に答えがあるので何の曲か当てていただけると嬉しい。

静止画のピクセルサイズや設定にもよるが512×512程度なら我が環境で5秒程度で完成するので1分で10枚生産できる計算になる。

写真クオリティの2048×2048サイズあたりだと4分かかってしまうのでデフォルトの512がいい。

これは猫がモデルなんだけど単語でポーズをつけるのはとにかく難しい。

猫に手紙を咥えさせるなんて無理ゲーだった。

動物のポーズが難しいだけかと思えば人間も難しい。

色々単語を変えたり重ねたりして何度もボタンを連打するが思ったような構図にならない。

単語を増やせば増やすほどそれなりに精度は上がるが順番など単語の重みづけがあったりで一度出た構図を二度と出せない。

ワードに矛盾があろうがそれを押し通すので例えば手があらぬ方向から生えていたりする造形になる。

世の中ではこの絵を上手く描くための単語の羅列を呪文と読んでいる。

だいたいそういう人達は美少女アニメ絵師のようだ。

あと文字を絵の中に埋め込むのも苦手で思うように描いてくれない。

マスキングしてそこだけ描き替えるツールも用意されているが書き換えたところの違和感を無くすだけで数時間潰れるほど面倒だ。

逆に一発生成でイメージした構図にハマった時が嬉しいのでこのソフトにハマる人が続出しているんだろう。

ちなみに黒猫の物語はBUMP OF CHICKENのKをモチーフにした。

ラフメイカーとこの曲は昔好きでいつか映像化したいと思っていた。

思ったようなイメージ絵が完成しなかったのでPV化はやめた。

1日とか掛ければ作れるとは思うが今の自分にそこまでの想いはないw

その他にも物語風な画像を生成して遊んだり追加機能などを調べているとこのソフトの行き着く先は理想の異性の顔探しらしいw

試してみた。

これは何百枚から厳選した絵でもなく数分で生成した約20枚をそのままアップした取って出しだ。

適当にネットで見つけた美人を描く呪文をコピペして簡素化して、

1 Beautiful woman,beautiful eyes and hair,well-proportioned face,glossy lips,short hair,((((masterpiece)))), high quality, very_high_resolution, large_filesize, full color,high quality, very high resolution, large filesize,beautiful detailed glow

最後のワードにインドや日本やフランスやウクライナやハリウッドと加えて揺らぎを使って出力させたものをそのままアップした。

そういえばハリウッドにしたらヘップバーンっぽい女性も出てきた。

記事トップにも挙げたこの絵は少し手順が違って日本の某有名女優の顔をLoraという学習ツールに入れて追加モデルにして出力している。

といっても若い頃の観月ありさや酒井法子とは似ても似つかない女優なので日本人の雰囲気だけをモデルから持ってくる感じだ。

日本の美人を指定すると一昔前にハリウッドに出演しているケバいメイクした東洋人のあの顔みたいな画像か一重のぽっちゃり顔か童顔のいずれかになるので学習機能は絵の方向性をずらしたり寄せたい時に使える。

Lora学習はとにかく手間がかかるのでおすすめしないが普通の画像出力なら簡単な操作で世界の女性モデルのカタログが数分でできてしまう。

もちろん背景だって違和感なくつけられる。

難しいがポーズや構図も決められる。

需要があるか知らんが同じパラメータで性別を男性に変えて女性用も念の為に数分で作成した。

興味がないせいか美容室に貼ってあるヘアカットサンプルに見えてしまうw

そう考えると女性の方も化粧品担当モデルカタログに見えなくもないか。

別にこんな美男美女ではなく普通の人もディテールつけて造形できるので写真モデルもフォトグラファーも今後の仕事が厳しくなりそう。

今回幾つか画像を生成するための実写系モデルとか3Dモデルとかを取っ替え引っ替え使ってみたが使うモデルによって絵柄がガラッと変わる。

モデルこそがこのソフトの心臓部でもある。

このモデルには商用利用可と不可があるので間違えると莫大な違約金を取られるやもしれないので金儲けの企てをしている方は注意が必要だ。

これや3D化ツールなどを駆使すれば絵師がいなくてもプログラムが書ければゲームが作れてしまいそう。

それどころかGPT4なら要件さえ伝えればプログラムすらすらすら書いてくれる。

プログラムも書けない、絵も描けなくてもシナリオ作る才能ある人ならアドベンチャーゲームを個人で作ってSteamあたりに申請して大当たりで大金持ちなんて夢も出てきた。

日本人youtuber1位、2位を知って今や何が当たるかわからない時代だ。

簡単なプロットを書けばシナリオですら人工知能に考えてもらうことすらできる。

ただ呪文を使ったお絵描きソフトは生成のたびに顔が全く変わってしまうので顔の造形だけを固定してポーズと背景を変えるツールでも誰か作ってくれないと厳しい。

Pythonのソースコード弄って絵の揺らぎの元になっている乱数であるseed値を固定して同じ顔を出現させる方法があるにはあるが少しポーズが変わると使えないので人間で物語を作るのは難しい。

偉人伝としてなら例えばマイケルジャクソンそっくりでとかマドンナそっくりにとかマリリンモンローそっくりだったら顔が固定できるが肖像権問題で使えない。

モデルにもよるが日本人は全滅に近くアリアナグランデとかティラースイフトあたりはきっちり本人に寄せて描いてくれるがティナターナは無理とか基準がわからない。

ちなみに海外で現在知られていそうな日本人の名前を片っ端から入力して本人の似顔絵として確認できたのは安倍晋三と本田圭佑と大谷翔平と大坂なおみと羽生結弦と錦織圭だ。

遠目で見ればそれっぽいが安倍さんと大谷翔平以外モノマネ芸人感すらない。

単にコスプレファンレベルだ。

羽生くんに至っては親戚のおじさんでももう少しカッコいいはずだ。

大谷翔平は流石に米国で露出度が高いので本人とは違った方向でイケメンになっている。

肖像権ガーと思ったがここまでクオリティが低ければ大丈夫だ。

但し米国有名人はかなりクオリティが高く誰が見ても本人とわかるので商用利用は要注意だ。

あと作家の尾田栄一郎とか村上春樹は海外で名前が通っているもののメディア露出度が低いので似顔絵にならないのは仕方ないとしてもイチローとピコ太郎(PPAPも入力)と長友とオノ・ヨーコと宮崎駿がどのモデルにもキーワードとして登録されてなさそうには驚いた。

テレビなどが報じる日本人視点の世界で活躍する有名人と普通の外国人視点の有名な日本人には齟齬がありこういう遊びをするのも面白い。

そして前述の通りマスキングしたところだけ書き換えるツールで手を打つ方法もあるがつないだ画像の違和感が半端ない。

それでも漫画やアニメなどもワードで絵を描くソフトではなくスケッチ絵から精細な絵を描くディープラーニングお絵描きソフトを使えば今後は作品の生産速度が上昇するだろう。

漫画家といえばこれまではシナリオ力、画力、画速、演出力、運の5つを合わせ持っていないと売れない世界だった。

だからとにかくハードルが高く一攫千金の職業だ。

しかし人工知能漫画制作ソフトが強力になればなるほど絵を描く能力が必要にならなくなり画力はへっぽこでも面白いシナリオが書ける漫画家がどんどん参入して盛り上がってくれるのではないかと期待している。

続き

ここから下は話が逸れるw

そういえばゲームで思い出したが3Dゲームはポリコレ過激派勢が蠢きメーカーに圧力をかけてゲームキャラがどんどん美しくない方向に進んでおり、

思うように売れなくなってしまっている。

ゲーマーから見れば何の嫌がらせか、という印象だろう。

ゲーム業界に巣食うポリコレ過激派はこの手のキャラが増殖し捻じ曲がったLGBT利用や美人否定=平等というわけのわからない活動を展開している。

このキャラも開発段階では写真上3段の普通のゲームクオリティだったがポリコレ配慮のお陰で出来上がったゲーム映像では最後のキャラになった。

これNPCとかではなく主人公だ。

若い頃このゲームやってたらヒロイン名というよりかあちゃん!って呼んでそうだ。

それでもプレイヤー曰くこのキャラは全然チャーミングな方らしい。

某ゲームなんて一般キャラのはずなのに出てくるキャラ出てくるキャラどれもゾンビのようにきしょくてゾンビゲーかよと叫びたくなるレベルに仕上がっている。

ストーリーは超いいという評判なのでやろうとプレイリストに入れてあったがキャラ見て買うのやめたw

昨今のディズニーなんて原作ぶち壊しでストーリーが破綻したLGBTを無理矢理ねじ込んだ作品を連発している。

これでは子供に夢もへったくれもないだろう。

例えば長友選手が平愛梨と結婚して多くの中高サッカー男子に夢と希望を与えてくれたのではないだろうか?

俺も野獣のように頑張ってプロで活躍してガンガン稼いで平愛梨のような綺麗な嫁さん貰うんだ!という20才前後のサッカー青年でチームで練習しながらバイトして夜に1時間だけゲームを楽しむDQフレを思い出したw

ゲーマーにはこんな綺麗なキャラやかっこいい異性に憧れてもしかしたら出会いがあるかもしれないし明日も頑張って生きていこうという糧になっている人も数多くいる。

もちろん違う夢や希望も星の数ほどあるだろうが世の中は多様性のはずだ。

一定数いる人々の夢や希望を煮て焼いて壊しているのがポリコレ過激派だ。

ニンテンドーにまで圧力がかかってゼルダシリーズに黒人がいない?とかピーチ姫もポリコレ化しろ!とかもう意味がわからん。

だからデフォルトは不細工キャラで発売してポリコレ回避で遊ぶ前にユーザーがキャラメイクで美女と野生味ある男性※など好きなキャラに作り替えるのが一般的になり始めている。

モンハン以外にもファンタシースターとか黒い砂漠とかウォーロンとかエルデンリングとかワイルドハーツとかキャラメイクを実装している。

それをこのソフトにAPIを介して呪文でキャラ生成できるようになると面白い。

現実と離れた非日常の世界こそがゲームなのにリアリズムが大嫌いな左派が現実世界のLGBTを持ち込もうとする滑稽さが窺える。

それを回避する方策をいくらでも考えて実行する自由主義なリアリスト達に価値観を押し付けたところで意味はない。

もちろんLGBTを公平に扱う社会的配慮とその基盤作りは人として当然のことではあるが左派って先鋭化や先端化してしまい主張が多数派に理解できなくなってしまう傾向がある。

更に問題はその勝手に作ったポリコレ違反を世の中から無くそうと騒いでいる本人がゲームコンサルタントと称してゲームメーカーに寄生し始めているのが公金チューチューと同じ香ばしい匂いがする。

「私を雇わないとあんたのところのゲームをターゲットにして騒ぐわよ」と言ったか言わないか知らんが以前書いたテレ○放送の「スポンサー料くれんとブラック企業として叩き続けるぞ」ビジネスと同じ構造に見える。

ゲームポリコレ過激派事情は反フェミのキャベツさんの動画に相当な皮肉が入っていて面白いww

左巻きっていちいち自分達の勝手な理想を社会を押し付けて自由で開かれた社会が嫌いなんだろうけど経済活動の邪魔なのでもう少し静かにしてくれると世の中もよくなるぞ。

もちろんまともな左翼は世の灯台にもなり得るので必要ではある。

話が逸れたがこのソフトが動作する環境があれば一度試してみると何かビジネスのアイデアが生まれるかもしれない。

ローカル環境がなければスマホのその手のアプリをインストールして実際にやってみるだけでも気がつかないことが見えてくるかもしれない。

そういえば黒猫の写真みたいな物語いっぱい作って何の曲なのかを当てるゲームとか簡単に作れる。

今でも放送しているか知らんけどパネルクイズアタック25のラスト問題みたいな。

※日本のゲームでは細めなイケメンが主人公になりやすいが欧米あたりだとブルースウィルスやドウェインジョンソンとかマッドディモンのようなキャラクターが主人公になりやすい。アクションRPGの場合欧米ではひょろひょろイケメンが鉄パイプやら大きい剣を振り回すというのではリアリティが無いと考えられているためムキムキおじさんが主人公になりやすい。


おすすめ記事

ためになる記事だと思ったらシェアおねげえします

フォローする