うるちです!
最近画像生成AIについての話題が盛り上がっていますね。「Midjourney」が注目を浴びたと思ったら、さらにスゴイ性能と噂の「Stable Diffusion」も登場。
画像生成AIとはどんなものなのか?と思って私もチャレンジしてみました。
まずはMidjourneyから
たまたまdiscordのアカウントを持ってたので、サインイン。招待リンクを送ってもらい、お試しで描いてもらった絵をご紹介したいと思います。
なお、Midjourneyの利用にあたってはこちらのサイトを参考にさせていただきました。手順がイチからわかりやすく解説されており、とてもありがたかったです。
なんせ初挑戦な上に命令文は英語で書かなきゃいけないのでちょっと戸惑ったんですが、Google翻訳を使いながらやってみました。
幻想的な森の中にある古代の遺跡とマンガ風の少女
Ancient ruins and cartoon girl in a fantasy forest
この命令文で描いてもらったイラストがこちら。
U1ボタンでさらに細かくしてもらったのがこちら。
AIなので不完全な部分もありますが、なかなか面白いですね。少女をマンガ風に指定した以外絵のタッチには注文付けてないんですけど、背景もそれっぽく合わせてくれたのかな?
画像生成AIに指示を出す命令文の事を「呪文」と呼んでいる人も多いようですが、ざっくりした呪文だと出力される絵もやはりざっくりになるようです。
Stable Diffusionもやってみた
続いては、Midjourneyよりスゴイ!という触れ込みのStable Diffusion。こちらはデモページ行くだけで簡単に画像が作れました。少し時間はかかるけど。
Stable Diffusionの利用に当たって参考にしたのは、こちらのサイトです。必要な情報が簡潔にまとまっており、とても助かりました。
比較できたほうがいいかと思ったので、Midjourneyに入力したのと同じ文章を使って画像の生成をしています。
Midjourneyは比較的同じような雰囲気・タッチで違う構図の絵を出してきたんですが、Stable Diffuisionは絵のタッチが全然バラバラなものを4枚出してきました。
特に左下なんかはマンガ風という注文をガン無視したリアル風画像です。AIさんはやっぱりまだリアルな人間の手足や関節なんかを描くのは苦手っぽいですね。
終わりに
私もちょろっと触ってみた程度なのでまだまだうまい事「呪文」を練り上げる技術はありませんが、それでもこれだけ興味深い違いが現れました。
この手の技術もライバル的な存在がいた方がお互いに切磋琢磨して伸びると思うので、MidjourneyにもStable Diffusionにもガンガン技術競争して頑張ってもらいたいです。
著作権の問題とかがクリアできるなら、私も画像生成AIさんにドンドン何か描いてもらいたいなあ。ものすごい立派な背景にふざけたまたわれ大根とか描き足したい。
以上、うるちでした!
気に入っていただけたら、クリックよろしくお願いします!