AIが言葉を理解し、それをもとにイラストを生成するジェネレーターは以前から存在し、現在も進化の途上にあります。 まだベータ版ですが、そのクオリティには絶賛の声が寄せられています。
ミッドジャーニーのイラストはちょっとクセのあるタッチで、いわゆる洋ゲーの雰囲気が感じられます。 彼女が言葉を入れると、数十秒ほどでイラストが生成されます。 彼女のクオリティはかなり高いので、次にどんなセリフを入れようか考えながらプレイするのも楽しいです。
Discordのアカウントを持っていれば利用開始までの手順は簡単ですが、持っていないと少し面倒です。 このあたりの情報はググるとすぐ出てくるので割愛します。
さて、本題に入りましょう。 PHILE WEBの記事用にオーディオ関係のイラストをお願いしたところ、「ヘッドホンをつけたネコ耳美少女」を描いていただくことになりました。
英語で指示を出さなければならなかったので、DeepLに翻訳を依頼したところ、「ヘッドホンをつけた猫耳の美少女」と書かれていました。 そのまま貼り付けて指示。
すると、出てきたのがこれ。

強い病気.一部の人は好きかもしれません
いや、確かに猫っぽいけど……正直怖い。 「化け猫」って言った覚えないけど…
旅の途中では、最初からやり直すことが容易になります。 ボタンひとつで、別のイラストを描き直すことができます。 で、出てきたのがこれ。

左下は最初と同じ暗い方向ですが、別のバリエーションを作りました
おー? 下の方はまだ怖いですが、上の2つはかなりいいと思います。 ミッドジャーニーでは、演出が気に入れば、それを元に別のバリエーションのイラストを描いてもらうこともできます。 今回はヘッドホンがくっきり見えており、猫耳の条件を満たしています。
で、バリエーションはこちら。

どれも似合いますが、左上のピンクの猫耳がポイントです
うーん、かなりいいですね。 ちょっと化け猫っぽい方向に戻るものもありますが、左上はかなりの美少女感があります。 よし、これに決めた。
Midjourney が最初に生成するイラストは低解像度ですが、必要に応じてアップスケールしてより大きな画像を生成できます。 このプロセスにはかなりの時間がかかりましたが、最終的には次のようになりました (記事の解像度を下げています)。

解像度が上がったことで、イラストの雰囲気が少し変わりました。
…ということで、ちょっと指示を出してボタンを連打するだけで、自分では描けないクオリティのイラストが描けました。 これがベータ版とは驚きです。
他にも多くの有名IT企業やスタートアップが、自然言語を理解し、それをもとにイラストを描くサービスを開発しています。 機会があれば、他のサービスも試してみたいです。