前報では、ChatGPT Plus(有料版)にNASAの公開画像を検索できるプラグインSpace Photo Explorerを組み込んで試行した。今回は、日本語文から画像を生成する(ためのプロンプトを生成する)プラグインPhotorealisticを試した。もっと手軽に使えるMicrosoft BingのImage Creattorに比べて、生成されたプロンプトを確認したり、修正したりできる柔軟性が好まれるのかもしれない。
●日本語文から画像を生成する例
一つの例を示す。日本語で次のように要求した:
"量子もつれに基づく量子テレポーテーションのイメージを描いて"
これだけで、Fig.1に示すような画像を生成できた。
●日本語文から画像を生成するフロー
以下のようなフローで画像が生成される。
▼山本の要求:量子もつれに基づく量子テレポーテーションのイメージを描いて
▲ChatGPT(GPT-4 + Photorealistic)の応答(画像生成用プロンプト):
Quantum entanglement visualized as two intertwined particles glowing in a deep space setting, medium: hyper-realistic photography, style: reminiscent of the visuals from the movie "Interstellar", lighting: soft ambient glow highlighting the particles with a backdrop of distant stars, colors: deep blues, purples, and shimmering whites, composition: shot with a Canon EOS 5D Mark IV DSLR camera, EF 85mm f/1.8 lens, Resolution 30.4 megapixels, ISO sensitivity: 100, Shutter speed 1/125 second, with a focus on the entangled particles in the center of the frame --ar 16:9 --v 5.1 --style raw --q 2 --s 750
▲Stable Diffusionによる画像生成:
上記で生成されたプロンプトを、画像生成ソフトStable Diffusionなどへ入力する。その際、(多数公開されている)学習済みモデルから、適当な物を選択する。この選択次第で、画像の質や傾向がかなり変わる。generateボタンを押すと、暫くすると画像が生成される。Fig.2はその一例である。
●日常生活の画像も
さて、「量子もつれ」みたいな専門的話題ではなく、もっと日常生活でのシーンも画像にしてみよう。こんな感じになった。
▼山本の要求:夏休みの宿題に励む小学生の姿
▲ChatGPT(GPT-4 + Photorealistic) & Stable Diffusion:Fig.3の図を生成した。
●感 想
自然言語(英語など)でプロンプトを作成し、画像を生成させるソフトはいくつかあるのだが、上記のStable Diffusionはフリーソフトであり、原則として、生成された画像に対する著作権の問題も発生しないようである。
問題は、そのプロンプト(仕様記述+画像生成制御パラメータ設定)の作成がとても面倒なことであった。それを、ChatGPTのプラグインPhotorealisticが見事に解決した!上記のように、日本語で要求与えるだけでよくなったのだから。
だが、日本語の要求文次第で、いくらでも生成される画像の構成や質が変わる。経験を積んで適切に利用していくことが求められるだろう。あまりのめり込んで、時間と電力の浪費とならぬように。
0 件のコメント:
コメントを投稿