ChatGPTの新画像生成モデルは、ユーザーの要望を理解しすぎる

 

新画像生成モデルが作り出した奇妙なイメージ。
新画像生成モデルが作り出した奇妙なイメージ。

ChatGPTが2025年3月にリリースした新しい画像生成モデルが、さまざまなところで「すごい! すごすぎる!」と各地で話題となってる。うちにもこいつの記事の依頼が来たりして、けっこう幅広く注目されてるみたいだな、というのを肌で感じる。

で、色々試してみたのだけど。まず、現状では、無料プランでは新画像モデルは使えないということを理解しておこう。画像の生成は以前からできる(DALL-Eで作ってる)のだけど、ニュースを見て試してみた人が「ほんとだ、すごい!」と旧画像モデルで作ったイメージを使って得得として語っていたりするのを見かけるんだよね。前から画像生成はできるから。勘違いしないで。

で、この新画像モデルだ(一応、有料プランで試したから新しいやつだよ。そうそう、ChatGPTの出禁が解除されてやっと元のアカウントが使えるようになったよ)。色々試してみたのだけど、ちょっと奇妙な減少に出くわしたのだ。こんなプロンプトを実行してみたのだよね。

「寒い雪の日、ログハウスの中で暖かく過ごす家族のイメージを日本の漫画風のカラーイラストで作って。」

まぁ、何の変哲もないプロンプトだ。で、これで作られたのが、冒頭のイメージ。なんか奇妙だろ? ログハウスの中のはずなのに壁がなくて外とつながってる。新画像モデルは高性能のはずなのに、なんでこんな変なものができるんだ?

プロンプトにたまたま何かLLMが妙な解釈をする文言でも含まれているのか?と思って、旧画像モデル(無料プランのやつ)でも試してみた。その結果がこれ。

旧画像生成モデルの作。こっちがいい。

まったく問題ない。こっちのほうがはるかにちゃんとこちらのほしい画像を作ってくれる。新画像モデルは高性能なはずなのに、なんでこんな単純なプロンプトが正しく理解できないんだ?

あれこれ試してみて、わかった。これよりずっと前のところで、「AとBを比較する画像」を作らせていたのだけど、そのことを覚えていて、寒い雪の家の外と、温かい家の中を比較するような形でイメージを作ろうとしてこんなものができあがったのではないか。

個人的に、AIチャットではついつい「前のプロンプトとは関係ないことを続けて質問する」ということをやってしまう。AIチャットでは一連のやり取りを記憶しているので、前に送ったプロンプトを覚えていて現在の応答に影響を与えてしまうこともある。それが、まさが画像生成で起こっているとは気がつかなかった。ていうか、なんで「前にAとBを比較する画像を作らせたから、これも家の外と中を比較する画像を作るんだな」って理解しちゃうんだ? いや、ずっと前に作られた画像とこの画像は何の関係もないってわからない?

新しいAIになればなるほど記憶力もアップし、こっちがとっくに忘れてる古いやりとりを覚えていてそれを引っ張り出して「前にこういったから、こういう答えにしないとな」なんて気を回して答えてくれる。もちろん、話が変わったら新しいチャットにしないこっちが悪い。そうなんだけど、「そこまで古い会話をきっちり覚えていてねちねちいってくるのか」と思うとちょっとげんなりする。

次のAIには、ぜひ「閑話休題」機能をつけてほしい。「この話はここで終わり。でね……」と話の区切りをつけられるように。そして、「そうそう、今思い出したけどさっきの話ね」で前の記憶に戻れるように。それができたら、かなり気分良く会話できるよオレは。


コメント