「ティーカップの中に子猫がぴったり収まって眠っている」
──そんな夢みたいな光景をAIに描いてもらったらどうなるか?
同じプロンプトをいくつかのサービスで試してみたら、出力結果にちょっとした“性格の違い”が表れて面白かったのでご紹介します。
この記事は2025年9月1日時点の情報・AIモデルをもとに執筆しています。今後のアップデートにより、機能や生成結果が変わる可能性があります。
【閲覧にあたっての注意点】
- 画像の再現性と一貫性について: 本記事の画像は、実在しないAI生成イメージです。
- プロンプトについて: 紹介したプロンプトは、全く同一の画像の生成を保証するものではありません。ご参考までにお使いください。
プロンプトと画像生成結果を比べてみます
今回画像生成に使ったプロンプトはこちらです。各サービスの傾向を出すために、敢えてシンプルにしております。
このシンプルなプロンプトで、ChatGPT、Gemini、Copilotの3つのサービスで生成した結果です。



ご覧の通り、Geminiだけがカップに子猫がすっぽりおさまらず、カップの上に乗っかる画像が出来上がりました。
どうしてこのような解釈の違いが出るのか、それぞれのサービスの特性について考えてみます。
ChatGPT & Copilot:サービス精神旺盛タイプ
ChatGPTやCopilotは、とにかくユーザーの願いを叶えるのが得意。
「子猫がカップに入ってほしい」と言えば、現実にはありえないほど小さな子猫を登場させてでも、きっちり収めてくれます。
いわば「ご要望なら何とかします!」というサービス精神旺盛なタイプ。多少非現実的でも、かわいさ優先で夢を成立させてくれるのが強みです。
Gemini:リアリストタイプ
一方で、Google Geminiはちょっと違いました。
生成された子猫はカップに入りきらず、手足や尻尾がちょこんとはみ出しています。
最初は「失敗?」と思いましたが、よくよく考えるとGeminiが「現実的なサイズ感」を忠実に守った結果なのでは?と気付きました。
「子猫=このくらいの大きさ」「ティーカップ=このくらいの大きさ」という“常識”を踏まえて、物理的に収まらないなら無理に収めない。まるで几帳面なリアリスト。
ちょっとだけ技術の話
この違いは、AIの「解釈の仕方」に関係しています。
- DALL·E系は「ユーザーの意図」を最優先して、サイズ感や現実を柔軟にねじ曲げます
- 今回の例だと「カップに入る子猫」を成立させるため、「ティーカップに収まるように子猫を非現実的なほど小さくする」ファンタジー寄りの解釈をした
- Gemini (Imagenベース)は「現実にありそうなもの」を出す傾向が強い。物理的に収まらないなら無理に収めず、自然な姿を描く
- プロンプトに「小さすぎる」や「ファンタジー」といった補足がないと、常識的なスケールで描こうとする
- 今回の例だと「通常の(体のサイズの)子猫」と「通常の(サイズの)ティーカップ」のサイズを基準に考え、その結果「物理的に収まらない」と判断して、カップに乗っかるような現実的な描写を選択していると考えられる
つまり、Geminiの方が“現実の物理法則に従う真面目さ”を持っているわけです。
- DALL·E系 … ユーザーの意図を叶えるために、多少非現実的でも「ティーカップに入る子猫」を成立させる
- Gemini … リアルさを優先し、「普通の子猫」と「普通のティーカップ」のスケール感を崩さず描く
プロンプトで性格を動かすコツ
Geminiのリアリズムを突破したいなら、工夫が必要です。
- 「極端に小さい」「生まれたばかり」と指定して、サイズをAIに明示する
- 「ティーカップ」という言葉から離れる
- 例:「特大のカップ」にして、器の方を大きくする
- AIが持つ「ティーカップ」の固定観念(サイズ感)にとらわれないようにする
- 「そういう非現実的な猫だ」と設定自体を定義して、AIに現実の物理法則から離れて考えるように促す
- 「魔法のティーカップキトン」といったファンタジー設定をあらかじめ伝える
AIに「これは現実じゃないんだ」と言い聞かせるのがコツです。
これを踏まえて、プロンプト例を考えてみました。
A tiny kitten curled up and sleeping snugly, completely inside a large, oversized ceramic mug. The mug is large enough to comfortably hold the entire kitten. Photorealistic.
日本語訳:「小さな子猫が大きな陶器のマグカップの中にすっぽり収まり、丸まって気持ちよさそうに眠っている。マグは子猫全体が余裕をもって入れるほど大きい。フォトリアル風」
ここでは、ティーカップからlarge, oversized ceramic mug(大きな、特大のセラミックマグカップ)にすることで、AIにサイズの制約を緩める作戦です。
結果は…

このプロンプトだと、カップにすっぽり入った子猫の画像になりました!
A photorealistic image of an extremely small, baby kitten, curled up and sleeping soundly, fully contained within a standard-sized teacup. The kitten is so small that it fits perfectly inside the cup with room to spare.
日本語訳:「とても小さな赤ちゃん子猫が、標準サイズのティーカップの中にすっぽり収まり、丸まってぐっすり眠っているフォトリアルな画像。子猫があまりに小さいため、カップの中に余裕をもって収まっている。」
extremely small, baby kitten(極めて小さな、赤ちゃん子猫)と具体的に指定し、さらに with room to spare(余裕をもって)と加えることで、カップより小さいことを強調します。

A fantastical, photorealistic image of a magical “teacup kitten,” a breed of kitten so small it naturally fits inside a teacup for a nap. The kitten is curled up snugly, fully contained within the cup.
日本語訳:「幻想的でフォトリアルなイメージ。魔法の“ティーカップ・キトゥン”という、ティーカップの中にすっぽり入ってお昼寝できるほど小さな品種の子猫。子猫はカップの中で丸まり、ぴったり収まって眠っている。」
magical “teacup kitten,” a breed of kitten…(魔法の「ティーカップ・キトゥン」という猫種)とすることで、AIに現実の物理法則から離れて考えるよう促します。

これらのプロンプトはGeminiの「真面目さ」を逆手にとって、「そういうものなのだ」とAIに思い込ませるアプローチです。
まとめ:はみ出す可愛さもアリ
ChatGPTやCopilotが「ファンタジーを叶えるお調子者」なら、Geminiは「現実を守る生真面目タイプ」。
同じプロンプトでも、まるでAIごとの性格診断のように出力が変わるのは面白いポイントです。
そして正直、ティーカップからちょこんとはみ出して眠る子猫も、かなり可愛い。
AIの“性格違い”を知った上で、それぞれの得意を使い分けると楽しみ方が広がりそうです。
最後に。あなたならどちらを選びますか?
すっぽり収まる夢の子猫?
それとも現実的にはみ出す愛らしい子猫?

