ChatGPTとGeminiなどの生成AIで複数頭の動物の画像を生成する際、どうしても同じようなポーズや表情になりがちで、時として不自然に感じることがありませんか?
今回はその理由と、少しでもリアリティを出すためのプロンプトのコツについて、まとめてみました。
この記事は2025年7月11日時点の情報・AIモデルをもとに執筆しています。今後のアップデートにより、機能や生成結果が変わる可能性があります。
【閲覧にあたっての注意点】
- 画像の再現性と一貫性について: 本記事の画像は、実在しないAI生成イメージです。
- プロンプトについて: 紹介したプロンプトは、全く同一の画像の生成を保証するものではありません。ご参考までにお使いください。
はじめに
近頃、話題のAI画像生成ツール。
手軽にイメージ通りの画像が作れるのは楽しいけれど、「あれ?」と思うこともありませんか?
特に、複数の動物が登場する画像を生成しようとすると、なぜかみんな同じポーズ、同じ表情…。
たとえばこんな感じ

もう一つ、プロンプト付きで例をお見せします。
Prompt (EN): Kittens sleeping in a drawer like a pack of socks, photorealistic
日本語訳: 引き出しの中に詰められた靴下のように並んで眠る子猫たち、リアル写真風


どちらのシーンもコピーしたような同じ体勢になっているのは、ちょっと不自然ですよね。
この記事では、そんなAI画像生成における「あるある」な悩みの原因を深掘りし、少しでもリアルな複数動物の画像を生成するためのプロンプトのコツを解説します。
AIが同じポーズを生成しがちな理由

AI画像生成モデルは、大量の画像データを学習しています。
その学習データの中で、「複数の同じ種類の動物が同じような状況で写っている画像」の割合が高い場合、AIはそのパターンを学習しやすくなります。
例えば、「子猫が昼寝をしている」という画像を学習データで多く見ると、AIは「子猫が複数で昼寝する=みんな同じように丸まって寝ている」というパターンを強く認識してしまうのです。
また、現在のAI技術では、個々の動物の性格や感情、その場の状況などを細かく理解し、それぞれの動物に合わせた自然なポーズや表情を生成することはまだ難しいのが現状です。
どうしても、平均的な、あるいは典型的なパターンに落ち着きがちになります。
ちょっと怖い?Geminiで複数動物が不自然になるワケ

Geminiをはじめとする一部のAI画像生成ツールでは、複数の動物を生成しようとすると、目線が合っていなかったり、表情が硬かったりと、どこか不気味な印象を受けることがあります。
これには、AIがまだ複雑な構図やインタラクションを苦手としていることが考えられます。
特に、複数の視線が一点に集中していなかったり、動物同士の関係性が曖昧だったりすると、見る人に違和感を与えてしまうのです。
例えば…
プロンプト:「日本の城跡公園にある石垣の近くで子猫が5匹遊び回っているよう様子を画像にして。リアル風。品種は全部変えて、天気は晴れ」
視線や動作がやや不自然

草への興味がすごい

プロンプト:「子猫3匹が部屋の中でいたずらをしている画像を作って。横長、リアル写真風、高画質、品種は3匹とも変えて」
猫が真顔でいたずらなんてする?


また、学習データに含まれるノイズや偏りも影響している可能性があります。
不自然なポーズや表情の画像データを多く学習してしまうと、その傾向が生成結果に現れてしまうことがあります。
リアリティを出すためのプロンプトのコツ
では、少しでもリアルな複数動物の画像を生成するには、どのようなプロンプトを入力すれば良いのでしょうか?
いくつかのコツをご紹介します。
1. 具体的な状況や行動を指定する
「子猫4匹が床の上で昼寝」という抽象的なプロンプトではなく、
「日当たりの良い窓辺で、四匹の子猫がそれぞれ違う寝方でリラックスして昼寝をしている。一匹は仰向けでへそ天、二匹は丸まってうずくまり、もう一匹は伸びて眠っている」
のように、具体的な状況や行動、それぞれの動物の様子を細かく指定しましょう。
これだけで違いが出ました

2. 個性を強調するキーワードを加える
「好奇心旺盛な」「のんびりした」「甘えん坊の」といったキーワードをそれぞれの動物に加えることで、AIは個性を意識したポーズや表情を生成しやすくなります。
例えば、
「好奇心旺盛な茶トラの子猫と、のんびりした白猫、少し眠そうな黒猫が、おもちゃの周りでそれぞれのペースで遊んでいる」
のように記述します。


3. 視線やインタラクションを指定する
動物同士の視線の方向や、どのような関係性でいるかを具体的に指示することで、より自然な画像になります。
「親猫が見守る中、子猫たちがじゃれ合っている。一匹が親猫の尻尾を追いかけ、二匹が互いに猫パンチをしている。親猫は穏やかな表情で子猫たちを見ている」
のように、それぞれの動物の行動と視線を関連付けて記述しましょう。

4. 環境や時間帯を考慮する
光の当たり方や影、周囲の状況などもリアリティを高める重要な要素です。
「夕暮れ時の公園で、数匹の犬たちが思い思いの場所に座ったり、匂いを嗅いだりしている。オレンジ色の夕日が彼らを優しく照らしている」
のように、時間帯や場所の雰囲気を具体的に伝えることで、より自然な情景が生まれます。

5. ネガティブプロンプトを活用する
「同じポーズをしない」「ロボットのような動きをしない」「不自然な表情をしない」
といったネガティブプロンプト(生成してほしくない要素)を指定することで、AIはより自然な画像を生成するように調整されます
まとめ
AI画像生成で複数動物のリアルな画像を生成するには、AIが学習したパターンを理解しつつ、より具体的で個性的な指示を与えることが重要です。
ぜひ今回ご紹介したコツを参考に、あなただけのリアルな動物たちの世界を作り出してみてください。


(おまけ)AIが同じようなポーズを生成してしまった画像を貼ってく
プロンプトあり
Eight Cornish Rex kittens resting together, each kitten fully visible, separated heads and bodies, natural coat colors, short wavy fur, simple towel background, photorealistic, high resolution

子猫3匹がフローリングの床で大の字になってあおむけに寝転がっている画像を作って。リアル写真風、横長、高画質で

子猫2匹が遊び疲れてカーペットに寝そべってる画像を作って。カーペットの暖かさに気持ちよくなっている表情にして。リアル写真風、横長、高画質で

顔をカーペットにへばりつけるような体勢にして。それと2匹をもう少し離して

Full body shot of three kittens sleeping on their sides, lined up in a row on a bed, snuggled closely, distinct separate bodies, paws visible and neatly tucked, soft natural lighting, anatomically correct.

Row of kittens sleeping side by side, snuggled perfectly aligned like sardines, identical poses, rhythmic composition, peaceful faces, soft linen sheets.




プロンプトなし





