画像生成AIで「複数のキャラ」が上手く描けない！顔が崩れる理由と一発成功の「言葉のコツ」

25/11/0926/06/01

Four kittens are playfully tumbling on lush green grass, but some anatomical inconsistencies are present. One kitten’s front paw appears unnaturally elongated, and another has an open mouth rendered in a way that defies realistic jaw structure. While the scene conveys lively interaction and bright sunlight enhances the fur and grass, certain body parts exhibit visual inaccuracies that disrupt photorealistic coherence. 青々とした芝生の上で、4匹の子猫がじゃれ合っているが、一部の子猫の前足や口元に不自然な描写が見られる。前足が過剰に長く伸びていたり、口の開き方が実際の骨格構造に合わない形で描かれており、遊びの動作としては活気があるものの、身体の一部に破綻が生じている。明るい日差しが毛並みと芝生を鮮やかに照らしているが、全体としてはリアリズムに欠ける部分がある

「画像生成AIで複数キャラを描かせたら顔が崩れた…」

そんな悩みはありませんか？

AIが複数の対象を同時に描くのが苦手な理由と、プロンプトの「言葉の並べ方」を変えるだけで精度を劇的に上げる「4つのコツ」を、初心者の方にも分かりやすく解説いたします。

⚠️あらかじめご了承ください

この記事は2025年11月9日時点の情報・AIモデルをもとに執筆しています。今後のアップデートにより、機能や生成結果が変わる可能性があります。

【閲覧にあたっての注意点】

画像の再現性と一貫性について： 本記事の画像は、実在しないAI生成イメージです。
プロンプトについて： 紹介したプロンプトは、全く同一の画像の生成を保証するものではありません。ご参考までにお使いください。

INDEX

なぜか画像が崩れる…その「悩み」には理由があります

画像生成AIを使い始めたばかりの方が、よくこんな壁にぶつかります。

「3人のキャラクターが楽しそうに話しているシーン」を頼んだら、顔が混ざったり、手足が変な方向を向いたりした…

「猫が3匹、それぞれ違うポーズで寝ている」とお願いしたら、どれも同じポーズになったり、顔が潰れてしまった…

これは、あなたの指示が悪いわけではありません。

画像生成AIが持つ「曖昧（あいまい）さへの弱さ」と「同時処理の難しさ」が原因です。

この記事では、「なぜ複数の対象を描かせると画像が荒れるのか」という理由と、それを解決する「プロンプト（指示文）の具体的なテクニック」を、猫の例を使って分かりやすく解説しましょう。

なぜAIは「複数・別々」の指示が苦手なのか？

AIは「なんとなく良い感じに」が一番苦手です。

私たちが「3匹の猫がそれぞれ違う寝方で」と指示したとき、AIは以下の処理を同時に行おうとして混乱してしまいます。

「3匹」という数を認識する
「猫」という対象を描く
「違う寝方」を3パターン考える
「それぞれ」に割り当てる

特に「それぞれ」「違う」といった言葉は、人間にとっては自然ですが、AIにとっては「じゃあ、具体的にどう違うの？どこに配置するの？」という情報が足りず、結果として以下のような失敗が起こりがちです。

ディテールの崩壊
- 顔や手足の描写が雑になり、潰れたり混ざったりする（構成を優先して細部が後回しになるため）
情報の混同
- 「丸まった猫」と「伸びた猫」の特徴が混ざってしまう
配置の失敗
- 3匹が重なってしまったり、遠近感が不自然になったりする

生成AIに共通して言えること

曖昧な指示に弱い

「それぞれ」「違う寝方」「リラックス」などは人間には自然でも、AIには曖昧で解釈が分かれるため、初回生成で荒れやすいです。

「三匹の猫がそれぞれ違う寝方で…」のように抽象的だと、どのAIでも初回は構図が不安定になりやすいです。

複数要素の同時指定に弱い

猫のポーズ・数・環境・光源などを一度に指定すると、初回は「とりあえず全部入れる」方向に走り、細部が粗くなります

改善は“構造化”で安定する

順番・位置・色・光源などを具体的に書くと、どのAIでも精度が上がります。この後詳しく解説します

劇的改善！「曖昧な言葉」を「具体的な設計図」に変える

では、どうすればよかったのでしょうか？

ここで、冒頭の「猫が3匹いる画像」のプロンプトを例に、Before（改善前）とAfter（改善後）を比較してみましょう。

Before: 曖昧で「丸投げ」なプロンプト

「日当たりの良い窓辺で、三匹の子猫がそれぞれ違う寝方でリラックスして昼寝をしている。一匹は仰向け、一匹は丸まり、もう一匹は伸びて眠っている。リアル写真風、最高画質、横長」

これでも要素は入っていますが、「それぞれ」や「一匹は〜」という言葉は、AIにとって「設計図」としては不十分です。

このプロンプトで生成された画像がこちら。

Three kittens napping on a sunny windowsill: one lying belly-up, one curled in a ball, and one stretched out, bathed in warm afternoon light. The depiction of the kittens’ feet at both ends is rough, and the ginger tabby on the left shows additional coarseness in its fur and facial details. 日差しの差し込む窓辺で昼寝する３匹の子猫。１匹は仰向けでへそ天、１匹は丸まって、もう１匹は伸びて眠っている。両端の子猫の足の描写が荒く、左の茶トラは毛並みや顔の描写にも粗さが見られる — Copilotで生成

子猫の描写が粗くなりました。特に、左の茶トラの子の毛並みや部位の粗さが目立ちます。

ChatGPTでも試してみました。

「寝相も個性も三者三様。ぽかぽか窓辺は、子猫たちの最高の昼寝スポット🐾☀️」Three kittens napping by a sunny window, each sleeping in a different relaxed pose, photographed in a realistic style. 日当たりの良い窓辺で、三匹の子猫がそれぞれ違う寝方でリラックスして昼寝している様子 — ChatGPT Images 1.5で生成

一見問題なさそうに見えますが、一番左のキジ白子猫の後ろ足が不自然に裏返ってしまってます。

（2026年6月追記）年々画像生成の精度は向上してきましたが、それでもやや不自然なポーズになるなどの破綻が出ることがあります

「無防備すぎる寝姿にキュン💘 どんな夢を見ているのかな？起こさないように、そーっとね🤫🐾 #猫好きさんと繋がりたい」Ultra-realistic high-quality photograph of three adorable kittens napping in various poses on a towel by a sunny window. A brown and white tabby sleeps fully on its back, a brown tabby curls up, and another brown and white tabby stretches out on its side, with fresh green foliage visible outside. 明るい日差しが差し込む窓辺のタオルの上でお昼寝する3匹の子猫のリアルな写真。左のキジ白は完全に仰向けになりピンクのお鼻を見せて無防備に眠り、中央のキジトラは背中を丸めて顔を隠し、右のキジ白は横向きで手足を投げ出してリラックスしている。背景の窓越しの緑が爽やかさを演出している — ChatGPT Images 2.0で生成

なぜかこのプロンプトだと部位が破綻する確率が高まります。

After: 具体的で「構造化」されたプロンプト

「午後の柔らかい日差しが差し込む窓辺で、左から順に、茶トラの子猫がへそ天で、キジトラの子猫が丸まって、グレー白の子猫が伸びて眠っている。安心しきった表情だ。リアル写真風、最高画質、横長構図で」

言葉の表面だけ見ると少し長くなっただけですが、これだけでAIが受け取る情報の「精度」が上がります。

このプロンプトで生成された画像がこちら。

Three kittens nap peacefully on a sunlit windowsill: an orange tabby lies belly-up, a brown tabby curls into a ball, and a gray-and-white kitten stretches out, all bathed in warm afternoon light. 午後の柔らかな日差しが差し込む窓辺で、茶トラはへそ天、キジトラは丸まり、グレー白は伸びのポーズで、安心しきった表情で昼寝している — Copilotで生成

これでも荒さは見られるものの、初回生成の精度の差は明らかです。

ChatGPTもご覧の通り描写の精度が上がりました。

「午後の日差しを独り占め。へそ天、まるまり、のび〜。三者三様のしあわせ昼寝タイム🐾」Three kittens sleeping by a sunlit window in the afternoon: an orange tabby lying on its back, a brown tabby curled up, and a gray and white kitten stretched out, all looking peaceful. 午後の柔らかな日差しが差し込む窓辺で、茶トラ、キジトラ、グレー白の子猫がそれぞれ違う寝姿で安心して眠っている様子 — ChatGPT Images 1.5で生成

「ぽかぽか太陽の下で、夢の中へ…💤 見ているだけで癒される、天使の寝顔をおすそわけ👼✨ #お昼寝猫 #癒し」Ultra-realistic high-quality photograph of three kittens sleeping peacefully on a soft towel by a sunlit window. An orange tabby sleeps on its back, a brown tabby curls up in a ball, and a silver tabby and white kitten stretches out on its stomach, bathed in warm natural light. 窓辺の柔らかいタオルの上で身を寄せ合って眠る3匹の子猫のリアルな写真。左の茶トラは仰向けでバンザイのポーズ、中央のキジトラはアンモナイトのように丸まり、右のサバ白は前足を長く伸ばしてうつ伏せになっており、柔らかな自然光が被毛のふわふわとした質感を際立たせている穏やかな情景 — ChatGPT Images 2.0で生成

なぜ「After」のプロンプトで精度が上がったのか

改善後のプロンプトは、AIが迷う「曖昧さ」を徹底的に排除し、誰が・どこで・何をしているかを「構造化」しています。

これが一発成功の最大のコツです。

1. 構図の固定（「どこに？」を明確に）

Before: 「三匹の子猫がそれぞれ違う寝方で…」（どこにいるか不明）
After: 「左から順にへそ天・丸まり・伸びの順で寝ている」

AIが最も迷う「配置」を固定しました。

これにより、AIは「どこに何があるか」明確に理解するため、猫同士が重なったり、空間が歪んだりするのを防げます。

順番・位置・向きを明示すると空間配置が安定しやすい

2. 個体の具体化（「誰が？」を明確に）

Before: 「三匹の子猫」（見分けがつかない）
After: 「茶トラの子猫」「キジトラの子猫」「グレー白の子猫」

対象を具体的にすることで、AIは「3つの別々の個体」として認識しやすくなります。

これにより、顔や模様が混ざるのを防ぎ、「へそ天」というポーズは「茶トラ」にだけ割り当てられるようになります。

猫の種類や毛色・模様を明記することで個体識別がしやすくなり、模様や色の混同が減る

3. 環境と光の指定（「どんな場所？」を明確に）

Before: 「日当たりの良い窓辺」（光の方向が不明）
After: 「午後の柔らかい日差しが差し込む窓辺」（光の質と方向が安定）

光源を具体的にすることで、AIは影の付け方や毛並みの立体表現に迷わなくなります。

これが「リアル写真風」のクオリティを底上げします。

光源と時間帯の指定により、光の方向と質感が安定し、毛並みや影・立体感の描写が自然になる

4. 雰囲気と感情の指定（「どんな様子？」を明確に）

Before: 「リラックスして昼寝」
After: 「安心しきった表情で気持ちよさそうに眠っている」

感情や雰囲気を添えることで、AIはポーズの「ニュアンス」を掴みやすくなります。

「安心しきった」という言葉が、「へそ天」や「伸び」といった無防備なポーズの説得力を高めます。

表情やポーズの自然さが向上し、感情的な共感を呼ぶ画像になりやすい

5. スタイルや品質の指定

「リアル写真風・最高画質・横長構図」など、スタイルを指定する

生成エンジンが迷わずスタイルを選べる

初心者でもOK！一発成功率を上げる「4つのコツ」

猫の例はあくまで一例ですが、このテクニックは複数のキャラクター、動物、アイテムを配置するあらゆるシーンで応用できます。

AIに「いい感じの画像」を一発で出させたい時、プロンプトに以下の「4つの柱」を意識して盛り込んでみてください。

「配置」を決める
- 左から順に、A、B、Cが並んでいる
- 中央にAが立ち、その背景にBがいる
- 手前にA、奥にB
「対象」を具体的にする
- （NG）2人の女性 → （OK）赤いドレスの女性と、青いシャツの男性
- （NG）犬と猫 → （OK）金色のレトリバーと、黒い猫
「環境・光」を指定する
- 夕暮れの逆光
- 雨上がりの濡れたアスファルト
- ネオンが反射する夜の街
「雰囲気・感情」を添える
- 楽しそうに笑いながら
- 緊張した面持ちで見つめ合う
- 静かで穏やかな雰囲気

プロンプト例の紹介

誰が・どこで・何をしているかを指定したプロンプト例をいくつかご紹介します。

リビングで3匹の子猫が遊んでいる。1匹は猫じゃらしに飛びかかっていて、1匹は仰向けでじゃれていて、もう1匹は顔を洗っている。楽しそうな雰囲気。リアル写真風、高画質。

「驚異のジャンプ力！🚀 おもちゃに夢中な茶トラちゃんと、後ろで冷静に毛繕いするグレーちゃんの対比が最高😸✨」Wide shot of three kittens in a sunlit living room. A fluffy ginger kitten leaps into the air to catch a feather toy, while a calico kitten plays on its back and a grey kitten sits on the sofa washing its face. 日差しが入る明るいリビングで遊ぶ3匹の子猫。ふわふわの茶トラが猫じゃらしに向かって空中で大きくジャンプし、三毛猫は仰向けでじゃれ、グレーの子猫はソファの上でマイペースに顔を洗っている — Gemini (Nano Banana Pro) で生成

「「とったどー！」必死に手を伸ばすキジトラちゃん🐾 その横で「身だしなみ第一」な茶トラちゃんに癒やされる〜🥰🧡」Three kittens playing on a fluffy rug. A tabby kitten stands on its hind legs reaching for a colorful toy, a piebald kitten rolls on its back, and a ginger kitten sits aside, busy washing its face with its paw. ラグの上で遊ぶ3匹の子猫たち。キジトラが後ろ足で立ってカラフルな猫じゃらしに手を伸ばし、白キジは仰向けで転がり、茶トラは横で前足を使って熱心に顔を洗っている — ChatGPT Images 1.5で生成

「遊びのスタイルも三者三様🐈💨 みんなはどの子と一緒に遊びたい？コメントで教えてね👇✨ #猫のいる暮らし #子猫」Ultra-realistic high-quality photograph of three playful kittens on a rug in a sunlit living room. A silver tabby stands on its hind legs reaching for a colorful feather toy, an orange tabby rolls on its back showing pink paw pads, and a brown tabby sits grooming its paw. 陽光が差し込む明るいリビングのラグマット上で遊ぶ3匹のリアルな子猫の写真。左ではアメリカンショートヘア風のサバトラが後ろ足で立ち上がりカラフルな猫じゃらしに夢中で手を伸ばし、中央では茶トラが仰向けで肉球を見せてじゃれつき、右側ではキジトラがちょこんと座って毛づくろいをしている、躍動感と日常の愛らしさが詰まった情景 — ChatGPT Images 2.0で生成

リビングで3匹の子猫が遊んでいる。左から順に、キジトラの子猫が猫じゃらしに飛びかかっていている、茶トラの子猫が仰向けでおもちゃとじゃれている、三毛の子猫が顔を洗っている。楽しそうな雰囲気。リアル写真風、高画質、横長構図

「リビングはすっかり子猫たちの遊び場に🐈💨それぞれ夢中で遊ぶ姿がたまらなく可愛いですね💕 #子猫のいる生活 #猫好きさんと繋がりたい #猫のいる暮らし」Ultra-realistic high-quality photograph of three adorable kittens playing in a sunlit living room. On the left, a tabby kitten jumps energetically at a cat teaser. In the center, a ginger tabby lies on its back playing with a toy. On the right, a calico kitten sits grooming its face, capturing their distinct personalities and detailed fur textures in a lively scene. 柔らかな自然光が差し込むリビングルームで、元気に遊ぶ3匹の子猫たちを捉えた超高画質な写真。左側ではキジトラの子猫が猫じゃらしに向かって大きく躍動的にジャンプし、中央では茶トラの子猫が仰向けに転がっておもちゃとじゃれ合っています。右側では三毛の子猫がちょこんと座って顔を洗う愛らしい仕草を見せており、それぞれの毛並みの質感や活発な様子がリアルに描かれた情景です — ChatGPT Images 2.0で生成

冬の穏やかな午後、障子から柔らかい光が差し込む古びた縁側で。左に、サバトラの成猫が毛布の上で香箱座り。右に、白猫の成猫がサバトラの隣に寄り添い、大きなあくびをしている。平和で温かい雰囲気、安心しきった表情。リアル写真風、高解像度、シネマティック、横長構図。

英文プロンプト（クリックしてください）

A peaceful afternoon in winter on an old wooden porch with soft light filtering through paper shoji screens. On the left, a silver tabby cat is sitting in a loaf position on a blanket. On the right, a white cat is cuddled next to the tabby, yawning widely. A peaceful and warm atmosphere, a safe expression. Realistic photo, high resolution, cinematic lighting, wide-angle horizontal composition.

「ポカポカ陽気でつられてあくびが出ちゃうニャ〜🥱☀️ キリッとしたお顔と大あくびのギャップの対比が最高すぎるコンビです👬💕」Ultra-realistic high-quality photograph of two cats relaxing on a sunny Japanese engawa (porch). A sharp-looking silver tabby sits neatly next to a fluffy white cat catching a big yawn. The warm sunlight and shadows create a peaceful afternoon atmosphere. 日差しが差し込む明るい縁側（または和室の窓辺）で、仲良く並んで香箱座りをする2匹の猫。左側にはキリッとした表情のサバトラ（アメリカンショートヘア風）、右側には目を細めて豪快に大あくびをする真っ白な猫が寄り添っています。障子やガラス戸越しの暖かな光と影のコントラストが、長閑な午後の時間を美しく描き出す高品質な写真です — ChatGPT Images 2.0で生成

近未来的な宇宙船のコクピットで。左に、ベンガルの成猫が複雑な計器の上に座り、窓の外の星雲を真剣に見ている。中央に、アビシニアンの成猫がベンガルの肩越しに、同じ方向を好奇心に満ちた目で。右に、アメリカンショートヘアの成猫が操作レバーに前足をかけ、遊びたそうにしている。冒険心と好奇心、サイバーパンク。ハイパーリアリスティック、4K、ドラマティックなライティング、横長構図。

英文プロンプト（クリックしてください）

Inside the cockpit of a futuristic spaceship. On the left, a Bengal cat sits on complex instruments, intently looking out the window at a nebula. In the center, an Abyssinian cat peers over the Bengal’s shoulder in the same direction with curious eyes. On the right, an American Shorthair cat has its front paw on a control lever, looking playful. A sense of adventure and curiosity, cyberpunk style. Hyperrealistic, 4K, dramatic lighting, horizontal composition.

「全員配置につけ！にゃんこ艦隊、新たなちゅ〜るの星を求めてワープ準備完了です🚀🌌🐈 #宇宙猫 #SF #猫好きさんと繋がりたい」Ultra-realistic high-quality photograph of a Bengal cat, an Abyssinian, and a tabby cat holding a control stick on the bridge of a futuristic spaceship, looking out at a glowing nebula, beautifully blending sci-fi elements with feline grace. 近未来的な宇宙船のブリッジで、星雲が輝く窓の外を見つめるベンガル猫とアビシニアン、そして操縦桿を握るキジトラ猫の情景。計器類の青い光と猫たちの真剣な横顔がマッチしたSFチックな超高画質な写真です — ChatGPT Images 2.0で生成

古びた魔法使いの書斎、夜、ランプの光。左に、シャムの成猫が小さなとんがり帽子を被り、棚の上の大鍋を見下ろしている。中央左に、ペルシャの成猫がミニチュアマントを羽織り、開いた魔導書の上に座って文字を前足で。中央右に、三毛猫の成猫が羽ペンを前足で弄んでいる。右に、ハチワレの成猫が棚の上の光るガラス瓶を見つめている。コミカルで神秘的、絵本のような世界。リアル写真風だがファンタジー要素、高詳細、横長構図。

英文プロンプト（クリックしてください）

An old wizard’s study at night, illuminated by a lamp. On the left, a Siamese cat wearing a small pointed wizard hat sits looking down into a cauldron on a shelf. In the center-left, a Persian cat wearing a tiny cape sits on an open magic book, pointing at the characters with a paw. In the center-right, a calico cat plays with a quill pen with its paw. On the right, a black and white tuxedo cat stares at glowing glass bottles on a shelf. Comical and mysterious, like a storybook world. Realistic photo with fantasy elements, high detail, horizontal composition.