ChatGPTの「gen-ID」を使って理想のイラストを制作する

ChatGPTを使って例えば動物のイラストを書いてもらおうとしても、なかなか思うようなイラストが出てこない、という悩みありませんか。

ChatGPTでイラストを作成したい方、試しに次の手順でイラストを作成してみてください

今回のポイントは「gen-ID」を使うことです!

目次

gen-IDの意味の詳細

「gen-ID」は、「生成(generation)ID」の略で、DALL-EなどのAIが画像を生成する際に、それぞれの画像に一意の識別番号として割り当てられるものです。

このIDは、生成された画像を特定するために使われます。

たとえば、複数の画像を生成したときに、どの画像がどのプロンプトに対応するかを明確にするために役立ちます。

DALL-Eを使って画像生成を行う場合、画像ごとに異なるgen-IDが割り当てられます。

これにより、生成された画像がプロンプトに基づくものであることを確認し、後から見返したり、特定の画像について指示を出したりする際に役立ちます。

gen-IDを理解するために、実際の具体例を下記に載せました。

モデルとして大谷翔平選手の愛犬のデコピンの始球式をイメージとして作成してみました。

イラストの作成は有料コースだけですが、無料コースの人もこの記事から有料コースでできることの参考にしてください。

STEP
デコピンの画像をサンプルとしてChatGPTに送ります

赤丸のマークから画像が送れます。
STEP
ChatGPTに「この画像の特徴を詳細に全て書き出してください。」とお願いします。
次のような内容が書き出されました。

この画像の特徴を詳しく解説します。

  1. 犬の姿
    • この犬は、全体的に細身で中型サイズの体型をしています。
  2. 顔の表情
    • 顔は正面を向いており、落ち着いた表情をしています。目は大きく、やや真剣な表情に見えます。
  3. 毛の色
    • 全体的に白と茶色の毛色を持ち、顔から耳のあたりにかけて茶色の毛が広がっています。
    • 体や顔の中央部分には白い毛が目立ち、鼻から額にかけて白い筋が走っています。
  4. 耳の形と位置
    • 耳は垂れていて、やや長めです。耳の毛もやや長く、柔らかそうな印象を与えます。
  5. 背景
    • 背景はぼかされており、緑と青の色合いで屋外の景色のように見えます。
STEP
Chatworkが書き出した文章を全て選択してChatGPTに返信(あるいはコピー&ペースト)して「この画像を生成して下さい。」とお願いします。

次のような2枚の画像を生成してくれました。

Here are the generated images based on your description. Let me know if there’s anything specific you’d like to adjust!

(あなたの説明に基づいて生成された画像がここにあります。調整したい特定の点があればお知らせください。)

できあがった画像はまだイラスト風になっていません。

STEP
ChatGPTに「gen-IDを教えて下さい。」とお願いします。

次のような答えが返ってきました。

以下がそれぞれの画像のgen-IDです。

  1. 最初の画像のgen-ID: AvTK7FgygTp4LI​​0Q
  2. 2番目の画像のgen-ID: ZEO9NhS4M0vKWaRI
STEP
最初の「AvTK7FgygTp4LI​​0Q」 この画像をイラスト風にして下さい。とお願いしました。

最初の写真

画像の特徴から書いた画像

gen-IDを指定して書いた画像

STEP
2番目の「ZEO9NhS4M0vKWaRI」 この画像をイラスト風にして下さい。とお願いしました。

最初の写真

画像の特徴から書いた画像

gen-IDを指定して書いた画像

今回の手順のまとめ

  • イラストにしたいモデルの写真をChatworkに送る
  • この画像の特徴を詳細に全て書き出してください。」とChatGPTに伝える。
  • Chatworkが書き出した文章をChatGPTに返信(あるいはコピー貼り付け)する。
  • この画像を生成して下さい。」とChatGPTに伝える。
  • 画像が生成されますが、まだこの段階ではイラスト風になっていません。
  • gen-IDを教えて下さい。」と伝える。
  • 教えてもらったgen-IDを指定して「この画像をイラスト風にして下さい。」と伝える。

応用形

始球式でデコピンか硬式の野球ボールをくわえてホームの大谷翔平選手のもとに一直線に駆け戻りました。

そこで、野球ボールをくわえたデコピンを描いてもらいました。

1枚目のイラスト

AvTK7FgygTp4LI0Q
この画像を硬式野球ボールをくわえたイラスト風にしてください。

うまく口にくわえてくれませんでした。

そこで、2番目のイラストは「口にくわえて」と詳細な条件を追加しました。

2枚目のイラスト

ZEO9NhS4M0vKWaRI
この画像を硬式の野球のボールを口でくわえたイラスト風にして下さい。

1枚目のイラストを再挑戦

再度1枚目のイラストに「口にくわえて」と詳細な条件を追加して書き直してもらいました。

AvTK7FgygTp4LI0Q
この画像を硬式野球ボールをしっかり口にくわえたイラスト風にしてください。

なかなか反骨精神があって、思わず苦笑いです。

イラストの書き出しでChatGPT 4oとDALL-Eのどちらを使った方がいいのか?

ChatGPTにこの質問をしてみました。

その回答は下記のとおりです。

ChatGPT-4(DALL-Eと統合されているもの)は、詳細なイラスト生成にとても適しています。
DALL-Eは特に画像生成に特化しているため、ChatGPT-4を通じて利用すると、高品質なビジュアルが得られやすいです。
DALL-E単独で使用するのも速くスタイルやバリエーションを得たい場合には良い方法ですが、ChatGPT-4と組み合わせることで、プロンプトの調整やガイダンスがより細かくでき、今回のように希望に近づけることが可能です。

今回の事例は、有料のChatGPT-4を使ったのですが、それで正解だったみたいです。

生成AIは、実際に作業をしながら確認して理解していくのがいいと思います。

大谷翔平選手やりましたね!ドジャースがWS第1戦、延長10回フリーマンの逆転満塁本塁打で劇的サヨナラ勝ち! 

このスコア・・・痺れますね!!

デジタルのAIもすごいけど、アナログの生の世界で大活躍する大谷翔平選手って最高ですね!

目次