DALL-E3:シード値で同じキャラクターの作成

DALL-E3の残念な点として指摘されているのは、ステーブルディフュージョンレベルの実写感のある画像を生成するのが難しく、ミッドレンジのようにシード値で同じ画像を生成できない点です。しかし、シード値を活用し、完全に同じではありませんが、似たような画像を生成する方法があります。どのようにシード値を利用してほぼ似たような画像を生成することができるのでしょうか。 その前に、シード値とは一体何なのでしょうか。

シード値とは?

簡単に説明すると、画像が持つ固有の番号です。通常、シード値はアルゴリズムによってランダムに生成され、この値をもとに画像が生成されます。 シード値がランダムに生成されるため、同じコマンドを入力しても毎回違う結果が出るのです。 これを逆に言うと、もしシード値を知っていれば、同じコマンドを入力するたびにほぼ似たような画像が生成されます。

ということは、同じコマンドを入力するたびにほぼ同じような出力ができるということです。 つまり、シード値は、結果の画像が一貫した属性を維持することを保証してくれる一種のレシピのようなものです。 各画像に固有のシード値があるため、異なる画像を正確に比較する際に使用することができます。しかし、シード値を見つけるのは簡単ではありません。 しかし、DALL-Eを使用すると、シード値を簡単に見つけることができます。

シード値で似たような画像を生成

DALL-E3で画像を生成しながらシード値を知る方法と、このシード値で似たような画像を生成する方法を説明します。 DALL-E3で生成された画像のシード値を知る方法は簡単です。次のようにDALL-E3に画像の生成を要請してシード値を教えてもらうだけです。

「オフィスで動画を編集しているYouTubeクリエイターを描いてください。 各画像のシード値も教えてください。」

DALL-E3

  1. For the first image: Seed value – 2847907771
  2. For the second image: Seed value – 2796138354

画像が生成され、各画像のシード値も教えてくれます。二つの画像のうち、好きな画像のシード値をコピーしておきます。このシード値でほぼ似たような画像を再作成することができます。しかし、もう一つ必要なものがあります。プロンプトです。 目的の画像をクリックした後、プロンプト情報ボタンをクリックしてプロンプトをコピーします。他の会話で似たような画像を生成する準備は終わりました。

DALL-E3

プロンプトは、画像へのアプローチ方法やガイダンスが表示されるので、プロンプトをよく見ることが重要です。プロンプトは、特定の質問に対する答えや強調すべき要素を提供することもあります。 プロンプトは、自分の考えやアイデアを効果的に伝え、より意図に沿った画像を作成するのに役立ちます。プロンプトは、画像を探索し、明確で簡潔な分析を提供するロードマップとして機能することを覚えておいてください。

同じような画像を作ってみましょう。 新しいDALL-E会話を開きます。 そして、次のように、前の会話で生成された1番の画像のシード値とプロンプトを利用して画像を生成するように要求します。英語部分からプロンプトを入力します。

「シード値: 2847907771を使用してください。下記のプロンプトを任意に変更せず、そのまま使用して画像を生成してください。A scene depicting a YouTuber editing videos in his office. The office is modern and well-lit, featuring a large desk with multiple monitors displaying video editing software. The YouTuber is focused on one of the screens, using a mouse and keyboard. The office is decorated with posters of famous movies and a bookshelf filled with film and video editing books. The room also has a comfortable chair, a coffee mug on the desk, and a window showing a cityscape view. The style is realistic.」

「シード値: 2847907771を使用してください。下記のプロンプトを任意に変更せず、そのまま使用して画像を生成してください。A scene depicting a YouTuber editing videos in his office. The office is modern and well-lit, featuring a large desk with multiple monitors displaying video editing software. The YouTuber is focused on one of the screens, using a mouse and keyboard. The office is decorated with posters of famous movies and a bookshelf filled with film and video editing books. The room also has a comfortable chair, a coffee mug on the desk, and a window showing a cityscape view. The style is realistic.」

DALL-E3

全く同じ画像ではありませんが、それでも人物と構図は比較的似たような画像が生成されます。 シード値とプロンプトを一緒に使用するだけで、強力な画像を再現します。ちなみに、シード値だけを入力すると、「画像生成時に特定のシード(seed)値を使用することはできません」と表示されます。この過程で重要なことがあります。このコマンドで「下記のプロンプトを任意に変更しないでそのまま使ってイメージを生成してください」という文を作成した後、プロンプトを入力しました。プロンプトを変更しすぎると、プロンプトが全く違う意味に解釈され、希望するものとは全く違う画像が生成されます。 したがって、希望する画像を得るために必要な場合のみプロンプトを修正します。

DALL-E3シード値で一貫性のある画像を生成する

コピーしておいた希望の画像のシード値を入力して画像を生成してもらいます。

「シード値: 2847907771を使って画像を生成してください。」

モニター画面や背景が微妙に変わりますが、ほぼ同じ画像が生成されました。 先に最初に作った画像とそのシード値で作った画像をそれぞれクリックした後、プロンプト情報ボタンをクリックしてプロンプトを確認してみましょう。 すると、全く同じプロンプトが書かれていることが確認できます。

このように、同じダイアログ内では、シード値を入力するだけで、ほぼ同じような画像を生成することができます。このような特性を活用すれば、キャラクターを維持しながら様々な形の画像を生成することができます。プロンプトの内容をいくつか修正して確認してみましょう。

DALL-E3プロンプトの修正

画像プロンプトのうち、シングルモニターをマルチモニターに、ポスターの装飾から風景画に、男を女に、窓の外の風景を街から海に変更します。

「シード値: 2847907771を使用してください。以下のプロンプトを任意に変更せず、そのまま使用して画像を生成してください。A scene depicting a woman YouTuber editing videos in her office. The office is modern and well-lit, featuring a large desk with multiple monitors displaying video editing software. The YouTuber is focused on one of the multiple monitors, using a mouse and keyboard. The office is decorated with landscape paintings a bookshelf filled with film and video editing books. The room also has a comfortable chair, a coffee mug on the desk, and a window showing a ocean view. The style is realistic.」

DALL-E3

プロンプトの一部を変更すると、構図と人物を維持したまま新しい画像を生成してくれます。プロンプトやシード値を勝手に調整してはいけません。 シード値は生成された画像の固有番号なので、変更すると予想外の結果が発生したり、他のデータと衝突する可能性があります。

人物のキャラクター性を維持しながら様々な形の画像を生成するにはどうすればよいでしょうか? シード値だけを活用して新しいプロンプトを作成すればよいです。 04 次のように、プロンプトの内容を書かないで、ポッドキャストを撮影している様子 の画像を生成してもらいましょう。参考までに、韓国、女性、ユーチューブクリエイターのような人物の特性を表す最小限の説明を一緒に入力してください。 そうしないと、予想と全く違う画像が生成される可能性があります。

「シード値:2847907771を使用してください。ポッドキャストを撮影している韓国の女性ユーチューブクリエイターの画像を生成してください。」 既存の人物をそのまま維持しながら、ポッドキャストに合った自然な構図に変更しました。どうやら、ポッドキャストと映像編集は、机の上でできること、カメラを活用することという類似性があるため、比較的簡単に描写されたようです。では、全く類似性のない他の形態の活動を扱う画像も作成できるのでしょうか?先ほど変に出てきた運動している様子をもう一度リクエストしてみましょう。

シード値と一緒にフィットネスセンターで運動する姿をリクエストしてみます。 「シード値: 2847907771を使用してください。フィットネスセンターで自分が運動している姿を撮影している韓国の女性ユーチューバーの画像を生成してください。」

人物をそのまま維持しながら、背景と構図が自然に変わりました。 このように、同じシード値に人物の特徴を表す最小限の説明をプロンプトで作成すると、活動の形態が変わっても、人物間の類似性をかなり反映することができます。 つまり、個人の特性、行動、特徴を物語に盛り込むことで、画像内の人物を類似した形で描写することができるのです。 このような人物描写は、ストーリーテリングの深みを増すだけでなく、ストーリー内の様々な人物間の繋がりやコントラストを表現するためにも不可欠です。 人物のストーリーテリングを正確に理解することができれば、同じ人物で一貫性のある画像を作成することができます。 人物の描写が、その人物のストーリーに合うように徹底的に組み立てられていれば、今後作成する画像のテーマに貢献し、一貫性を保つことができます。実際に

で先ほどは単に「オフィスで動画を編集しているYouTubeクリエーターを描いてください」とだけ依頼しましたが、次のように細かくプロンプトを書いて依頼すると、より豊かなイメージを生み出すことができます。

日本の若い女性YouTubeクリエイターがモダンなデスクに座って、デュアルモニターで動画を編集している様子です。 彼女は、画面にカラフルなタイムラインが見えるプロの動画編集ソフトを使用しています。オフィスは柔らかな照明があり、本やYouTubeの再生ボタンがたくさんある本棚があり、居心地の良い雰囲気を醸し出しています。カメラと三脚が近くにあり、録画を終えたばかりであることを示しています。

DALL-E3

まとめ

Dall-E3のシード値活用法は、同じ画像でも好きなように変形し、キャラクターを飾り、ストーリーを作ることができる機能です。シード値とプロンプトを活用して個人の想像力を表現し、創造的なコンテンツを制作するのに大きな助けになるでしょう。 今後、さらに発展した技術と様々な機能が追加されれば、Dall-E3のシード値活用法はさらに大きな可能性を開くでしょう。