話題の生成AI。先日伊藤園のおーいお茶の新しいCMがAIを使用して作成されたとして大変話題となっておりました。

着用モデルさんをキャスティングしたり、撮影するのは費用がかかりがちですが、AIを使用して着用画像が作成できれば社内で運用することができますし、後からリテイクするのも簡単です。

今回はStable Diffusionを使用して、どれくらいの画像が作成できるのか、テストしてみたいと思います。

 

Stable Diffusion にBRAV7を入れて作成

今回はGoogle のColabにStable Diffusionを入れて画像を作成していきます。使用したツール等は以下の通りです。

  • Stable Diffusion
  • モデル = BRAV7
  • LoLA = なし
  • プロンプト = ChatGPT
  • アプリ = Photorealistic

写真で撮影したようなアジア系の人物の画像生成が得意なモデル”Beautiful Realistic Asians”の最新バージョン(7)を読み込んで画像を生成してみます。

(BRAV7はcivitaiでダウンロードできます)

 

プロンプトはChatGPTで生成

よりリアルな画像を生成するため、ChatGPTにプロンプトを考えてもらいます。

日本語をを入れると画像生成用のプロンプトを生成してくれるアプリ”Photorealistic”をインストールしてプロンプトを作成します。

Photorealisticで生成されるプロンプトはmidjourney用になっていますので、ar 16:9 –v 5.1 –style raw –q 2 –s 750 といった部分は削除します。

 

ここは削除して記載
ここは削除して記載

 

画像を作成してみる

ChatPGTにモデルさんの画像のイメージを伝えます。

25歳前後の綺麗な日本人女性のファッションモデル。白いシャツを着ており、指を胸元に当てている。斜めからの角度の写真。

完成したプロンプトは以下の通り。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: modern fashion editorial with a touch of elegance, lighting: soft directional light casting gentle shadows, colors: monochromatic with emphasis on whites and subtle skin tones, composition: Canon EOS R5 mirrorless camera, RF 50mm f/1.2L USM lens, resolution: 45 megapixels, ISO sensitivity: 100, shutter speed: 1/200 second, depth-of-field: f/2, angled shot capturing her with a white shirt, finger touching her chest, evoking a sense of contemplation

こちらを入れ込んでみます。

 

ネガティブプロンプトはこんな感じです。

(worst quality:2) , (low quality:2) , (normal quality:2) , lowres , bad anatomy , missing fingers , bad hands , monochrome , grayscale , watermark , bad legs , bad arms , mole

 

Stable Diffuionの詳細設定

よりリアルな画像を生成するため、いろんな記事を参考に設定したパラメータがこちらです。もっといいパラメータがあるかもしれませんので研究してきます。

 

 

 

生成された画像がこちら

 

結構いい感じではないでしょうか。

白いドレスも統一感がありますし、みんな横を向いているのでイヤリングやリングを着用させやすい画像素材になっていると思います。光の当たり加減もいい感じですね。

 

黒いドレスのバージョンも作成してみました

 

黒いドレスの感じもかなりいい具合に生成されていますね。こんな感じでさまざまなシチュエーションで作成していきます。

 

空間の雰囲気を指示

背景もいい感じに調整できるのかやってみます。コンクリートで覆われた部屋でシックな雰囲気の背景を目指してみたいと思います。プロントはこちら。

25歳前後の綺麗な日本人女性のファッションモデルの写真。ジュエリーの撮影用。シックなドレスを着ており、正面を向いている。室内は暗く、無機質な撮影スタジオで撮影された。壁は一面コンクリート。上半身から上。胸元に手を当てている。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: luxury jewelry editorial with an industrial edge, lighting: dim, yet focused spotlight highlighting the gleam of the jewelry and the upper part of the chic dress, casting a gentle shadow on the raw concrete wall, colors: muted tones of the dress contrasted with the radiant shimmer of the jewelry and the cold gray of the concrete, composition: Canon EOS R6 mirrorless camera, RF 50mm f/1.2L USM lens, resolution: 20.1 megapixels, ISO sensitivity: 320, shutter speed: 1/160 second, depth-of-field: f/2.0, upper torso shot capturing her intense gaze, hand poised at her chest emphasizing the jewelry, set against the stark, inorganic backdrop of a concrete studio wall

 

結果がこちら。

 

背景のコンクリート感もしっかり出せているようです。

 

ロケ地を海辺に設定

ハワイアンジュエリーであるような、常夏の海を思わせる画像を作成してみます。

プロンプトはこちら。

25歳前後の綺麗な日本人女性のファッションモデルの写真。ハワイアンジュエリーを身につけている。シックなドレスを着ており、右手で髪をかき上げている。青空の夏。背景には海と砂浜が見える。上半身から上の写真。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: summer luxury editorial celebrating Hawaiian jewelry, lighting: bright sunlight casting a warm glow on her skin, reflecting off the jewelry, colors: deep tones of the chic dress harmonizing with the vibrant blue of the sky and ocean, shimmer of the Hawaiian jewelry adding a touch of brilliance, composition: Nikon Z7 II mirrorless camera, NIKKOR Z 50mm f/1.8 S lens, resolution: 45.7 megapixels, ISO sensitivity: 100, shutter speed: 1/250 second, depth-of-field: f/2.5, upper torso shot capturing her as she gracefully sweeps her hair up with her right hand, showcasing the jewelry, set against the backdrop of a pristine beach and azure sea

 

結果がこちら。

 

右手でかき上げる、といった腕の指定はなかなかうまく再現することができませんでした。特定の部位をうまくコントロールするにはもうすこし研究が必要そうです。

背景の海や砂浜の雰囲気はしっかりと反映されておりました。

 

ロケ地を山林に設定してみる

自然志向のイメージを持つブランド様であるような山の中での画像を作成してみます。

プロンプトはこちら。

25歳前後の綺麗な日本人女性のファッションモデルの写真。ジュエリーを身につけている。白のドレスを着ている。上半身から上の写真。山の中で撮影している。木に囲まれていて、川がある。自然の美しい明かりに照らされていて、神秘的な雰囲気。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: ethereal woodland elegance showcasing the jewelry, lighting: soft natural light filtering through the trees, casting dappled shadows and illuminating her in a mystical glow, colors: pristine whites of the dress harmonizing with the verdant greens of the forest and the clear blue of the river, the jewelry shimmering with nature’s brilliance, composition: Canon EOS R5 mirrorless camera, RF 50mm f/1.2L USM lens, resolution: 45 megapixels, ISO sensitivity: 160, shutter speed: 1/125 second, depth-of-field: f/2.8, upper torso shot capturing her amidst the serene mountain setting, adorned in a white dress and radiant jewelry, surrounded by trees with the gentle flow of a river nearby, evoking a sense of nature’s enchantment

 

結果がこちら。

 

自然の中の感じがかなりよくできています。木漏れ日の雰囲気もいいですね。

 

ロケ地を夜のストリート。ストリート風のアクセサリー画像

少し方向性を変えてストリート風のアクセサリー画像を作成してみます。

プロンプトはこちら。

25歳前後の綺麗な日本人女性のファッションモデルの写真。ストリートスタイルのアクセサリーを身につけている。黒のパーカーを着ている。上半身から上の写真。夜の街。ネオンに照らされている。胸元に手を当てている。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: urban night-time editorial emphasizing street-style accessories, lighting: vibrant neon lights casting a dynamic array of colors on her, creating a moody and edgy ambiance, colors: deep blacks of the hoodie contrasted with the radiant neon hues reflecting off her skin and accessories, composition: Canon EOS R5 mirrorless camera, RF 50mm f/1.2L USM lens, resolution: 45 megapixels, ISO sensitivity: 800, shutter speed: 1/80 second, depth-of-field: f/2.4, upper torso shot capturing her in the pulsating heart of the city, hand touching her chest, adorned in a black hoodie and street-style accessories, set against the backdrop of a neon-lit urban nightscape

 

結果がこちら。

 

黒のパーカーを全然着てくれない問題にぶつかりましたが、結果的にいい画像が生成できました。夜のストリート感も出せているかと思います。

 

 

ロケ地を月面にしてみる

実際にはあり得ない、もしくはコストがかかりすぎる場所で撮影したイメージを作ってみます。

プロンプトはこちら。

25歳前後の綺麗な日本人女性のファッションモデルの写真。ジュエリーを身につけている。黒のドレスを着ている。月の上に立っており、女性の後ろには青い地球が見える。背景は宇宙。上半身から上。

Fashion model, Japanese woman in her mid-20s, medium: hyper-realistic photography, style: cosmic elegance showcasing the jewelry, lighting: ethereal lunar illumination highlighting her features and the jewelry’s sparkle, with the distant Earth casting a tranquil blue radiance, colors: deep blacks of the dress contrasted with the silvery moon and the vibrant blue of Earth, the jewelry shimmering with celestial brilliance, composition: Nikon Z7 II mirrorless camera, NIKKOR Z 50mm f/1.8 S lens, resolution: 45.7 megapixels, ISO sensitivity: 100, shutter speed: 1/50 second, depth-of-field: f/2.5, upper torso shot capturing her poised atop the moon, adorned in a black dress and radiant jewelry, with the mesmerizing backdrop of Earth set against the vastness of space

 

結果がこちら。

 

何度調整してもなかなか月面っぽい感じにすることができず、かなり苦戦した中でもマシだった2枚です。月面でドレスを着て撮影、といった非現実絵的な内容はまだ研究が必要なようです。

 

まとめ

いかがでしたでしょうか。

生成AIを用いてモデルさんのイメージを作成してみました。自社製品の商品をレンダリングして、着用画像に馴染ませることができれば、自社製品の着用画像をいい感じに作成できるようになるかもしれません。

生成AIを活用することで、着用イメージの作成方法もより効率化できるかもしれません。

 

AIで着用画像を作成

ENCODEでは生成AIを活用した着用画像のご相談を承っております。お気軽にご相談ください。

生成AIでモデルを生成し、色々なジュエリーの着用画像を作成する

 

 

ENCODEでジュエリー製造

ENCODEでは生成AIや3Dプリンターといったテクノロジーを活用した、ジュエリー業界向けのサービスを提供しています。3Dプリンターを使ったジュエリーの製造から、3Dモデルの作成、AIを用いたシステムの開発まで、お気軽にご相談ください!

 

AIに妻との馴れ初めを聞いてもらい結婚指輪をデザインさせる方法

AIでデザインしたジュエリーデザイン集

AIで完結!ChatGPTでジュエリーのデザイン案を作成してStable Diffusionで画像を生成した結果