はじめに
Stable Diffusionを使って「浴衣を着た猫がアイスキャンディーを食べている」夏のシーンを生成する挑戦をしました。
このプロセスを通じてプロンプトの作成と改善の重要性を学びました。
最初のプロンプト
最初に作成したプロンプトは以下の通りです
y{{{{masterpiece}}}}, {{{{best quality}}}}, {{ultra-detailed}}, {{realistic}}, {{8k}}, {{RAW photo}}, {{high-resolution}}, anthropomorphic brown tabby cat, eating ice candy, solo, Japanese house, traditional architecture, tatami mats, sliding shoji doors, summer, sunlight streaming through, electric fan in the background, detailed fur, expressive eyes, cat wearing summer yukata, sweat on forehead, detailed ice candy texture, natural lighting, warm atmosphere, serene scene, soft shadows, vibrant colors, (anthropomorphic brown tabby cat:1.2), (realistic:1.2), holding ice candy with paws, licking ice candy, enjoying ice candy, no humans
このプロンプトは詳細で多くの要素を含んでいましたが、結果は期待通りではありませんでした。
画像が崩れたり一部の要素が消失したりする問題がありました。
最初は猫だけの画像となっていましたが。
猫と人が混じった何とも奇妙なシュールさが現れました。
猫だけの画像が続いていたのですが。
浴衣というキーワードを入れると人が出て来ました。
女性ですね。
ここから女性が出てくるターンが続きます。
モデルを変えたらこんな感じになってしまったりと…。
プロンプトを少し変えては試行する試行錯誤が続きました。
プロンプト改善のプロセス
プロンプトの改善には以下のような段階を経ました。
- プロンプトの簡素化
- 重要な要素への焦点の絞り込み
- 重み付けの調整
- ネガティブプロンプトの強化
- 特定の要素(猫、浴衣)のバランス調整
最終的なプロンプト
(masterpiece:1.2), (best quality:1.2), (high detail:1.1), (realistic cat:1.4), (tabby cat:1.3), (cat sitting:1.3), (eating ice candy:1.3), (summer:1.2), (cat wearing yukata:1.4), (colorful yukata:1.3), Japanese room, tatami, shoji door, (cat fur:1.2), (expressive cat eyes:1.2), (cat paws:1.1), warm lighting, peaceful atmosphere, (full body shot of cat:1.3), (traditional Japanese summer scene:1.2)
ネガティブプロンプト:
human, text, logo, watermark, multiple animals, distorted animal, deformed cat, extra limbs, missing limbs, blurry, disfigured, bad animal anatomy, mutated cat, oversaturated, undersaturated, naked cat, cat without clothes
主な改善点
- 簡素化: 不要な詳細を削除し、主要な要素に焦点を当てました。
- 重み付けの導入: 重要な要素(猫、浴衣、アイスキャンディー)により高い重みを付けました。
- バランスの調整: 猫と浴衣のバランスを取るように調整しました。
- ネガティブプロンプトの強化: 画像の崩れや不要な要素を防ぐため、より具体的なネガティブプロンプトを設定しました。
結果と考察
最終的なプロンプトでは当初の目標にそこそこ近い画像が生成されました。
猫の特徴、浴衣、そして夏の雰囲気がバランス良く表現されてるんですが。
詳細がまだまだ微妙です。
しかしここでタイムアップとなりました。
まとめ
このプロセスを通じて、効果的なStable Diffusionプロンプトの作成には以下が重要であることが分かりました。
- 明確な目標設定
- 重要な要素の特定と強調
- 不要な詳細の削除
- 適切な重み付け
- ネガティブプロンプトの活用
- 継続的な試行錯誤と調整
Stable Diffusionを使用する際は、最初のプロンプトにこだわりすぎず、結果を見ながら柔軟に調整していくことが大切です。
このようなプロセスを通じて、AIアートの可能性を広げていくことができるでしょう。