ImageFXで作る「令和の米騒動」:プロンプト改善の記録
AIを使った画像生成は、プロンプトの調整により大きく変わります。
今回はImageFXを使用して「令和の米騒動」をテーマにした画像を生成する過程を紹介します。
ImageFX: Anthropic社の画像生成AIツール
ImageFXはAnthropic社が開発した画像生成AIツールです。
このツールはテキストによる説明(プロンプト)から高品質な画像を生成することができます。
ImageFXの主な特徴
- 高品質な画像生成: 詳細で精巧な画像を作成できます。
- 多様な画風: 写実的なものからイラスト調まで幅広いスタイルの画像を生成可能です。
- 倫理的配慮: 不適切なコンテンツの生成を防ぐ安全機能が組み込まれています。
- ユーザーフレンドリー: 直感的なインターフェースで、AIに不慣れな人でも簡単に使用できます。
- 迅速な生成: 数秒から数分で画像を生成します。
- 無料アクセス: Googleアカウントを使用して無料で利用できます。
これにより幅広いユーザーが簡単にアクセスし画像生成AIの能力を体験することができます。
ImageFXの活用
ImageFXは以下のような幅広いユーザーにとって、アイデアを視覚化する強力なツールとなっています。
- デザイナー
- アーティスト
- マーケター
- 創造的なプロジェクトに携わる人々
Googleアカウントがあれば誰でも無料で利用できるため、
プロフェッショナルから趣味で使用する人まで、
幅広い層に開かれたツールとなっています。
1. 最初のプロンプト
最初のプロンプトでは現代の日本のスーパーマーケットで米が品薄になっている状況を描写しようとしました。
主な要素は以下の通りです。
- 大きな明るい照明のスーパーマーケットの米売り場
- ほとんど空になった棚
- 心配そうな表情の客たち
- パニック買いを示唆する、米でいっぱいのショッピングカート
- 商品補充に追われる店員
- 購入制限を示す表示
2. フィードバックと修正
最初の画像生成結果に対して以下のフィードバックを行いました。
- 品薄感が不足: 米が豊富に陳列されていた。
- 写真的表現の向上: より現実的な写真のような仕上がりが必要。
- 争奪戦の雰囲気: 米を巡る顧客同士の競争をより強調。
3. 改善されたプロンプト
フィードバックを基にプロンプトを以下のように改善しました
- 棚の90%が空であることを明確に指定
- 10-15人の客が最後の米袋に殺到する様子を描写
- 1つの米袋を巡る綱引きのような場面を追加
- フォトジャーナリスティックなスタイルを要求
- 動きのブレを入れることで臨場感を出す
4. 最終調整
さらなるフィードバックにより、以下の点を修正しました。
- 米の量をさらに減少: 棚の95%が空で、残りの米袋を3-5個に限定
- プロンプトの簡潔化: 重要な要素を箇条書きで簡潔に列挙
最終的なプロンプト
最終的に、以下のような簡潔で効果的なプロンプトになりました。
- 95%が空の米売り場、3-5個の米袋のみ表示
- 10-12人の客が最後の米袋に殺到
- 1つの米袋を巡る綱引きシーン
- 混乱を抑えようとする店員
- 「お一人様1袋まで」の看板(日英表記)
- 背景に他の商品が豊富にある様子を対比として使用
- 広角、フォトジャーナリスティックアプローチ
- 劇的な効果を出す照明
結論
このプロセスはAI画像生成におけるプロンプト調整の重要性を示しています。
具体的な指示、視覚的要素の強調、そして適切なスタイルの指定により、望む画像に近づけることができます。
またフィードバックを基にした継続的な改善が、最終的な成果物の質を大きく向上させることがわかりました。
米が実のる日本の風景
Stable Diffusionと対比するために、同じプロンプトで作ってみました。
テーマは、米が実る日本の風景です
ImageFX
Stable Diffusion
比較して分かるように全然違います。
ImageFXの方がかなり精度が高い物が出来ます。
そもそもStable Diffusionはモデルが弱いですからねぇ。
日本の風景作れるモデルも少ないですし。
こういう所が難しいなと思いました。
おまけ:令和の米騒動を動画にしてみた
おなじみのRunway Gen-3 Alphaで動画にしてみました。
クレジット勿体ないので一発のみです。
こ、怖い…。恐怖映像となりました。
外国になっちゃいましたしねぇ。
やはり難しいですね。