AI画像映像ツール

時代を超える初音ミク:AIプロンプトエンジニアリングの旅(Stable Diffusion)

時代を超える初音ミク:AIプロンプトエンジニアリングの旅

はじめに

本記事では、人工知能を使って様々な時代の初音ミクを描写する試みについて紹介します。
AIイメージ生成技術を用いて縄文時代から令和まで、世界や日本の歴史的な各時代における初音ミクの姿を創造する過程を追っていきます。

各国の初音ミクというのが話題になっていましたが、国を題材にすると色々面倒な事が起こるので辞めておきます。
各国の初音ミクも作りましたしかなり良い感じだったのですがお蔵入りとします。

1. 縄文時代の初音ミク

最初の挑戦は縄文時代(石器時代)の初音ミクでした。
原始的な感じ野性味溢れる感じを目指しましたが専用のLoRA作らないと無理だろうという結論となりました。

完成したなかでまともなものはこのような画像となります

stablediffusion-0074

骨を持っていますが頭飾りとかは現代風なので何ともシュールです

2. 中世の初音ミク

中世の初音ミクは簡単に作れました。
想像しやすい部分でもありますし外国圏でも理解しやすい内容だからでしょう。
イメージ通りの中世時代の初音ミクが出来ました。

stablediffusion-0075

3. 江戸時代の初音ミク

次の挑戦は江戸時代の初音ミクでした。
和装の初音ミクを表現しつつ、江戸時代の街並みを背景に据えることを目指しました。

主なポイント:

  • 伝統的な着物姿の初音ミク
  • 江戸時代の髪型とアクセサリー
  • 背景に江戸の街並みや人々

課題と改善:

  • 最初は神社ばかりの背景になってしまい、街中の風景を強調するよう調整しました。
  • 日本らしさを維持することに注力しました。

結果としては失敗で神社的な風景しか出ませんでした


stablediffusion-0076

それでも江戸時代風にはなりました。
もう少し調整出来れば良かったのですが妥協してしまいました

4. 明治~大正時代の初音ミク

次に明治~大正時代の初音ミクに挑戦しました。
この時代は和洋折衷の文化が特徴的だったため、そのバランスを取ることが課題でした。

主なポイント:

  • 和洋折衷のファッション
  • 明治時代を象徴する小物(例:洋傘、懐中時計)
  • 背景に明治~大正時代の東京の街並み

課題と改善:

  • 当初は中華風の要素が強く出てしまい、日本らしさを強調するよう調整しました。
  • 明治時代特有の「ハイカラ」な雰囲気を出すのに苦心しました。

これもまた難しく日本のその時代の資料など入っていないでしょうから出すのにかなり苦労しました

stablediffusion-0077

いまいちかも知れませんがこれが限界。
もう少し時間をかければ出たかも知れません。

5. 昭和時代の初音ミク

昭和時代は長期間にわたるため特定の時期に限定せず、
昭和時代全般の雰囲気を表現することにしました。

主なポイント:

  • レトロな学生服や現代的な着物
  • 昭和を象徴する小物(トランジスタラジオなど)
  • 背景に昭和の街並みや文化的要素
  • 昭和なアニメ風

課題と改善:

  • 昭和時代の多様な側面をバランス良く表現することに注力しました。
  • ノスタルジックな雰囲気と初音ミクの未来的なイメージの融合を図りました。

凄く昭和っぽいアニメの雰囲気出てませんか?

stablediffusion-0078

これ凄く面白いなと思いまして。
色々量産してました。

6. 令和時代の初音ミク

最後に現代の令和時代の初音ミクを表現しました。
最新のテクノロジーと文化的トレンドを反映させることが課題でした。

主なポイント:

  • 未来的なポップアイドル風の衣装
  • 最新のガジェット(スマートフォンやARグラス)
  • 背景に現代の東京の街並みと先端技術

課題と改善:

  • 当初は逆光の問題があり、照明や色彩の指定を詳細化して改善しました。
  • 伝統と最新技術の融合を表現することに注力しました。

こちらは今時な感じなので全く違和感がないですね。
映えって感じの雰囲気となっています

stablediffusion-0079

結論

この一連のプロセスを通じてAIを用いたイメージ生成において、
細かなプロンプト調整の重要性が明らかになりました。
時代背景、ファッション、小物、背景など、多岐にわたる要素を適切に組み合わせることで望んだイメージに近づけていくことができます。

また初音ミクというキャラクターの特徴を維持しつつ、
各時代の雰囲気を表現することの難しさと面白さも体験しました。
AIによるイメージ生成はユーザーの意図を適切に伝えるプロンプトエンジニアリングのスキルと、
生成結果を評価・改善する繰り返しのプロセスが重要であることが分かりました。

この実験はテクノロジーと創造性の融合が生み出す新しい表現の可能性を示唆しています。
今後AIを活用したクリエイティブな取り組みがさらに発展していくことが期待されます。

最後に

Runway Gen-3 AlphaとLumaDreamMachineを使って令和の初音ミクを動かしてみました。
一発勝負ですがどのような物が出来るでしょうか。

Runway Gen-3 Alpha Turbo使いましたが全然動いてくれませんでした。辛うじて道路を何かが走っている感じが出ている程度でした

LumaDreamMachineを使ったこちらは色々とぶっ壊れました
アニメ系を動かすのは難しいのかもしれません。

タイトルとURLをコピーしました