AIを使ったシマエナガ画像生成の旅:リアルから動画、そして擬人化まで
はじめに
本記事ではAIを使ってシマエナガの画像を生成する過程を紹介します。
最初は現実的なシマエナガの画像を目指しました。
そこから動画化を経て最終的には擬人化されたキャラクターの作成まで挑戦しました。
この挑戦を通じてAIプロンプトの調整の重要性と、AI技術の多様な可能性を学びました。
1. 最初のシマエナガ生成の試み
最初に使用したプロンプトは以下の通りです。
masterpiece, best quality, photorealistic, nature photography,
Shima-enaga, Japanese long-tailed tit, tiny round bird, white fluffy body,
very long tail, at least half of body length, thin black eyebrow stripe,
light grey wings and back, extraordinarily fluffy feathers, cotton ball appearance,
small black eyes, tiny beak, perched on snowy branch, winter scene,
Hokkaido landscape, close-up shot, soft lighting, depth of field,
fine details, feather texture, 8k uhd, sharp focus
この結果、シマエナガに似た鳥が生成されましたが、いくつかの問題点がありました。
謎の小鳥が生み出されたのでした。
2. プロンプトの改善と調整
問題点を解決するためにプロンプトを調整しました。
主な変更点は以下の通り。
- 「pure white fluffy body」の強調
- 「completely white head」の追加
- 「no black on head except eyebrows」の指定
3. 過剰な調整とその修正
調整の結果画像がややファンタジー的になってしまいました。
一体これらは何だ…どんなクリーチャーだ。
これに至ってはシマエナガではなくてフクロウに近いですし。
バケモノでしかありませんね。
より現実的な表現を目指して再度プロンプトを調整しました。
4. 最終調整:尾の長さの強調
何度か繰り返しているとここまで来ました。
それっぽい鳥が出来たので、ここからはimage-to-imageを使って調整します。
シマエナガの特徴的な長い尾をより強調するためさらにプロンプトを調整しました。
extremely long tail, longer than body length, tail makes up more than half of total length,
proportionally correct long tail
それにより出来たのがこちらとなります。
かなりシマエナガに近づきました
もう少し頭部分が白くなれば良かったのですが色々と限界だったので妥協した形となります。
こういう子もいるかも知れませんしね!
5. 静止画から動画へ:Runway gen-3 Alphaの活用
Runway gen-3 Alphaを使用して静止画を動画化しました。
結果は以下の通りです。
- 生成された動画は驚くほど本物らしくシマエナガが生き生きと動いていました。
- 動きは自然でシマエナガのっぽい動作が再現されていました。
- 動画化の過程で少し口ばしが伸びてしまうという現象が見られました。
技術的な考察
- Runway Gen-3 Alphaは、単一の静止画から自然な動画を生成する能力を示しました。
- AIは鳥の一般的な動きのパターンを学習しそれをシマエナガの特徴に適用したと考えられます。
- 口ばしの伸長という現象はAIが「鳥」という一般的な概念と「シマエナガ」の特殊性をバランスさせようとした結果かもしれません。
応用の可能性
この技術は、野生生物のドキュメンタリー制作、教育用コンテンツ、エンターテインメントなど、様々な分野での応用が考えられます。
良いか悪いかは置いといて静止画からここまで動画に出来るとなると面白すぎませんか?
6. シマエナガの擬人化
最後にシマエナガを擬人化したキャラクターの作成に挑戦しました。
主なプロンプトは以下の通りです。
anthropomorphic Shima-enaga, cute young girl, long white fluffy hair,
hair longer than body, extremely long twin-tails,
white winter coat, fluffy white dress, light grey accents,
small black eyebrows, large expressive eyes, tiny nose,
petite figure, bird-like gestures, perched on tree branch,
snowy winter background, Hokkaido landscape,
soft lighting, gentle expression, kawaii style,
fantasy art, anime influence, character design
それで出来た画像をぺたぺたと貼り付けます。
これが出て来たときドキッとしました。
シマエナガの特徴入ってる!と。凄くそれっぽくないですか?
なんかどことなくシマエナガが漂ってくる感じがしてくるのです。
不思議ですねぇ。全く違うのに。
木に止まってる姿がこんな風に再現されています。
7.Runway Gen-3 Alphaを使用して静止画を動画化(新しい機能も使う)
Runway Gen-3 Alphaを使用して擬人化シマエナガ静止画を動画化しました。
新たに機能が追加されています。
FirstとLastのフレームが選べます
画像を最初のフレームにするか、最後のフレームにするかを選べます。
最初のフレームにすると、画像から徐々に変化していく感じ
最後のフレームにすると、動画が静止画に収束していく感じ
最初と最後のフレームを指定出来るようにして欲しいですがそれはまだできていないのか作らないのか…。
でも結構面白いです。
結果は以下の通りです。
最後に白目を剥いている気持ちの悪い動画になってしまいました。
アニメ系は若干苦手なのかな?という結果になりました。
プロンプト指定しなかったというのも悪かったと思います。
最初の画像から徐々に変化していくのが分かりますね。
こちらは、画像を最終フレームにするを指定して作った動画となります。
最終フレームに向けて徐々に変化していきます。
若干無理のある構成となっているので使い方は難しいですね。
繋がりのある動画を作るには至らないような気がします。
まとめ
この挑戦を通じてAIを使った創作活動の多様性と可能性を探索しました。
- プロンプトエンジニアリングの重要性:細かな言葉の選択や重み付けが、生成される画像に大きな影響を与えることがわかりました。
- AIの進化:静止画生成だけでなく、動画生成においても驚くべき進歩が見られました。
- 創造性の拡張:AIは私たちの創造性を増幅し、新しい表現方法を提供してくれます。
しかしAIを使用する際は倫理的な配慮も重要です。
生成されたコンテンツが現実と混同されないよう適切な表示や解説を付けることが求められます。
AIツールは日々進化しています。
クリエイターとしてこれらのツールを理解し適切に活用することで、より豊かな表現が可能になるでしょう。
皆さんもお気に入りのモチーフでAIを活用した創作活動に挑戦してみてはいかがでしょうか。