TikTokを運営するByteDanceが開発した「OmniHuman-1」は、1枚の写真と音声や簡単な動作情報を入力するだけで、まるで本物の人間が動いているかのような動画を生成できるAIです。膨大な動画データを学習しているため、全身の自然な動きや表情が再現されやすく、これまでのディープフェイク技術を大きく上回るクオリティが期待されています。
特徴と活用例
- 少ないデータで高品質
写真と音声だけで、歌ったり話したりする動画をつくれる手軽さがポイントです。 - マルチモーダル対応
テキストや体の動きと組み合わせた自由度の高い映像演出が可能です。 - 幅広い応用分野
エンタメから教育、広告、歴史再現まで、アイデア次第でさまざまな映像が制作できるでしょう。
リスクと対策
高度なリアリティを持つ反面、誤情報の拡散やプライバシー侵害のリスクも見逃せません。ByteDanceは、生成動画に識別用の透かしを入れる技術や利用ガイドラインの整備を検討しているとされています。しかし、国際的なルールの整備や社会的な啓発がまだ十分とはいえず、今後の取り組みが注目されます。
まとめ
OmniHuman-1は映像制作を一変させるインパクトを持ちながら、ディープフェイクの悪用リスクという課題を同時に提起しています。ワクワクする可能性と慎重さの両面があるからこそ、技術の進化と適切な使い方のバランスを見極めることが求められるでしょう。