ByteDance、新AI「OmniHuman-1」発表!写真1枚からリアル動画生成

ニュース
  • ByteDance、AI動画生成技術「OmniHuman-1」発表
  • 1枚の写真から全身の自然な動きを再現可能
  • 偽情報拡散リスクと活用可能性の両面で議論が必要

※ AIによる要約

中国のByteDanceは2025年2月3日、1枚の写真から自然な動きの動画を生成できるAIシステム「OmniHuman-1」を発表。

このシステムは、エンドツーエンドのマルチモーダル条件付き人間動画生成フレームワークとして設計されており、音声や映像を組み合わせることでリアルな人物の動きを再現可能に

https://omnihuman-lab.github.io
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

OmniHuman-1の開発には、1万8700時間を超える動画データを活用し、テキストや音声、体の動きなどを統合するアプローチが採用されている。その結果、従来のモデルと比べ、映像品質やリアリティの面で大幅な向上が見られたとのこと。そして実際のデモでは、NVIDIAのジェンスン・フアンCEOがラップを披露する動画や、架空のテイラー・スウィフトがパフォーマンスを行うシーンが公開され、生成能力の高さが示されました。

さらに、このモデルは従来のディープフェイク技術と異なり、上半身や顔の動きだけでなく、全身の動作も滑らかに再現可能。例えば、有名なアインシュタインの白黒写真を基に生成された動画では、まるで本人が講義をしているかのようなリアルな映像が出力されました。

また、OmniHuman-1はアニメ調の映像や3DCGスタイルの動画生成にも対応。音声を基にキャラクターの動きを制御したり、既存の映像を模倣したりすることも可能で、この技術の柔軟性が現れている。

このような革新的な技術は、映画やゲーム、教育分野などで新たな可能性を切り開くと期待される一方、ディープフェイクを利用した詐欺や偽情報の拡散といったリスクも懸念されています。

タイトルとURLをコピーしました