カテゴリ:動画生成

[動画生成AI] HuMo徹底解剖:画像+音声から人間らしい動画を生成する新時代AI

清華大学とByteDanceが公開したHuMoは、参照画像と音声を入力することでリップシンク・表情・動作を自然に同期させた動画を生成するマルチモーダルAI。論文・実装・ComfyUI統合状況をディープリサーチで整理。