OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。
使用 OmniHuman AI 创建逼真的数字人,并实现完美的唇形同步。将照片和音频转换为具有自然表情和动作的高质量数字人视频。