首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于说话风格解耦的语音驱动3D面部动画方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:拓元(广州)智慧科技有限公司

摘要:本申请公开了一种基于说话风格解耦的语音驱动3D面部动画方法,涉及计算机图形学技术领域,包括配置阶段、训练阶段和推理阶段;训练阶段包括:X1:输入面部运动序列及音频;X2:风格编码器与内容编码器分别得到风格编码与内容编码,音频编码器得到音频编码;X3:面部运动解码器对内容编码与风格编码或音频编码与风格编码进行解码,得到重建的面部运动序列;X4:计算重建的与输入的面部运动序列的L2损失;推理阶段包括:T1:输入一段驱动音频和一段被驱动对象的参考面部运动序列;T2:音频编码器得到音频编码,风格编码器得到风格编码;T3:面部运动解码器对音频编码和风格编码进行解码得到输出面部运动。采用本申请能够生成真实生动的面部动画。

主权项:1.一种基于说话风格解耦的语音驱动3D面部动画方法,其特征在于,包括:配置阶段、训练阶段和推理阶段:所述配置阶段包括:配置动画组件,所述动画组件包括风格编码器、内容编码器、音频编码器、面部运动解码器以及用于保证解耦的解耦约束,所述解耦约束包括附加风格分类器、附加反转分类器、内容对比损失、隐空间循环损失;所述训练阶段包括:X1:输入面部运动序列及对应的音频;X2:所述风格编码器与所述内容编码器分别对输入的面部运动序列进行编码得到相应的风格编码与内容编码,所述音频编码器对输入的音频进行编码得到音频编码;X3:所述面部运动解码器对内容编码与风格编码的结合或音频编码与风格编码的结合进行解码,得到重建的面部运动序列;X4:计算重建的面部运动序列与输入的面部运动序列的L2损失;所述推理阶段包括:T1:输入一段驱动音频和一段被驱动对象的参考面部运动序列;T2:驱动音频经过所述音频编码器得到音频编码,所述风格编码器对该参考面部运动序列进行编码得到风格编码;T3:所述面部运动解码器对音频编码和风格编码进行解码得到输出面部运动。

全文数据:

权利要求:

百度查询: 拓元(广州)智慧科技有限公司 一种基于说话风格解耦的语音驱动3D面部动画方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。