首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州美腾思智能科技有限公司

摘要:本发明公开一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法,属于数据处理技术领域;该方法包括:输入视频素材构成视频数据集;对视频素材的视频帧的进行人脸三维重建;构建音频特征到三维人脸模型人脸参数的映射;构建动态显式辐射场;接受音频和表情特征输入,通过所述向量量化的变分编码器回归重演人脸的表情参数和下颚姿态系数,结合源人脸其它FLAME参数输入构建的动态显式辐射场回归高斯基元的动态属性合成重演视频;对目标人物的外观和表情编辑。本发明通过参数化可学习哈希编码结构和显式三维高斯泼溅,大幅加速了训练和渲染效率,能够在保证高质量渲染的同时,显著缩短计算时间,从而提高了模型的实际应用可行性。

主权项:1.一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法,其特征在于,包括以下步骤:S1、输入视频素材构成视频数据集;S2、对视频素材的视频帧的进行人脸三维重建,人脸三维可变形模型的身份系数和面部参数;所述面部参数包括表情系数和姿势系数,所述姿势系数包括眼睛姿势系数、下颚姿势系数和头部姿势系数;S3、提取所述视频数据集中源人脸三维可形变模型的表情系数和下颚姿势系数,使用对齐的音频特征和人脸参数训练向量量化的变分编码器,构建音频特征到三维人脸模型人脸参数的映射;S4、构建动态显式辐射场,通过人脸模型作为代理,输入面部参数动态回归高斯基元的颜色、不透明度、位置和协方差属性,并根据位置梯度控制高斯基元的分裂和聚合,通过体渲染技术合成人物重演视频;S5、接受音频和表情特征输入,通过所述向量量化的变分编码器回归重演人脸的表情参数和下颚姿态系数,结合源人脸其它人脸三维可变形模型参数输入构建的动态显式辐射场回归高斯基元的动态属性合成重演视频;S6、通过对表情特征的编辑或直接编辑表情参数,实现对目标人物的外观和表情编辑。

全文数据:

权利要求:

百度查询: 杭州美腾思智能科技有限公司 一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。