一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法

导航：龙图腾网> 最新专利技术> 一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：杭州美腾思智能科技有限公司

摘要：本发明公开一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法，属于数据处理技术领域；该方法包括：输入视频素材构成视频数据集；对视频素材的视频帧的进行人脸三维重建；构建音频特征到三维人脸模型人脸参数的映射；构建动态显式辐射场；接受音频和表情特征输入，通过所述向量量化的变分编码器回归重演人脸的表情参数和下颚姿态系数，结合源人脸其它FLAME参数输入构建的动态显式辐射场回归高斯基元的动态属性合成重演视频；对目标人物的外观和表情编辑。本发明通过参数化可学习哈希编码结构和显式三维高斯泼溅，大幅加速了训练和渲染效率，能够在保证高质量渲染的同时，显著缩短计算时间，从而提高了模型的实际应用可行性。

主权项：1.一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法，其特征在于，包括以下步骤：S1、输入视频素材构成视频数据集；S2、对视频素材的视频帧的进行人脸三维重建，人脸三维可变形模型的身份系数和面部参数；所述面部参数包括表情系数和姿势系数，所述姿势系数包括眼睛姿势系数、下颚姿势系数和头部姿势系数；S3、提取所述视频数据集中源人脸三维可形变模型的表情系数和下颚姿势系数，使用对齐的音频特征和人脸参数训练向量量化的变分编码器，构建音频特征到三维人脸模型人脸参数的映射；S4、构建动态显式辐射场，通过人脸模型作为代理，输入面部参数动态回归高斯基元的颜色、不透明度、位置和协方差属性，并根据位置梯度控制高斯基元的分裂和聚合，通过体渲染技术合成人物重演视频；S5、接受音频和表情特征输入，通过所述向量量化的变分编码器回归重演人脸的表情参数和下颚姿态系数，结合源人脸其它人脸三维可变形模型参数输入构建的动态显式辐射场回归高斯基元的动态属性合成重演视频；S6、通过对表情特征的编辑或直接编辑表情参数，实现对目标人物的外观和表情编辑。

全文数据：

权利要求：

百度查询：杭州美腾思智能科技有限公司一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：接线组件

下一篇：一种不锈钢管切割机的清废装置

相关技术

接线组件

一种不锈钢管切割机的清废装置

一种线切割清洁装置

一种恒光空间自动调光装置

一种基于NFC的车载启动控制电路

水稻种植的种子催芽器

一种螺旋轴固定结构

一种产品脱模的吹气结构

车牌自动识别分拣线

一种液压动力机械用元件制造设备

一种保温单元及具有该保温单元的保温板

一种多级复合式整流器及流体管道输送系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于三维高斯溅射技术的表情可编辑的语音驱动人脸重建方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务