一种利用语音信息的实时视频人脸区域时空一致合成方法

导航：龙图腾网> 最新专利技术> 一种利用语音信息的实时视频人脸区域时空一致合成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：厦门大学

摘要：一种利用语音信息的实时视频人脸区域时空一致合成方法，涉及深度学习和三维人脸重建。利用三维人脸重建算法从视觉特征提取人脸身份信息、人脸形状信息、人脸姿态信息和人脸纹理信息，并利用深度学习技术从音频特征提取人脸表情信息，融合前者的视觉信息和后者的听觉信息，增强神经网络合成人脸表情的丰富性，快速准确地合成与当前说话内容相一致的人脸说话视频。引入参考人脸身份参数，可约束输出前后视频帧身份形象一致。引入时序上的上下文信息和平滑约束，抑制纹理抖动，使人脸生成算法能适用于视频。采用更为精简的神经网络结构，可实时生成人脸说话视频或去掉人脸遮挡物，可在安防监控、视频会议、虚拟形象、动画驱动等领域应用。

主权项：1.一种利用语音信息的实时视频人脸区域时空一致合成方法，其特征在于包括以下步骤：S1：人工选取人脸身份参考图像，提取其人脸身份参数、人脸纹理参数；S2：对于实时视频流的每一帧图像，使用人脸三维重建技术提取每帧对应的人脸姿态参数、人脸形状参数；S3：对于实时音频流提取每帧视频对应的音频特征，对第一网络输入音频特征，输出视频流每帧对应的人脸表情参数；S4：输入人脸身份参数、人脸姿态参数、人脸形状参数、人脸纹理参数、人脸表情参数，使用三维人脸模型渲染技术渲染出对应的三维人脸模型渲染图像；S5：对第二网络输入视频流原图帧、三维人脸渲染图像、人脸身份参考图像以及第二网络上一帧合成图像，输出人脸区域合成后的图像；其中，第二网络的优化约束包括时序一致性约束、判别器约束、人脸身份一致性约束；所述人脸身份一致性约束的实施过程如下：1人脸身份编码提取模块三维人脸重建技术提取目标说话人的人脸身份编码，所述身份编码提取模块采用人脸3D形变统计模型；2对人脸身份编码投影模块输入步骤1得到的人脸身份编码，输出投影后的人脸身份特征；3使用自适应实例标准化将步骤2得到的人脸身份特征编码入生成器，并输入原图像、3D人脸模型渲染图像，输出去遮挡后的人脸图像；4使用人脸身份验证模块计算原图像与合成图像的身份特征差异，作为指导用于优化生成器；5循环步骤1～4，直至生成器收敛。

全文数据：

权利要求：

百度查询：厦门大学一种利用语音信息的实时视频人脸区域时空一致合成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：视频数据的帧间预测方法、装置及电子设备

下一篇：一种圆管激光焊接装置

相关技术

视频数据的帧间预测方法、装置及电子设备

一种圆管激光焊接装置

非对称分布高架桥施工中钢盖梁与预制立柱的临时铰接结构及施工方法

装配式建筑的锁合机构

一种污水检测过滤装置

一株具有减肥、降血糖作用的乳酸片球菌及其后生元和应用

一种插接式离合器壳体结构及其铸造工艺

基于周期式吹吸气的机翼流动控制系统及方法

具有铰接臂及储层表征和绘图能力的激光钻孔工具

抑制LECT2基因表达的组合物和方法

用于多聚甲醛的氨和氢氧化铵稳定剂

图像处理方法、装置、电子设备和存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种利用语音信息的实时视频人脸区域时空一致合成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务