Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中邮消费金融有限公司陈盛福获国家专利权

恭喜中邮消费金融有限公司陈盛福获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中邮消费金融有限公司申请的专利三维人脸合成方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118037909B

龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410280934.9,技术领域涉及:G06T13/40;该发明授权三维人脸合成方法、装置、设备及存储介质是由陈盛福;耿卫东;徐欣阳;杨蕾;温世欢;余仲慰设计研发完成,并于2024-03-12向国家知识产权局提交的专利申请。

三维人脸合成方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及计算机视觉领域,并公开了一种三维人脸合成方法、装置、设备及存储介质,该方法包括:从采集到的人脸图像中提取面部特征并从采集到的人物语音中提取语音特征;通过预设图像编码器对面部特征进行编码,得到编码后的面部特征;通过预设语音编码器对语音特征进行编码,得到编码后的语音特征;将编码后的面部特征和编码后的语音特征输入至扩散模型中进行三维人脸合成,得到三维人脸网格序列。本发明通过编码器对面部特征和语音特征进行编码,并通过扩散模型基于得到的编码后的面部特征和编码后的语音特征来预测人脸运动,实现了三维人脸合成并得到与人脸图像和人物语音匹配的三维人脸网格序列,从而能够快速准确地合成三维人脸。

本发明授权三维人脸合成方法、装置、设备及存储介质在权利要求书中公布了:1.一种三维人脸合成方法,其特征在于,所述方法包括以下步骤:从采集到的人脸图像中提取面部特征并从采集到的人物语音中提取语音特征;通过预设图像编码器对所述面部特征进行编码,得到编码后的面部特征;通过预设语音编码器对所述语音特征进行编码,得到编码后的语音特征;将所述编码后的面部特征和所述编码后的语音特征输入至扩散模型中进行三维人脸合成,得到三维人脸网格序列,所述扩散模型用于根据所述编码后的面部特征和所述编码后的语音特征预测人脸运动;其中,所述从采集到的人脸图像中提取面部特征的步骤,包括:对采集到的人脸图像进行三维人脸建模,得到三维人脸模板,所述采集到的人脸图像为单视角人脸图像,所述三维人脸模板以FLAME模型的形式表示,所述FLAME模型基于线性混合蒙皮和混合变形表示,所述FLAME模型包含5023个顶点和4个关节,所述线性混合蒙皮用于刻画所述FLAME模型中部位与部位之间发生相对旋转时的变化,所述混合变形用于刻画所述FLAME模型中5023个顶点发生的偏移量;从所述三维人脸模板中确定人脸的形态信息和纹理信息,并基于所述形态信息和所述纹理信息对所述三维人脸模板进行人脸重建,得到重建后的三维人脸模板;从所述重建后的三维人脸模板中提取面部特征;所述从采集到的人物语音中提取语音特征的步骤,包括:对采集到的人物语音进行短时傅里叶变换,得到所述采集到的人物语音对应的短时段语音帧;通过傅里叶变换将所述短时段语音帧对应的时域信号转换为频域信号,并根据所述频域信号在频域中的能量分布提取语音特征;所述通过预设图像编码器对所述面部特征进行编码,得到编码后的面部特征的步骤,包括:通过预设图像编码器将所述面部特征映射至潜在特征空间,所述预设图像编码器为Transformer-VAE编码器,所述Transformer-VAE编码器基于Transformer结构和变分自编码器构建;在所述潜在特征空间中对所述面部特征进行编码,得到编码后的面部特征,编码过程包括对所述面部特征的压缩过程、抽象过程和解耦过程;所述通过预设语音编码器对所述语音特征进行编码,得到编码后的语音特征的步骤,包括:所述预设语音编码器包括语音预训练模型和CBE模块;通过所述语音预训练模型将所述语音特征转换为若干语音序列,并捕捉所述若干语音序列之间的依赖关系,所述语音预训练模型基于循环神经网络和或卷积神经网络构建;在所述CBE模块中基于所述依赖关系对所述若干语音序列进行编码,得到编码后的语音特征;所述将所述编码后的面部特征和所述编码后的语音特征输入至扩散模型中进行三维人脸合成,得到三维人脸网格序列的步骤,包括:将所述编码后的面部特征和所述编码后的语音特征输入至扩散模型中进行解码,得到人脸预测运动轨迹;基于所述人脸预测运动轨迹对所述编码后的面部特征和所述编码后的语音特征进行三维人脸合成,在所述编码后的面部特征和所述编码后的语音特征达成唇音同步后,输出三维人脸网格序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中邮消费金融有限公司,其通讯地址为:510000 广东省广州市南沙区海滨路171号南沙金融大厦11楼1101之一J30;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。