Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜广电运通集团股份有限公司王利华获国家专利权

恭喜广电运通集团股份有限公司王利华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜广电运通集团股份有限公司申请的专利面部生成方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117765950B

龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311775597.2,技术领域涉及:G10L15/25;该发明授权面部生成方法和装置是由王利华;彭鹏;李爱军;姚荣国;李卓霖设计研发完成,并于2023-12-21向国家知识产权局提交的专利申请。

面部生成方法和装置在说明书摘要公布了:本申请公开了一种面部生成方法和装置,属于数字人领域。所述面部生成方法,包括:获取目标音频和目标风格特征序列;目标风格特征序列为目标风格对象在口播任意音频情况下对应的面部特征序列;基于目标音频和目标风格特征序列,预测得到目标口型特征;目标口型特征为目标风格对象对应的唇形风格下与目标音频匹配的口型特征;基于目标口型特征和目标风格特征序列,生成整体面部特征序列。本申请的面部生成方法,可以生成不同风格且风格差异较大的不同的口型特征,有利于个性化风格的实现。

本发明授权面部生成方法和装置在权利要求书中公布了:1.一种面部生成方法,其特征在于,包括:获取目标音频和目标风格特征序列;所述目标风格特征序列为目标风格对象在口播任意音频情况下对应的面部特征序列;基于所述目标音频和所述目标风格特征序列,预测得到目标口型特征;所述目标口型特征为所述目标风格对象对应的唇形风格下与所述目标音频匹配的口型特征;基于所述目标口型特征和所述目标风格特征序列,生成整体面部特征序列;所述基于所述目标音频和所述目标风格特征序列,预测得到目标口型特征,包括:将所述目标音频和所述目标风格特征序列输入至口型风格迁移模块,获取所述口型风格迁移模块输出的目标口型特征;所述口型风格迁移模块包括:音频内容编码器、风格编码器与口型风格迁移解码器;其中,所述音频内容编码器用于对输入的目标音频进行编码,所述风格编码器用于对风格特征进行编码,所述口型风格迁移解码器用于基于编码后的音频特征和风格特征生成目标口型特征;重建人脸图像表示为: 其中,为口型风格迁移解码器;为风格编码器;为音频内容编码器;表示利用身份编码器提取身份特征;为带掩码脸部特征序列,为不同口型的对齐视频帧,y为输入音频内容编码器的样本音频;其中,的输入为带掩码脸部特征序列,用于将输入值与包括背景的其他区域进行融和以及衔接,并进行姿态模拟。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广电运通集团股份有限公司,其通讯地址为:510663 广东省广州市高新技术产业开发区科学城科林路9、11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。