一种虚拟谈话数字人生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南昌航空大学;江西睿创科技有限公司;联想新视界(南昌)人工智能工研院有限公司

摘要：一种虚拟谈话数字人生成方法，包括：S1，基于获取的真实录像的谈话视频，通过编码器结合语音特征分离出身份特征和脸部表情特征；S2，将脸部表情特征编码到隐变量空间中，得到谈话视频中的每一帧图像对应的表情隐变量表示；S3，在得到表情隐变量表示后，通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量；S4，解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频；S5，根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组；S6，对谈话头像视频和动作组进行融合，得到全身的虚拟谈话数字人。本发明能够得到形象更加逼真、更接近现实生活中人物的谈话虚拟数字人。

主权项：1.一种虚拟谈话数字人生成方法，其特征在于，包括以下步骤：S1，基于获取的真实录像的谈话视频，通过编码器结合语音特征分离出身份特征和脸部表情特征；S2，将脸部表情特征编码到隐变量空间中，得到谈话视频中的每一帧图像对应的表情隐变量表示，所述隐变量空间是一个可学习的面部表情表征字典，代表面部运动的合集；S3，在得到表情隐变量表示后，通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量；S4，解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频，通过基于图像分块的对抗网络来提升图像质量；S5，根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组；S6，对谈话头像视频和动作组进行融合，得到全身的虚拟谈话数字人；步骤S1具体包括：S11，将获取的真实录像的谈话视频分离出每一帧图像，将每一帧图像中的人像根据眼部位置及嘴部位置裁剪并对齐头像位置，以得到多个谈话头像图片；S12，对得到的谈话头像图片提取对应的音频信号特征，根据音频信号特征和对应身份的无表情头像图片获取表情掩码特征；S13，编码器根据获取的表情掩码特征分离谈话头像图片的身份特征和脸部表情特征；步骤S2具体包括：S21，设计一个可学习的面部表情表征字典，将获取到的脸部表情特征投影到该面部表情表征字典的线性组合空间中；S22，联合优化面部表情表征字典及其线性组合系数，使面部表情表征字典能最大程度表示脸部表情特征，从而得到谈话视频中的每一帧图像对应的表情隐变量表示，进而得到包含了所有面部表情的动作合集；步骤S3具体包括：S31，根据步骤S2获取到的每一帧图像对应的表情隐变量表示，将其聚合到谈话视频的面部表情表征字典空间中作为训练时的监督；S32，获取谈话视频中的每一帧图像的对应的音频信号特征，设计一个基于注意力机制的Transformer神经网络，其输入为每一帧和其前面所有的图像对齐的音频信号特征，输出为这一帧图像的面部表情表征字典空间的拟合结果，迭代训练该神经网络，使拟合结果与步骤S31中的结果误差达到最小；S33，将谈话视频中的谈话音频输入到循环神经网络中，获取到谈话音频的表情隐变量，在测试时，将任意一段音频输入到神经网络中，获取到该音频未在面部表情表征字典空间中的表情隐变量。

全文数据：

权利要求：

百度查询：南昌航空大学江西睿创科技有限公司联想新视界(南昌)人工智能工研院有限公司一种虚拟谈话数字人生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于低位速率应用的语义通信

下一篇：一种碳化养护混凝土养护制度的优化设计方法

相关技术

用于低位速率应用的语义通信

一种碳化养护混凝土养护制度的优化设计方法

用于优化处理的方法

一种用于三角琴弦槌柄轴架的穿针浸泡设备

一种高温氧化镁粉添加剂及镁粉制备方法和应用

山地风电场风电机组叶轮组装的双承平台及抗风方法

一种包装装潢印刷品用印刷设备

一种砂带张紧装置及张紧方法和应用

衣物处理设备

一种焦炉自动加热耦合控制方法

一种拥有低应力的传递稳定杆结构扭力梁

风力发电机变频器用降温装置

谈话相关技术

一种谈话室防撞软包及其制作工艺_济南启天电子有限公司_202411005960.7

一种非接触式留置谈话虚假音频检测方法及系统_金纪科技有限公司_202411035296.0

一种谈话室使用的安全门_浙江机电职业技术学院_202410773780.7

基于视频的谈话场景异常检测方法、终端设备及存储介质_厦门市美亚柏科信息股份有限公司_202111533341.1

一种谈话区监控装置_南通阿尔法机电有限公司_202323278751.3

一种非接触式留置谈话虚假音频检测方法及系统_金纪科技有限公司_202411035296.0

一种单人谈话疏导桌_李月成_202323189148.8

一种快速生成谈话数字人的方法、系统、设备及存储介质_小哆智能科技(北京)有限公司_202410571446.3

一种谈话区智能屏蔽装置_南通阿尔法机电有限公司_202323075426.7

用于自然谈话话音系统的不流畅检测模型_谷歌有限责任公司_202280073377.2

虚拟相关技术

虚拟实境处理方法及用于处理虚拟实境的电子装置_宏达国际电子股份有限公司_202110041067.X

虚拟电厂的安全防护方法、防护装置和虚拟电厂防护系统_广东电网有限责任公司_202411131059.4

虚拟资源的处理方法和装置_北京小来无限科技有限公司_202111342759.4

一种虚拟物品的放置方法和装置_北京沃东天骏信息技术有限公司_202411354634.7

一种虚拟仿真图像显示质量处理方法_西安市航空基地天翼航空科技有限公司_202411279849.7

基于虚拟账户的支付处理方法及装置_重庆蚂蚁消费金融有限公司_202410918691.7

虚拟电厂调度方法、装置、设备及介质_国网江苏省电力有限公司徐州供电分公司_202410905033.4

一种虚拟机的固定机构_江西成视信息工程有限公司_202420074682.X

虚拟键盘的交互方法、装置、存储介质及设备_北京字跳网络技术有限公司_202410910616.6

虚拟电路可视化方法及系统_广州泓锐信息技术有限公司_202410474686.1

方法相关技术

攻击检测模型的构建方法及攻击检测方法_上海斗象信息科技有限公司_202411019557.X

对准装置及方法、成膜装置及方法和电子器件的制造方法_佳能特机株式会社_202410495098.6

模型压缩方法、训练方法、多媒体数据处理方法及装置_北京百度网讯科技有限公司_202311235188.3

温升预测模型训练方法、预测方法及控制方法_浙江吉利控股集团有限公司_202410908685.3

集成电路的制造方法、设计方法以及备用单元的设计方法_台湾积体电路制造股份有限公司_202410679429.1

图像编码/解码方法和图像数据的传输方法_LX半导体科技有限公司_202411317979.5

资源循环方法及资源循环管理方法_株式会社久保田_202380019741.1

包裹拉距方法及包裹分拣方法_苏州金峰物流设备有限公司_202410973216.X

数据更新方法、信息推送方法及装置_支付宝(杭州)信息技术有限公司_202410852906.X

学习装置、检查装置、学习方法以及检查方法_株式会社斯库林集团_202010947201.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种虚拟谈话数字人生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务