一种基于音频驱动二次元图片表情及动作的高效方法

导航：龙图腾网> 最新专利技术> 一种基于音频驱动二次元图片表情及动作的高效方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及视频生成技术领域，具体涉及一种基于音频驱动二次元图片表情及动作的高效方法，该方法包括：提取音频数据特征，构建人脸特征序列和姿态序列；输入图片，获得二次元的人脸特征点；将人脸特征和姿态映射到任意二维人物图片的人物特征上，实现精细化快速驱动。本发明能够在不需要独立建立人物骨骼模型的情况下，实现特征的匹配达到对人物图片的不同情感表达的实时驱动，是一种基于音频驱动的二次元形象对话系统，使用音频分析驱动二次元图片直接与人对话的系统，能完成对用户情绪的实时感知，给出情绪化的回应，提升了对话的质量，能够更好的满足用户的情感需求，解决了现有的方法中存在的很多缺陷。

主权项：1.一种基于音频驱动二次元图片表情及动作的高效方法，其特征在于，包括以下步骤：S1、提取音频数据，构建人脸特征序列和姿态序列；S1.1、音频提取特征；S1.2、音频提取特征转换到3D面部mesh，获得人脸特征序列；S1.3、音频提取姿态，获得姿态序列；S1.3、构建素材库，引入参考信息；S2、将S1中人脸特征序列和姿态序列转换为输入，然后驱动二次元形象照片，完成二次元形象动作序列；S2.1、输入图片，通过人脸识别与特征提取获得二次元的人脸特征点；S2.2、输入S1中计算的人脸特征序列和姿态序列，在获得mesh和pose序列后转化为2Dfaciallandmarks序列得到45维的姿态向量，然后将姿势向量通过二次元表情系统驱动新图像进行新姿态的图像生成；S2.3、姿势转换后的图像和外观流图输出后被放大后传入编辑器提升图片质量，最终返回给用户。

全文数据：

权利要求：

百度查询：深圳市千集技术有限公司一种基于音频驱动二次元图片表情及动作的高效方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：应用程序的远程日志处理方法、装置、设备和存储介质

下一篇：一种定子冲片收料装置

相关技术

应用程序的远程日志处理方法、装置、设备和存储介质

一种定子冲片收料装置

视频编码中的子块编码推断

一种基于传感器的憎水率智能化测定仪

一种用于半空作业的铝合金桥架打孔装置及打孔方法

用于实现激光束二维扫描的运动装置和方法

一株多功能粘绿木霉菌AWH-36及其在西瓜栽培中的应用

数据处理方法、计算机设备、存储介质和程序产品

一种具有气体发生器的冷柜

一种有机电致发光驱动电路故障诊断优化方法

数字化项目评审数据服务平台建立方法

一种训练数据生成方法、计算机设备和程序产品

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于音频驱动二次元图片表情及动作的高效方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务