恭喜远古大陆人工智能科技(苏州)有限公司李蒙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜远古大陆人工智能科技(苏州)有限公司申请的专利结合图像识别的数字人姿态调整方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119473209B 。
龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411558827.4,技术领域涉及:G06F3/16;该发明授权结合图像识别的数字人姿态调整方法及装置是由李蒙设计研发完成,并于2024-11-04向国家知识产权局提交的专利申请。
本结合图像识别的数字人姿态调整方法及装置在说明书摘要公布了:本发明公开了结合图像识别的数字人姿态调整方法及装置,涉及数字人控制技术领域,该方法包括:启动对交互对象的数据采集行为;在进行面部图像数据采集的过程中同步进行累积情绪识别,获得实时交互情绪;进行交互需求解析,获得交互诉求摘要;根据交互诉求摘要生成适配回应文本;融合分析适配回应文本和实时交互情绪,输出情绪姿态序列和韵律标注序列;根据韵律标注序列和适配回应文本进行适配回应语音的同步动态合成播放。本发明解决了现有技术中数字人难以准确感知访客情绪和诉求并进行适配性姿态和语音调整的技术问题,达到了提高数字人对访客情绪和诉求的识别准确性,增强数字人姿态和语音对访客情绪适配性的技术效果。
本发明授权结合图像识别的数字人姿态调整方法及装置在权利要求书中公布了:1.结合图像识别的数字人姿态调整方法,其特征在于,所述方法包括:在许可交互对象对目标数字人的交互行为后,启动对交互对象的数据采集行为;在对所述交互对象进行面部图像数据采集的过程中同步进行累积情绪识别,获得实时交互情绪;对所述交互对象进行文本特征数据采集结束后,基于所述文本特征数据进行交互需求解析,获得交互诉求摘要;根据所述交互诉求摘要生成适配回应文本;融合分析所述适配回应文本和实时交互情绪,输出情绪姿态序列和韵律标注序列;在采用所述情绪姿态序列进行目标数字人的姿态调整过程中,根据所述韵律标注序列和适配回应文本进行适配回应语音的同步动态合成播放;在对所述交互对象进行面部图像数据采集的过程中同步进行累积情绪识别,获得实时交互情绪,所述方法包括:预设情绪识别更新区间;采用摄像头对所述交互对象进行面部图像数据采集的过程中,摄像头以所述情绪识别更新区间为图像数据更新间隔进行采集所获多帧图像流的暂存,并以所述情绪识别更新区间为传输周期,将所述多帧图像流间隔同步至累积情绪识别模型;所述累积情绪识别模型基于间隔上传的所述多帧图像流进行情绪变化趋势的捕捉更新,获得所述实时交互情绪;所述方法包括:所述累积情绪识别模型包括级联的面部特征识别层、情绪状态更新层和情绪趋势提取层;交互获得样本情绪特征集,并将所述样本情绪特征集作为训练数据,训练基于卷积神经网络预构建的面部特征识别模型;通过将训练优化后的所述面部特征识别模型同步至所述面部特征识别层,完成所述面部特征识别层的构建;采用预定义的情绪特征筛选规则构建情绪特征选择门,并通过将情绪特征选择门和情绪状态整合门级联,完成所述情绪状态更新层的构建;引入多维情绪波动阈构建情绪突变检测单元,并通过级联所述情绪突变检测单元和情绪输出调节单元,完成所述情绪趋势提取层的构建;融合分析所述适配回应文本和实时交互情绪,输出情绪姿态序列和韵律标注序列,所述方法包括:交互获得多个样本交互情绪节点和多个样本反馈情绪节点;创建所述多个样本交互情绪节点和多个样本反馈情绪节点的映射关系,并基于映射关系构建反馈情绪图谱;调用所述多个样本反馈情绪节点的多组样本情绪姿态,并将所述多组样本情绪姿态存储至所述反馈情绪图谱;采用所述实时交互情绪遍历所述反馈情绪图谱,调用获得所述情绪姿态序列,其中,所述情绪姿态序列由动作姿态情绪和语音姿态情绪构成;采用所述语音姿态情绪对所述适配回应文本进行韵律标注,获得所述韵律标注序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人远古大陆人工智能科技(苏州)有限公司,其通讯地址为:215000 江苏省苏州市相城区元和街道聚茂街185号活力商务广场D栋11层1101-2室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。