Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜合肥第一房网络科技有限公司;安徽中科徽美信息科技有限公司王仁华获国家专利权

恭喜合肥第一房网络科技有限公司;安徽中科徽美信息科技有限公司王仁华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜合肥第一房网络科技有限公司;安徽中科徽美信息科技有限公司申请的专利基于深度学习的个性化数字人形象创建与生成系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119600162B

龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510143225.0,技术领域涉及:G06T13/40;该发明授权基于深度学习的个性化数字人形象创建与生成系统是由王仁华设计研发完成,并于2025-02-10向国家知识产权局提交的专利申请。

基于深度学习的个性化数字人形象创建与生成系统在说明书摘要公布了:本发明公开了基于深度学习的个性化数字人形象创建与生成系统,涉及数字人生成技术领域,本发明包括多元数据获取模块、形象创建模块、模型存储模块、匹配模块及渲染交互模块;多元数据获取模块通过摄像头采集面部图像、全身照片,通过麦克风录制语音样本;本发明,通过构建多元数据获取模块、形象创建模块、模型存储模块、匹配模块及渲染交互模块,实现了从数据采集到数字人形象生成的全流程自动化处理;多元数据获取模块能够全面捕捉用户的外貌和语音特征,而形象创建模块则利用深度学习技术提取特征向量,并采用生成对抗网络技术生成个性化数字人形象。

本发明授权基于深度学习的个性化数字人形象创建与生成系统在权利要求书中公布了:1.基于深度学习的个性化数字人形象创建与生成系统,其特征在于,包括:多元数据获取模块,通过摄像头采集面部图像、全身照片,利用麦克风录制语音样本,并在采集时验证环境参数,对采集的数据进行预处理;形象创建模块,构建多种神经网络模型分别提取面部、全身、语音特征向量,采用自适应策略优化特征提取,融合特征向量后利用GAN技术生成个性化数字人形象,判别器通过多种方式评估与用户需求匹配度,不达标时进行数据回溯分析并优化,同时在GAN训练中采用多种优化策略提升模型性能;模型存储模块,建立分布式存储数据库,存储数字人模型及相关元数据,分类管理模型并建立索引机制,定期监测模型并优化数据库性能;匹配模块,接收新需求时采集面部和全身图像处理得到新外貌特征向量,计算其与存储模型特征向量相似度,高于阈值则微调模型,低于阈值则重新建立模型;渲染交互模块,根据用户调取需求获取模型,分析场景光照环境和模型材质属性,运用PBR和光线追踪算法渲染,根据数字人位置和设备性能动态调整细节层次和渲染参数,实现数字人在不同场景下的呈现和交互;所述多元数据获取模块的具体步骤如下:用摄像头采集用户多角度面部图像、全身照片,确保全面获取外貌特征信息;同时,通过麦克风录制用户多类型语音样本,包括日常对话、主题演讲,以捕捉语音特征;在进行外貌特征信息及语音特征采集时进行验证,通过获取外貌特征及语音特征采集时的环境参数进行判断;对采集的面部和全身图像进行裁剪,去除无关背景干扰;进行归一化处理,统一图像尺寸、色彩空间参数;运用图像增强算法,包括直方图均衡化增强对比度、高斯滤波去除噪声,提升图像质量;对语音样本进行降噪处理,采用语音活动检测算法去除静默段,优化音频格式为统一标准格式;所述多元数据获取模块在进行外貌特征信息及语音特征采集时进行验证的具体操作步骤如下:外貌特征采集时的环境参数包括:光照强度:使用勒克斯来度量,设置光照强度标准值,并计算光照强度与标准值的差值,记为强差值;光照均匀度:通过计算不同位置光照强度方差进行量化,通过公式:光照均匀度=,其中,是各测量点的光照强度,是平均光照强度,是测量点数量;背景对比度:通过计算背景与用户外貌特征平均亮度差和颜色差来量化;拍摄角度偏差:通过安装在摄像头上的角度传感器来测量拍摄角度,计算所有获取的图像角度与预设的标准角度的角度差,并进行求和,记为角偏值;将得到的强差值、光照均匀度、背景对比度及角偏值分别标定为qi、gf、hg及jy,归一化处理后代入以下公式:以得到外判值ZKL,式中分别为强差值、光照均匀度、背景对比度及角偏值的预设权重系数;并将得到的外判值ZKL与预设的外判阈值进行比对,当外判值ZKL大于预设的外判阈值,则判断外貌特征采集时的环境参数达标,反之,则调整外貌特征采集时的环境参数并重新采集;音特征采集时的环境参数包括:背景噪音强度:使用声压级来量化背景噪音,并记为背噪值;混响时间:通过声学测量仪器,包括声级计和脉冲响应测量仪来测量混响时间声音在室内衰减60dB所需要的时间,并记为消音值;声音频率响应:使用音频分析仪来测量环境在不同频率下的声音衰减或放大情况,得到频率响应曲线,并通过计算曲线的平坦度来量化这一参数,并记为声频值;将得到的背噪值、消音值及声频值分别量化至1-10之间的评分,分别得到背噪值评分、消音值评分及声频值评分,归一化处理后,以背噪值评分为半径建立底圆,再以消音值评分为高建立圆锥体模型,选取圆锥体模型顶点作为球心,以声频值为直径建立球形体模型,计算圆锥体与球形体形成的异形体模型的体积,并记为音判值;将得到的音判值与预设的音判阈值进行比对,当音判值大于预设的音判阈值时,则判断音特征采集时的环境参数达到标准,反之,则对音特征采集时的环境参数进行优化并重新采集音特征;所述形象创建模块的具体操作步骤如下:构建卷积神经网络模型,针对面部图像训练,学习五官形状、比例、位置关系以及皮肤纹理特征,输出面部特征向量;利用基于卷积神经网络模型的人体姿态识别模型处理全身照片,提取身材比例、肢体形态、体态特征,形成全身特征向量;采用循环神经网络或长短期记忆网络分析语音样本,提取基频、共振峰、音高变化、语速变化、韵律特征以及情感色彩,生成语音特征向量;针对不同模态数据的特点,采用自适应特征提取策略;包括对于面部图像中表情变化大于预设标准的数据,增加卷积神经网络模型的卷积层深度以增强特征学习能力;对于语音样本中的方言或口音,优化模型的参数初始化方法,提高特征提取的准确性;基于统计平均人体模型或三维扫描标准人体模型构建基础数字人模型,根据用户基本特征初始化模型参数,包括骨骼结构、肌肉分布、皮肤基础质感;将提取的多模态特征向量进行融合,采用加权求和或向量拼接融合方式,形成综合特征向量;利用生成对抗网络技术,构建包含生成器和判别器的模型架构;生成器以综合特征向量为输入,通过多层神经网络生成个性化数字人形象,包括面部五官细节、符合身材特征的身体形态;判别器接收生成的数字人形象和真实人类图像数据,判断与用户需求的匹配度;通过生成器和判别器的对抗训练,优化生成器的参数,提高生成数字人形象的质量和个性化程度;在成对抗网络训练过程中,采用优化策略;引入注意力机制,使生成器在生成数字人形象时关注用户的个性化特征,包括突出用户的面部标识或服饰细节;运用多尺度训练方法,让模型在不同分辨率下学习数字人形象的特征,提高生成形象的细节丰富度和整体协调性;同时,采用迁移学习技术,将在大规模通用数据集上预训练的模型参数迁移到模型中,加快训练收敛速度,提升模型性能;所述形象创建模块判断与用户需求的匹配度的具体操作步骤如下:进行外貌特征匹配度评估及风格特征量化比较;特征向量距离度量:将用户需求中的外貌特征和生成数字人形象的对应特征分别转化为特征向量;对于五官形状,通过关键点坐标构建向量;身材比例以比例数值构建向量;然后计算两者之间的余弦相似度:,其中是用户需求向量,是生成数字人向量;并以余弦相似度作为衡量数字人形象与用户需求特征向量距离的标准,记为特评值;属性匹配针对发型、肤色、服装风格属性,建立匹配规则和得分体系;具体的:发型通过发型类型、长度范围、刘海样式属性进行判断,完全匹配得1分,部分匹配得0.5分,不匹配得0分,并记为发型得分;肤色在Lab颜色空间中计算与用户需求肤色的距离,式中和分别代表用户期望的肤色值和生成数字人的肤色值;和分别代表用户期望的绿色到红色的颜色分量属性值和生成数字人的绿色到红色的颜色分量属性值;和分别代表用户期望的蓝色到黄色的颜色分量属性值和生成数字人的蓝色到黄色的颜色分量属性值;预设若干个距离区间,根据计算得到的肤色在Lab颜色空间中计算与用户需求肤色的距离d匹配对应的距离区间,确定得分,并记为肤色得分;服装风格通过预定义的风格分类模型判断,匹配概率高于0.8得1分,0.5-0.8得0.5分,低于0.5得0分,记为服装得分;将发型得分、肤色得分及服装得分归一化处理后,分别以服装得分;将发型得分、肤色得分及服装得分为三角形的三条边建立三角形,计算该三角形的面积,并记为属性得分,以此属性得分作为衡量属性匹配的结果;风格特征量化:对不同风格进行量化,计算生成数字人的服装颜色与对应量化的风格服饰颜色的马氏距离,并记为风评值;情感特征匹配评估:依据情感心理学理论,将活泼、沉稳情感特征与面部表情和姿态动作相关联并量化;计算生成数字人情感特征向量与用户需求情感特征向量的余弦相似度,并记为情评值;将得到的特评值、属性得分、风评值及情评值分别标定为TR、SY、FO及QU,归一化处理后代入以下公式:以得到综判分DFQ,式中分别为特评值、属性得分、风评值及情评值的预设权重系数,将得到的综判分DFQ与预设的综判分阈值进行比对,当综判分DFQ大于预设的综判分阈值,则判断生成的数字人形象与用户需求匹配度达到标准,反之,则进行数据回溯,确定不达标部分。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥第一房网络科技有限公司;安徽中科徽美信息科技有限公司,其通讯地址为:230000 安徽省合肥市经济技术开发区芙蓉路268号创新创业园2A三层南;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。