恭喜苏州空天信息研究院胡岩峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜苏州空天信息研究院申请的专利一种基于渐进迁移学习的细粒度实体分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114547292B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210022512.2,技术领域涉及:G06F16/35;该发明授权一种基于渐进迁移学习的细粒度实体分类方法是由胡岩峰;向镐鹏;乔雪;彭晨;姜添;闵飞;李翔;韦正勇设计研发完成,并于2022-01-10向国家知识产权局提交的专利申请。
本一种基于渐进迁移学习的细粒度实体分类方法在说明书摘要公布了:本发明提出了一种基于渐进迁移学习的细粒度实体分类方法,计算目标域的粗粒度标签与源域所有粗粒度标签的语义相似度,以及目标域的细粒度标签与源域所有细粒度标签的语义相似度;构建粗粒度标签映射集合和细粒度标签映射集合,计算语义相似度权重;通过BiLSTM网络提取语句的语义特征,得到源域粗粒度标签语句语义特征集合、细粒度标签语句语义特征集合以及目标域语义特征;计算整体粗粒度语义特征和整体细粒度语义特征,确定总的语义特征;将总的语义特征输入到softmax分类器,预测目标域选取的细粒度标签对应的实体标签;训练更新BiLSTM网络与softmax分类器参数,得到基于渐进迁移学习的细粒度实体分类模型。本发明提高了目标域细粒度实体分类准确性。
本发明授权一种基于渐进迁移学习的细粒度实体分类方法在权利要求书中公布了:1.一种基于渐进迁移学习的细粒度实体分类方法,其特征在于,步骤如下:步骤1,实体标签映射权重计算随机选取一个目标域中最后一层级标签作为目标域的细粒度标签,获取该细粒度标签的第一层级标签作为目标域的粗粒度标签;计算目标域的粗粒度标签与源域所有粗粒度标签的语义相似度,以及目标域的细粒度标签与源域所有细粒度标签的语义相似度;按相似度进行排序,构建粗粒度标签映射集合和细粒度标签映射集合,计算语义相似度权重;步骤2,语义特征提取针对源域的粗粒度标签映射集合和细粒度标签映射集合,从每个标签对应的语句中随机挑选一条,通过BiLSTM网络提取语句的语义特征,得到源域粗粒度标签语句语义特征集合和细粒度标签语句语义特征集合;针对目标域选取的细粒度标签,从标签对应的标注语句中随机挑选一条,通过BiLSTM网络提取语句的语义特征,得到目标域语义特征;步骤3,语义特征整合根据源域粗粒度标签语句语义特征和细粒度标签语句语义特征,结合语义相似度权重,计算整体粗粒度语义特征和整体细粒度语义特征,进而确定总的语义特征;步骤4,细粒度实体分类将总的语义特征输入到softmax分类器,预测目标域选取的细粒度标签对应的实体标签;步骤5,模型训练和预测将训练语料通过步骤1到步骤4多次进行迭代,训练更新BiLSTM网络与softmax分类器参数,训练完之后,得到基于渐进迁移学习的细粒度实体分类模型,将需要预测语句输入到模型中,即得到该语句细粒度实体分类的输出结果;步骤1,计算目标域的粗粒度标签与源域所有粗粒度标签的语义相似度,以及目标域的细粒度标签与源域所有细粒度标签的语义相似度,具体方法为:设定源域数据集为{lA|lA∈LA,tA|tA∈TA},目标域数据集为{lB|lB∈LB,tB|tB∈TB},LA和TA为源域的语句集合和标签集合,LB和TB为目标域的语句集合和标签集合,挑选目标域中任意一个标签的粗粒度标签为细粒度标签为分别计算目标域粗粒度标签与源域所有粗粒度标签目标域细粒度标签与源域细粒度标签标签的相似度,其计算公式如下: 其中,XA与XB分别为源域标签与目标域标签的词向量;按相似度大小进行排序,构建粗粒度标签映射集合和细粒度标签映射集合,计算语义相似度权重,具体方法为:设目标域粗粒度标签与源域粗粒度标签的相似度集合为目标域粗粒度标签与源域细粒度标签相似度集合为按相似度大小进行排序,从源域选取前m个粗粒度标签和前n个细粒度标签得到粗粒度标签映射集合和细粒度标签映射集合;计算粗粒度标签映射集合和细粒度标签映射集合中每个相似标签的权重,计算公式为: 其中,与分别为源域粗粒度标签权重与源域细粒度标签权重,与为目标域标签的权重值,为设定的目标域标签向量的相似度值;步骤2,针对源域的粗粒度标签映射集合和细粒度标签映射集合,从每个标签对应的语句中随机挑选一条,通过BiLSTM网络提取语句的语义特征,得到源域粗粒度标签语句语义特征集合和细粒度标签语句语义特征集合针对目标域选取的细粒度标签,从标签对应的标注语句中随机挑选一条,通过BiLSTM网络提取语句的语义特征,得到目标域语义特征sB;步骤3,根据源域粗粒度标签语句语义特征和细粒度标签语句语义特征,结合语义相似度权重,计算整体粗粒度语义特征和整体细粒度语义特征,进而确定总的语义特征,具体方法为:计算整体粗粒度语义特征Sc为: 计算整体细粒度语义特征Sf为: 计算渐进学习参数ε为: 计算总的语义特征Ssum为:Ssum=1-εSc+εSf9其中,与分别为源域粗粒度标签权重与源域细粒度标签权重,与为目标域标签的权重值,为设定的目标域标签向量的相似度值,ρ为渐进迁移学习的当前迭代次数与总次数的比值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州空天信息研究院,其通讯地址为:215000 江苏省苏州市苏州工业园区独墅湖大道158;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。