恭喜北京中科凡语科技有限公司周玉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京中科凡语科技有限公司申请的专利实体识别模型建立方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113919332B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111200066.1,技术领域涉及:G06F40/279;该发明授权实体识别模型建立方法、装置、电子设备及存储介质是由周玉;肖同尧设计研发完成,并于2021-10-14向国家知识产权局提交的专利申请。
本实体识别模型建立方法、装置、电子设备及存储介质在说明书摘要公布了:本公开提供了一种实体识别模型建立方法,包括:获取标注后的文本样本集,标注后的文本样本集包括多个段落类别以及多个实体类别;对标注后的文本样本分段、分句以及分字符;获得语句特征向量组和字符特征向量组;获得训练后的TextCNN模型;获得训练后的实体模型;使用训练后的TextCNN模型对向量化处理后文本进行段落类别识别,获得段落类别向量,使用训练后的实体模型对向量化处理后的文本样本进行实体识别,获得实体类别向量;将段落类别向量以及实体类别向量输入至Softmax模型进行迭代训练;以及通过损失函数值判断训练是否停止。本公开还提供了一种实体识别方法、装置、电子设备以及可读存储介质。
本发明授权实体识别模型建立方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种实体识别模型建立方法,其特征在于,包括:S102、获取标注后的文本样本集,所述标注后的文本样本集包括多个段落预置类别以及多个实体预置类别;S104、对所述标注后的文本样本集的各个文本样本进行段落拆分,并对各个段落进行语句拆分,并对各个语句进行字符拆分;S106、使用语言表示模型对各个段落的各个语句进行向量化处理,以获得各个段落的语句特征向量组[CLS1,CLS2,……],使用语言表示模型对各个语句的各个字符进行向量化处理,以获得各个语句的字符特征向量组[[token_embdedding1,token_embdedding2,……],……];S108、至少基于所述多个段落预置类别以及各个段落的语句特征向量组对TextCNN模型进行训练以获得训练后的TextCNN模型,包括对TextCNN进行微调;S110、至少基于所述多个实体预置类别以及各个段落的各个语句的字符特征向量组对实体模型进行训练以获得训练后的实体模型;S112、使用所述训练后的TextCNN模型对向量化处理后的文本样本进行段落类别识别,获得段落类别向量,使用所述训练后的实体模型对向量化处理后的文本样本进行实体识别,获得实体类别向量;S114、基于所述段落类别向量和所述实体类别向量,构成输入向量,将所述输入向量输入至Softmax模型进行迭代训练,获得训练后的Softmax模型;所述方法还包括,通过计算损失函数,判断是否满足阈值,如果满足,结束所述迭代训练,获得所述训练后的Softmax模型;所述损失函数的计算基于所述实体模型的训练的损失函数和所述Softmax模型的训练的损失函数,表示为CRFLoss+k*SoftmaxLoss,k为比例系数,取值为大于0的数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科凡语科技有限公司,其通讯地址为:100190 北京市海淀区知春路63号51号楼10层1006;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。