恭喜浙江工业大学吕明琪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工业大学申请的专利一种基于机器阅读理解的威胁情报命名实体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114757193B 。
龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210375786.X,技术领域涉及:G06F40/295;该发明授权一种基于机器阅读理解的威胁情报命名实体识别方法是由吕明琪;张炜钰;朱添田;陈铁明设计研发完成,并于2022-04-11向国家知识产权局提交的专利申请。
本一种基于机器阅读理解的威胁情报命名实体识别方法在说明书摘要公布了:本发明公开了一种基于机器阅读理解的威胁情报命名实体识别方法,包括:对威胁情报进行分句处理,并基于网络安全专业词库过滤不包含网络安全专业词汇的句子,过滤后得到句子集合;逐个取句子集合中的句子,对句子中的每个实体标注一个问答对;利用标注后的句子集合对识别模型进行训练;利用训练后的识别模型对威胁情报进行命名实体识别。本发明基于机器阅读理解的威胁情报命名实体识别可以有效解决威胁情报实体分类模糊以及嵌套实体问题;构建的问题中自带实体隐藏信息可以有效提高识别准确率;将实体识别由序列标注问题转化为分类匹配问题,因此一个具有多个实体的句子可以生成多个训练样本,从而降低了对句子数量的要求。
本发明授权一种基于机器阅读理解的威胁情报命名实体识别方法在权利要求书中公布了:1.一种基于机器阅读理解的威胁情报命名实体识别方法,其特征在于,所述基于机器阅读理解的威胁情报命名实体识别方法,包括:步骤1、对威胁情报进行分句处理,并基于网络安全专业词库过滤不包含网络安全专业词汇的句子,过滤后得到句子集合;步骤2、逐个取句子集合中的句子,对句子中的每个实体标注一个问答对;步骤3、利用标注后的句子集合对识别模型进行训练,包括:步骤3.1、取句子中的一类实体进行训练,将实体标注的问答对中的问题和对应句子进行拼接,对拼接后的句子进行分词处理得到词序列,并基于词序列进行特征提取得到文本特征矩阵;其中,所述基于词序列进行特征提取得到文本特征矩阵,包括:在词序列的头部添加一个特殊标记用于表示序列的开始,在问题和句子之间添加标记分隔符,得到完整词序列;利用ALBERT模型对完整词序列进行特征提取得到文本特征矩阵,文本特征矩阵表示为E∈Rn*d,其中n为句子长度,d为ALBERT模型最后一层提取的特征的向量维度,即文本特征矩阵E的每一行代表一个词对应的特征向量;步骤3.2、用两个二分类器对文本特征矩阵中每个词进行分类,第一个二分类器用于判断词是否为问题所对应的答案的开始词,第二个二分类器用于判断词是否为问题所对应的答案的结束词,得到句子中每个词属于开始词的概率以及每个词属于结束词的概率;步骤3.3、从句子中每个词属于开始词的概率中选取概率为最大评分的词对应的索引作为开始索引,从句子中每个词属于结束词的概率中选取概率为最大评分的词对应的索引作为结束索引;步骤3.4、根据开始索引和结束索引,使用一个二分类器计算开始词和结束词之间的匹配程度,输出匹配程度高于阈值的开始索引和结束索引作为预测答案;步骤3.5、根据输出的预测答案以及实际答案计算损失函数用于更新各二分类器的参数,并返回步骤3.1继续进行识别模型训练直至收敛;其中,所述根据输出的预测答案以及实际答案计算损失函数,包括:在训练阶段有三个损失函数分别为:开始位置损失函数Lstart、结束位置损失函数Lend、实体匹配损失函数Lspan,最终识别模型的损失函数L为训练各阶段的损失总和,计算公式如下:Lstart=CEPstart,YstartLend=CEPend,YendLspan=CEPstart_end,Ystart_endL=αLstart+βLend+γLspan式中,Pstart为句子中每个词属于开始词的预测概率,Ystart为句子中每个词属于实体的开始词的实际概率,Pend为句子中每个词属于结束词的预测概率,Yend为句子中每个词属于实体的结束词的实际概率,Pstart_end表示开始词和结束词之间的预测匹配程度,Ystart_end表示开始词和结束词之间的实际匹配程度,CE为交叉熵损失函数,α,β,γ为权重系数,α,β,γ∈[0,1|;步骤4、利用训练后的识别模型对威胁情报进行命名实体识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。