Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于笔画卷积和词向量的中文命名实体识别方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明提供基于笔画卷积和词向量的中文命名实体识别方法及系统,涉及命名实体识别技术领域,包括:获取文本中各汉字对应的笔画序列及各汉字的字符特征向量;将笔画序列输入笔画卷积神经网络,获取笔画特征向量;根据文本中实体的最大长度设置滑动窗口,通过自注意力机制获取每个字在滑动窗口内的词向量;拼接文本中各汉字的笔画特征向量、词向量和字符特征向量,并输入BiLSTM网络,获取每个汉字对应每种实体标签的得分;采用CRF模型对文本中每个汉字确定一个最佳的实体标签。本发明考虑到汉字的笔画序列对汉字的影响,结合汉字的笔画特征向量、词特征向量和字符特征向量后,在进行命名实体识别,提高命名实体识别的效果。

主权项:1.基于笔画卷积和词向量的中文命名实体识别方法,其特征在于,包括:获取文本中各汉字对应的笔画序列及各汉字的字符特征向量;将所述笔画序列输入笔画卷积神经网络,获取笔画特征向量;根据所述文本中实体的最大长度设置滑动窗口,通过自注意力机制获取每个字在所述滑动窗口内的词向量;拼接所述文本中各汉字的所述笔画特征向量、词向量和字符特征向量,并输入BiLSTM网络,获取每个汉字对应每种实体标签的得分;采用CRF模型对所述文本中每个汉字确定一个最佳的所述实体标签;其中,所述笔画卷积神经网络通过不同窗口大小的卷积核对所述笔画序列进行卷积,获取所述笔画特征向量;所述笔画卷积神经网络通过不同窗口大小的卷积核卷积得到笔画特征图,将所述特征图进行最大池化和全连接,得到笔画特征向量,公式为: 其中:w表示卷积神经网络训练中的权重;Mt,t+k-1表示输入的特征;b表示卷积神经网络训练中的偏置;所述通过自注意力机制获取每个字在所述滑动窗口内的词向量,包括:通过所述自注意力机制计算所述滑动窗口内每两个字之间的相似度;采用softmax函数根据所述相似度获取每个字在该所述滑动窗口中的词向量;具体包括:对所述滑动窗口内的每个汉字,根据所述字符特征向量生成对应的Query向量、Key向量和Value向量;计算所述Query向量和Key向量的点积获取每个字的得分,将所述得分与每个字的所述Value向量相乘,获取该字在该所述滑动窗口内的词向量。

全文数据:

权利要求:

百度查询: 北京工业大学 基于笔画卷积和词向量的中文命名实体识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。