买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东师范大学
摘要:本公开提供了一种基于多层次语义的文本识别方法及系统,获取待识别文本数据;提取文本数据的单词,得到各个单词的词向量;根据获取的词向量以及第一双向长短期记忆网络,得到单词的特征表示,结合第一注意力网络,得到不同视角下的词级别局部句子语义表示;根据获取的词级别的不同视角下的句子语义表示以及第二双向长短期记忆网络,得到句子的特征表示,结合第二注意力网络,得到不同视角下的句级别全局句子语义表示;根据得到的全局句子语义表示,得到文本识别结果;本公开不仅突出重要单词和句子对文本语义的贡献,而且从单一视角拓展为多视角文本语义提取,提高了文本识别的准确度。
主权项:1.一种基于多层次语义的文本识别方法,其特征在于:包括以下过程:获取待识别文本数据;提取文本数据的单词,得到各个单词的词向量;根据获取的词向量以及第一双向长短期记忆网络,得到单词的特征表示,结合第一注意力网络,得到不同视角下的词级别局部句子语义表示;根据获取的词级别的不同视角下的句子语义表示以及第二双向长短期记忆网络,得到句子的特征表示,结合第二注意力网络,得到不同视角下的句级别全局句子语义表示;根据得到的全局句子语义表示,得到文本识别结果;利用第一注意力网络,将句子中的单词权重描述为二维的权重矩阵,矩阵不同行表示句子不同视角的信息;不同视角下的词级别句子语义表示为单词的特征表示与第一注意力机制网络的权重矩阵的乘积,且权重矩阵包括约束:,其中A为权重矩阵,I为单位矩阵;根据句子的特征表示,利用第二注意力网络,得到多个视角下表示句子相互关系的权值矩阵,与句子特征相乘得到文本的全局句子语义表示矩阵。
全文数据:
权利要求:
百度查询: 山东师范大学 一种基于多层次语义的文本识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。