首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种词汇义原层次结构的预测方法、系统及电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:清华大学

摘要:本发明提供一种词汇义原层次结构的预测方法、系统及电子设备,包括:获取原始数据,利用预训练的编码模型对原始数据中的词汇进行编码,以得到对应的文本语义向量矩阵;利于改进的解码模型对所述文本语义向量矩阵进行预设顺序的义原树解码,以得到所述文本语义向量矩阵中各文本语义对应的义原树。本发明解决了现有技术中难以同时预测词汇义原和其对应义原树结构的问题,以实现高效而低成本地构建义原知识库。

主权项:1.一种词汇义原层次结构的预测方法,其特征在于,包括:获取原始数据;利用预训练的编码模型对所述原始数据中的词汇进行编码,以得到对应的文本语义向量矩阵;利用改进的解码模型对所述文本语义向量矩阵进行预设顺序的义原树解码,以得到所述文本语义向量矩阵中各文本语义对应的义原树;其中,所述编码模型为BERT模型,利用BERT模型对数据中的词汇进行编码,以得到对应的文本语义向量矩阵,具体包括:利用预训练的BERT-base权重,在对BERT模型训练过程中进行参数调整,以得到训练后的BERT模型;利用训练后的BERT模型对词汇进行编码,得到词汇对应的语义信息,以生成文本语义向量矩阵;对所述文本语义向量矩阵进行义原树解码,通过顺序解码得到对应的义原树,实现对义原层次结构的预测,具体包括:定义BACK标识,解码过程中除BACK标识外均为普通标识,通过BACK标识对预测过程进行回退,BACK标识与普通标识形成形状无限制的义原树,将义原树与标识序列建立一一对应的关系;利用改进的注意力计算机制,引入新型相对位置编码和义原向量编码,生成Transformer义原树解码器;通过Transformer义原树解码器进行解码生成标识序列,根据义原树与标识序列建立一一对应的关系生成义原树;其中,所述定义BACK标识,通过BACK标识对预测过程进行回退,BACK标识与普通标识形成形状无限制的义原树,将义原树与标识序列建立一一对应的关系的过程为:利用解码模型输出了普通标识,则代表按照先序遍历的顺序生成了一个特定的义原;利用解码模型输出了BACK标识,则代表目前遍历的状态需要回退到当前节点的父节点,生成过程在最终回退到树的根节点时结束;通过连续不断地生成普通标识和BACK标识,得到了一颗形状无限制的义原树;将得到的形状无限制的义原树与BACK标识和普通标识组成的标识序列建立一一对应的关系。

全文数据:

权利要求:

百度查询: 清华大学 一种词汇义原层次结构的预测方法、系统及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。