首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种中文对话语义角色标注方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中山大学·深圳;中山大学

摘要:本发明公开了一种中文对话语义角色标注方法及系统,该方法包括:将数据集中的对话文本数据进行关联实体增强处理,得到增强数据集;将增强数据集输入轻量化关联实体增强模型,输出富有外部知识的词向量;根据对话语义角色标注的数据样本构建索引编码器并输出索引向量;将富有外部知识的词向量与索引向量进行拼接,得到拼接向量;将拼接向量输入至预构建的语义角色标注层,得到语义角色标注结果。本发明基于轻量化技术对中文对话语义标注的模型进行轻量化处理,能够减少整体模型的参数,降低模型的计算代价,本发明作为一种中文对话语义角色标注方法及系统,可广泛应用于自然语言处理技术领域。

主权项:1.一种中文对话语义角色标注方法,其特征在于,包括以下步骤:将数据集中的对话文本数据进行关联实体增强处理,得到增强数据集;将增强数据集输入轻量化关联实体增强模型,输出富有外部知识的词向量;根据对话语义角色标注的数据样本构建索引编码器并输出索引向量;将富有外部知识的词向量与索引向量进行拼接,得到拼接向量;将拼接向量输入至预构建的语义角色标注层,得到语义角色标注结果;所述将增强数据集输入轻量化关联实体增强模型,输出富有外部知识的词向量这一步骤,其具体包括:将BERT架构的RoBERTa预训练模型作为词向量编码器,构建关联实体知识增强模型;将关联实体知识增强模型依次进行适应性修改和轻量化处理,构建轻量化关联实体知识增强模型并将增强数据集输入轻量化关联实体增强模型,输出富有外部知识的词向量;所述将关联实体知识增强模型依次进行适应性修改和轻量化处理,构建轻量化关联实体知识增强模型并将增强数据集输入轻量化关联实体增强模型,输出富有外部知识的词向量这一步骤,其具体包括:基于软位置编码对关联实体知识增强模型的输入层进行适应性修改,得到修改后的输入层;获取清洗后的数据集中的对话文本数据与关联实体的关系并结合硬位置编码,构建可见矩阵;基于可见矩阵对BERT编码器层进行适应性修改,得到修改后的BERT编码器层;对修改后的BERT编码器层进行轻量化处理,得到轻量化后的K-BERT编码器层;结合修改后的输入层和轻量化后的K-BERT编码器层,构建轻量化关联实体知识增强模型;将增强数据集进行两种词序编码处理并输入轻量化关联实体知识增强模型,输出富有外部知识的词向量,所述两种词序编码包括硬位置编码和软位置编码;所述将增强数据集进行两种词序编码处理并输入轻量化关联实体知识增强模型,输出富有外部知识的词向量这一步骤,其具体包括:基于增强数据集对轻量化关联实体增强模型进行多代的训练,对增强数据集中的请求实体相关的知识进行增强处理,得到增强数据集合;通过对每一个查找句子数据中的所有请求实体请求到的增强数据集合中,对于每个请求实体,均随机取出对应的一个关联实体插入到该请求实体后面,得到增强句子;将增强句子进行两种词序编码,得到各个词对应的位置索引;将增强句子、软位置编码索引和可见矩阵输入轻量化关联实体知识增强模型,输出富有外部知识的词向量。

全文数据:

权利要求:

百度查询: 中山大学·深圳 中山大学 一种中文对话语义角色标注方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。