首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

开放层次结构关系的发现方法、装置和电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:清华大学;腾讯科技(深圳)有限公司

摘要:本发明提供一种开放层次结构关系的发现方法、装置和电子设备,包括:基于新的语料库确定待测语句;将每一个所述待测语句输入关系表征模型,输出对应的关系表征向量;对所有待测语句的关系表征向量进行聚类,确定新的关系类型;基于预设规则将所述新的关系类型插入所述原层次结构关系中;其中,所述关系表征模型是基于所述原层次结构关系中的样本语句和对应的关系类型标签进行训练得到的,所述关系表征模型训练过程中使用的损失函数基于动态层级三元组损失构建。本发明提供的方法、装置和电子设备,实现了更好理解原层次结构关系中的关系类型,将发现出的新关系自动加入已有的原层次结构关系中。

主权项:1.一种开放层次结构关系的发现方法,其特征在于,包括:基于新的语料库确定待测语句;将每一个所述待测语句输入关系表征模型,输出对应的关系表征向量;对所有待测语句的关系表征向量进行聚类,确定新的关系类型;基于预设规则将所述新的关系类型插入原层次结构关系中;其中,原层次结构关系中包括各种已有的关系类型已经对应的语句,而已有的关系类型还以一定的层级结构进行存储形成关系层次结构树;其中,所述关系表征模型是基于所述原层次结构关系中的样本语句和对应的关系类型标签进行训练得到的,所述关系表征模型训练过程中使用的损失函数基于动态层级三元组损失构建;在所述关系表征模型的训练过程中,确定输入的样本语句转换成的词语嵌入和位置嵌入拼接形式为输入样本语句表示;将所述输入样本语句表示输入关系表征神经网络,输出样本语句的关系表征向量;所述动态层级三元组损失的构建,具体包括:通过如下公式表示所述动态层级三元组损失 其中,ri和rj为从所述原层次结构关系T中以预设策略采样的任意互不相同的关系类型,va为所述原层次结构关系中关系类型ri对应的样本锚点语句a的关系表征向量,vp为所述原层次结构关系中关系类型ri对应的正样本语句p的关系表征向量,vn为所述原层次结构关系中关系类型rj对应的正样本语句p的关系表征向量,d,为两个关系表征向量之间的距离函数,l,为两个关系类型在所述原层次结构关系中的距离,λd为预设间隔;虚拟对抗训练损失的构建,具体包括:通过如下公式表示虚拟对抗训练损失 其中,v1和v2为从所述原层次结构关系T中采样的任意互不相同的语句对应的关系表征向量,和为对所述互不相同的语句加上预设扰动再经过所述关系表征模型编码得到的关系表征向量,d,为两个关系表征向量之间的距离函数;对应地,所述损失函数还基于虚拟对抗训练损失构建,具体包括:所述损失函数通过如下公式构建: 其中,为所述动态层级三元组损失,为虚拟对抗训练损失,μ为加权系数;所述基于预设规则将所述新的关系类型插入所述原层次结构关系中,具体包括:将所述新的关系类型与所述原层次结构关系中的每一个关系类型进行类与类之间的相似度计算确定所述新的关系类型的相似度;基于所述相似度以自顶向下算法将所述新的关系类型插入所述原层次结构关系中。

全文数据:

权利要求:

百度查询: 清华大学 腾讯科技(深圳)有限公司 开放层次结构关系的发现方法、装置和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。