首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于用户意图嵌入图谱学习的主题文本快速检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国家计算机网络与信息安全管理中心上海分中心

摘要:本发明公开了一种基于用户意图嵌入图谱学习的主题文本快速检测方法,属于文本检测技术领域,该检测方法具体步骤如下:1识别主题文本以抽取主题特征;2嵌入用户意图以进行结构化提取;3对知识图谱进行结构化处理;4构建深度学习模型以检测主题文本;本发明能够更容易用户操作,贴近用户意图,与人工判定结果更为贴近,通过融合主动搜索知识图谱和深度学习的方法,能够提升算法识别性能,提高效率,识别准确率和召回率较高。

主权项:1.一种基于用户意图嵌入图谱学习的主题文本快速检测方法,其特征在于,该检测方法具体步骤如下:(1)识别主题文本以抽取主题特征:对主题文本进行分词,并识别主题实体,同时抽取其中主题特征关键词,并将其转化为词向量;(2)嵌入用户意图以进行结构化提取:机器向用户主动提出问题,同时从用户的反馈中获取信息,再对这些信息处理,形成用户意图知识,并将用户偏好和知识图谱嵌入到同一低维向量空间,机器针对用户的反馈打分得到用户偏好在向量空间的定位;(3)对知识图谱进行结构化处理:得到主题内容知识图谱与主题特征相关的实体和关系,同时构建TransD模型接收相关数据,并针对主题描述语句进行具体分析,同时识别主题嵌入特征实体向量和上下文实体向量,实现知识图谱嵌入;(4)构建深度学习模型以检测主题文本:构建CNN深度学习模型,并将主题文本特征词向量输入深度学习模型CNN多通道,进行CNN模型训练学习,并依据用户意图实体向量,快速检测得到更多目标主题文本;步骤(2)中所述用户偏好和知识图谱嵌入具体步骤如下:第一步:使用prefer向量表示空间中原点到用户兴趣偏好嵌入的向量,同时用户对特定实体e的偏好程度通过prefer和e的欧几里得距离衡量;第二步:当用户偏好点与实体对应点距离越近,表明用户更偏好该实体,有助于机器选择更为贴近目标主题的文本;第三步:收集用户评分,并组建用户评分数据集Score∈{-2,-1,1,2},-2代表非常不感兴趣,-1代表不感兴趣,1代表感兴趣,2代表非常感兴趣;第四步:针对用户对各主题的评分,并调整用户偏好嵌入向量prefer,使其更接近目标节点嵌入,当用户给出足够反馈信息后,将得到包含最可能k个答案的主题特征词列表;步骤(3)中所述知识图谱嵌入具体步骤如下:S1.1:TransD模型通过文本特征词与知识图谱三元组候选实体进行实体相似性计算消除歧义,以获得实体知识;S1.2:构造主题文本知识子图,并依照实体提取子图中与实体相连的关系;S1.3:采用知识图谱嵌入模型进行学习,把学习到的实体向量作为CNN层的输入。

全文数据:

权利要求:

百度查询: 国家计算机网络与信息安全管理中心上海分中心 一种基于用户意图嵌入图谱学习的主题文本快速检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。