买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种药品知识图谱构建方法、装置、设备及存储介质,将药品说明书文本中的字符向量化,得到包括多个词向量的词向量序列,采用多头注意力机制对词向量序列进行处理,得到包括多个特征向量的特征向量序列,基于特征向量计算字符为每一实体标签的第一概率值,并基于第一概率值确定字符对应的实体,基于特征向量和第一概率值计算实体与药品说明书文本中的其他实体的关系的第二概率值,并基于第二概率值确定实体与药品说明书文本中的其他实体的关系,基于词向量序列自回归生成用于描述实体与药品说明书文本中的其他实体的关系的描述文本,可以降低成本,提高准确度。
主权项:1.一种药品知识图谱构建方法,其特征在于,包括:获取药品说明书文本,并将所述药品说明书文本中的字符向量化,得到包括多个词向量的词向量序列;采用多头注意力机制对所述词向量序列进行处理,得到包括多个特征向量的特征向量序列;基于所述特征向量计算所述字符为每一实体标签的第一概率值,并基于所述第一概率值确定所述字符对应的实体;基于所述特征向量和所述第一概率值计算所述实体与所述药品说明书文本中的其他实体的关系的第二概率值,并基于所述第二概率值确定所述实体与所述药品说明书文本中的其他实体的关系;基于所述词向量序列自回归生成用于描述所述实体与所述药品说明书文本中的其他实体的关系的描述文本;基于所述特征向量和所述第一概率值计算所述实体与所述药品说明书文本中的其他实体的关系的第二概率值,并基于所述第二概率值确定所述实体与所述药品说明书文本中的其他实体的关系,包括:针对每一所述特征向量,将所述特征向量输入第一线性化层中进行线性化处理,得到第一空间向量;将所述第一空间向量输入第一激活函数层中进行激活处理,得到所述字符为每一实体标签的第一概率值;在所述第一概率值的最大值大于预设值时,将所述最大值对应的实体标签作为所述字符对应的实体;计算所述实体与所述药品说明书文本中的其他实体的相关性,得到相关性向量;将所述相关性向量输入第二线性化层中进行线性化处理,得到第二空间向量;将所述第二空间向量输入第二激活函数层中进行激活处理,得到所述实体与所述药品说明书文本中的其他实体的关系的第二概率值;将所述第二概率值中的最大值对应的关系作为所述实体与目标实体的关系,其中,目标实体为所述第二概率值中的最大值对应的实体;基于所述词向量序列自回归生成用于描述所述实体与所述药品说明书文本中的其他实体的关系的描述文本,包括:融合所述词向量序列和初始化的输出文本序列,得到融合序列;采用多头注意力机制对所述融合序列进行处理,得到中间向量;基于所述中间向量计算输出字符为词汇表中各样本字符的第三概率值;取所述第三概率值中的最大值对应的样本字符作为输出字符;将所述输出字符转换为向量,更新所述输出文本序列,并返回执行融合所述词向量序列和输出文本序列,得到融合序列的步骤,直至所述输出字符为结束符。
全文数据:
权利要求:
百度查询: 广州方舟信息科技有限公司 一种药品知识图谱构建方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。