一种用于AI数字人的科研资料知识图谱构建方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东圣剑医学研究有限公司

摘要：本发明涉及数据处理技术领域，具体涉及一种用于AI数字人的科研资料知识图谱构建方法，本发明以段为单位来构建特征词向量，然后通过计算对应段落的特征词向量之间的对齐度来对不同的特征词向量进行对齐处理，然后通过对齐的两个特征词向量之间的段落相似性来修正传统的余弦相似度距离指标，然后使用修正后的距离指标来计算特征词向量之间的相似性，进而得到更准确的聚类结果，构建的科研资料知识图谱更可靠。

主权项：1.一种用于AI数字人的科研资料知识图谱构建方法，其特征在于，所述方法包括：获取科研资料文档，提取所述科研资料文档中的实体；构建所述实体所在的科研资料文档段落的特征词向量；基于所述特征词向量，分析所述实体所在的两个科研资料文档对应段落中的分词之间的及其同义词之间的相似度，获得所述实体所在的两个科研资料文档对应段落中的分词之间的对齐度，根据所述对齐度，获得对齐特征词向量；根据所述对齐度，结合所述实体所在段落的相对位置，获得所述实体所在的两个科研资料文档对应段落中的两个所述对齐特征词向量的相似度权重系数；根据所述相似度权重系数，结合两个所述对齐特征词向量间的余弦相似度，获得两个所述对齐特征词向量之间的修正余弦相似度；根据所述修正余弦相似度，获得所述对齐特征词向量之间的修正相似性矩阵，基于所述修正相似性矩阵对所述实体进行聚类，完成科研资料知识图谱构建；基于所述特征词向量，分析所述实体所在的两个科研资料文档对应段落中的分词及其同义词之间的相似度，获得所述实体所在的两个科研资料文档对应段落中的分词之间的对齐度，包括：使用word2vec模型计算所述实体所在的两个科研资料文档对应段落中的分词之间的相似度；使用word2vec模型，分析所述实体所在的两个科研资料文档对应段落中分词的同义词之间的相似度，获得所述实体所在的两个科研资料文档对应段落中分词的同义词之间的相似系数；对分词之间的相似度和分词的同义词之间的相似系数加权，获得所述实体所在的两个科研资料文档对应段落中的分词之间的对齐度；所述分词的同义词之间的相似系数计算公式为：式中，表示第个实体在第个文档中第个段落内的第个分词的同义词和第个实体在第个文档中第个段落内的第个分词的同义词的相似系数，表示第个实体在第个文档中第个段落内的第个分词的同义词和第个实体在第个文档中第个段落内的第个分词的同义词的相似个数，表示第个实体在第个文档中第个段落内的第个分词的同义词的个数，表示第个实体在第个文档中第个段落内的第个分词的同义词的个数，表示所有个相似的分词同义词对应的相似度的均值；根据所述对齐度，结合所述实体所在段落的相对位置，获得所述实体所在的两个科研资料文档对应段落的两个对齐特征词向量的相似度权重系数，包括：计算所述实体所在的一个科研资料文档段落中所有的分词与所述实体所在的另一个科研资料文档段落中分词的对齐度的均值；计算所述实体所在的一个科研资料文档段落中所有的分词与所述实体所在的另一个科研资料文档段落中分词的对齐度之间的聚集度；根据所述对齐度、所述对齐度的均值及所述对齐度之间的聚集度，结合所述实体所在段落的相对位置，获得所述实体所在的两个科研资料文档对应段落的两个对齐特征词向量的相似度权重系数；所述相似度权重系数计算公式为：式中，表示第个实体在第个文档中第个段落的对齐特征词向量和第个实体在第个文档中第个段落的对齐特征词向量的相似度权重系数，表示第个实体在第个文档或第个实体在第个文档中的段落总数，表示第个实体在第个文档或第个实体在第个文档中第个段落的编号值，表示第个实体在第个文档中第个段落中的所有分词与第个实体在第个文档中第个段落中分词所有的对齐度的均值，表示第个实体在第个文档中第个段落的所有分词与第个实体在第个文档中第个段落中分词所有的对齐度之间的聚集度，表示第个实体在第个文档中第个段落的所有分词与第个实体在第个文档中第个段落中分词所有的对齐度中小于0.3的个数，表示归一化函数。

全文数据：

权利要求：

百度查询：山东圣剑医学研究有限公司一种用于AI数字人的科研资料知识图谱构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：新型弹簧球铰支座

下一篇：一种可控流量的自动倒袋装置

相关技术

新型弹簧球铰支座

一种可控流量的自动倒袋装置

一种储物筐可调节的电动购物车

一种涂装喷粉装置

一种集成电路的成品测试方法和存储介质

一种雾化装置

基于人工智能的隧道空压机组智能控制系统和方法

全塑壳防静电吹尘枪

一种具有防护功能的建筑结构加固连接装置

一种体外诊断试剂盒

一种细胞凋亡检测试剂盒

一种气动切管机的夹紧装置

资料相关技术

一种工程造价用资料柜_广东皓升建设工程有限公司_202420482612.8

基于大数据的儿童数字媒体资料智能推荐方法_浙江师范大学_202410866908.4

一种人力资源管理用档案资料存放装置_重庆市铜梁区人民医院_202410956718.1

基于随钻录井资料求取抗钻特性参数的方法_大庆石油管理局有限公司_202210196646.6

合同资料安全管理系统_胥顺_202410784665.X

一种水文资料整编工具_黑龙江省水文水资源中心哈尔滨分中心_202420623415.3

一种资料收纳装置_中国科学院成都文献情报中心_202420403938.7

一种房产资料存储柜_安徽若邻网络科技有限公司_202420468325.1

一种经济管理组合资料柜_塔里木大学_202420454276.6

项目资料信息化管理方法及系统_恒实建设管理股份有限公司_202411261399.9

知识相关技术

基于知识图谱的问答处理方法及装置_支付宝(杭州)信息技术有限公司_202410831344.0

基于知识推理的土壤侵蚀类型预测方法_河北工业大学_202411102649.4

大语言模型的知识蒸馏微调方法、装置、设备及存储介质_芯安微众(上海)微电子技术有限公司_202411000020.9

一种基于知识图谱的急诊分诊问答系统_吉林大学第一医院_202411172638.3

电池材料知识图谱构建方法、装置、电子设备及存储介质_宁德时代新能源科技股份有限公司_202310457280.8

一种基于多任务增强的知识追踪方法_兰州速微网络科技有限公司_202410799641.1

一种基于知识图谱和大语言模型的问题澄清方法_龙盈智达(北京)科技有限公司_202410869298.3

基于知识空间的数据问答方法、控制器及存储介质_上海云从企业发展有限公司_202410949652.3

基于水文知识的遥感监测河流水面特征参数精度提升方法_中国长江电力股份有限公司_202410967987.8

基于知识图谱的轨道交通设备故障实时检测方法及系统_中铁第一勘察设计院集团有限公司_202410851852.5

科研相关技术

基于大模型的医疗科研数据交互式引导索引方法及系统_中南大学湘雅医院_202410458244.8

一种用于科研演示的氢能微电网系统及其分层控制方法_同济大学_202410858307.9

科研用黑灯湿法实验室_香港科技大学(广州)_202411304590.7

一种医疗认知智能科研平台的模型管理和应用方法_四川数愈医疗科技有限公司_202210667291.4

科研用全自动显影组件、显影装置以及显影机台_香港科技大学(广州)_202411277363.X

一种科研项目进度与预算智能管理系统_中原电子技术研究所(中国电子科技集团公司第二十七研究所)_202410898608.4

猫免疫球蛋白科研试剂盒_烟台中宠食品股份有限公司_202420195344.1

一种基于科研项目标签的科研数据库复用方法及系统_东南大学附属中大医院_202410920485.X

基于子图表征学习的科研成果聚类推荐方法及系统_中山大学_202411099051.4

一种面向工程科研办公的操作方法、系统及存储介质_北京峥研软件有限责任公司_202410752409.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于AI数字人的科研资料知识图谱构建方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务