首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于word2vec模型的灾害元数据自动匹配方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:郑州大学

摘要:本发明属于防灾减灾技术领域,公开了一种基于word2vec模型的灾害元数据自动匹配方法及系统,具体包括以下步骤:自然灾害元数据采集及预处理,采用word2vec模型的CBOW架构,在LCQMC语料库上进行模型训练;基于训练结果,确定元数据匹配和元数据不匹配的余弦距离均值,作为置信度阈值;元数据抽取、分词、词向量转换以及计算词向量之间的余弦距离,如果计算出的词向量之间的余弦距离大于置信度阈值,则判定元数据是匹配的,并对匹配结果进行评估,以确保其完整性、一致性和准确性。本发明提出的灾害元数据自动匹配方法使得灾害元数据处理的效率更高,从而增强了对灾害应对的及时性和准确性。

主权项:1.一种基于word2vec模型的灾害元数据自动匹配方法,其特征在于,包括以下步骤:步骤1:元数据采集及预处理:采集自然灾害元数据,将采集到的元数据分为结构化元数据和非结构化元数据,将非结构化元数据进行转换后进行词性标注形成文本序列x;步骤2:模型训练:采用word2vec模型的CBOW架构,在LCQMC语料库上进行训练;步骤3:设定置信度阈值:基于训练结果,确定元数据匹配和元数据不匹配的余弦距离均值,作为置信度阈值;步骤4:元数据抽取:利用数据解析规则进行结构化元数据的抽取、利用NLP和UIE进行非结构化元数据的抽取;步骤5:分词:使用jieba工具对抽取的元数据进行分词;步骤6:词向量转换:将元数据的名称转换成对应的词向量;步骤7:计算词向量之间的余弦距离:如果计算出的词向量之间的余弦距离大于步骤3设定的置信度阈值,则判定元数据是匹配的。

全文数据:

权利要求:

百度查询: 郑州大学 一种基于word2vec模型的灾害元数据自动匹配方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。