买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:数字节点(杭州)科技有限公司
摘要:本申请涉及物料管理的技术领域,尤其是涉及一种基于物料的相似度阈值匹配方法及系统,其包括:获取查询内容,并提取查询内容中包含的多级分类信息;基于多级分类信息生成不同的分类项查询数据包;基于预设的拆分规则拆分出多组不同字数的子特征集;基于子特征集分别生成各个拆分特征的拆分项查询数据包;为每个分类项查询数据包和拆分项查询数据包生成一个查询任务;基于标签选定范围结合标签自身权重分别在物料数据库中筛选物料标签以放置于查询任务内;计算每个查询任务内的各物料标签与分类信息或拆分特征之间的相似度,并输出处理子结果;将若干查询任务的处理子结果获得最终的处理结果。本申请具有提高对物料查询检索时的精准性的效果。
主权项:1.一种基于物料的相似度阈值匹配方法,其特征在于,包括以下步骤:获取查询内容,并提取所述查询内容中包含的多级分类信息,所述多级分类信息中至少存在三个不同级别的分类信息;基于所述多级分类信息分别生成对应于不同所述分类信息的分类项查询数据包;基于预设的拆分规则将所述查询内容拆分为多组对应于不同字数的子特征集,每个所述子特征集中皆包含字数相同的拆分特征,具体的,获取所述查询内容中各级别的所述分类信息中的平均描述字数,基于所述平均描述字数生成相应的最小拆分字数,依次选定所述查询内容中的单字作为拆分起点以获取符合最小拆分字数的最小拆分特征,将所述最小拆分字数依次加一以得到后续拆分字数并重复依次选定所述查询内容中的单字作为拆分起点以获得不同字数对应的若干后续拆分特征,直至所述后续拆分字数等于所述平均描述字数,生成匹配于所述最小拆分字数及若干所述后续拆分字数的特征集合,将所述最小拆分特征和所述后续拆分特征分别放入相应字数的所述特征集合中以获得若干子特征集;基于所述子特征集分别生成对应于各个所述拆分特征的拆分项查询数据包;为每个所述分类项查询数据包和所述拆分项查询数据包生成一个查询任务,并基于相应的所述分类信息和所述拆分特征设定每个所述查询任务所对应的标签选定范围;基于所述标签选定范围结合标签自身权重分别在物料数据库中筛选相应的物料标签以放置于所述查询任务内;计算每个所述查询任务内的各所述物料标签与所述分类信息或所述拆分特征之间的相似度,并输出所述相似度最高的所述物料标签对应的物料作为该所述查询任务的处理子结果;将若干所述查询任务的所述处理子结果进行数据汇总以获得最终的处理结果。
全文数据:
权利要求:
百度查询: 数字节点(杭州)科技有限公司 一种基于物料的相似度阈值匹配方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。