买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:珠海盈米基金销售有限公司
摘要:本公开提供了一种订单数据汇聚方法、系统及设备,属于分布式大数据处理领域,将自然语言查询转化为结构化查询语言,对变量字符进行向量化形成变量字符向量序列,通过对其中每个变量字符向量划分前语字符向量和后语字符向量,计算前语关系距量和后语关系距量;计算每个变量字符向量分别与其前语关系距量及后语关系距量之间的余弦相似度,并从中提取出前语关系距弦值和后语关系距弦值,结合所述变量字符向量序列中的前语关系距弦值和后语关系距弦值依照数值大小组成前后语关系查询区间,对结构化查询语句进行汇聚,得到若干的结构化查询语句数据包,从而实现了高效、准确和灵活的订单数据汇聚和查询管理。
主权项:1.一种订单数据汇聚方法,其特征在于,所述方法包括:数据库开放多个接口以允许外部用户进行订单数据查询和写入操作,接收自然语言查询并将其转化为结构化查询语言;对各条结构化查询进行分词,提取语法字符和变量字符后,对变量字符进行向量化形成变量字符向量序列,通过对其中每个变量字符向量划分前语字符向量和后语字符向量,计算前语关系距量和后语关系距量;计算每个变量字符向量分别与其前语关系距量及后语关系距量之间的余弦相似度,并从中提取出前语关系距弦值和后语关系距弦值,结合所述变量字符向量序列中的前语关系距弦值和后语关系距弦值依照数值大小组成前后语关系查询区间;使用各条结构化查询语句的前后语关系查询区间,对结构化查询语句进行汇聚,得到若干的结构化查询语句数据包;其中,结合所述变量字符向量序列中的前语关系距弦值和后语关系距弦值依照数值大小组成前后语关系查询区间,具体为:在每个变量字符向量序列中,分别计算每个变量字符向量的前语关系距弦值和后语关系距弦值,进而计算每个变量字符向量的前语关系距弦值与后语关系距弦值之乘积作为该变量字符向量的前后语关系值;选取所述变量字符向量序列中各变量字符向量的前后语关系值中的最小值作为述变量字符向量序列中的前后语关系谷值,选取所述变量字符向量序列中各变量字符向量的前后语关系值中的最大值作为述变量字符向量序列中的前后语关系峰值;每个变量字符向量序列中,以其前后语关系谷值为下限并以其前后语关系峰值为上限组成的区间作为该变量字符向量序列对应的原本的结构化查询语句的前后语关系查询区间;其中,通过对其中每个变量字符向量划分前语字符向量和后语字符向量,计算前语关系距量和后语关系距量,具体为:在每个变量字符向量序列中,若一个变量字符向量前面存在有变量字符向量,则将其前面存在的变量字符向量称为该变量字符向量的前语字符向量,其前语字符向量分别减去该变量字符向量得到前语字符向量与其各前语字符向量分别对应的前语关系距量,若一个变量字符向量后面存在有变量字符向量,则将其后面存在的变量字符向量称为该变量字符向量的后语字符向量,该变量字符向量分别减去其后语字符向量得到后语字符向量与其各后语字符向量分别对应的后语关系距量;其中,计算每个变量字符向量分别与其前语关系距量及后语关系距量之间的余弦相似度,并从中提取出前语关系距弦值和后语关系距弦值,具体为:计算每个变量字符向量分别与其前语关系距量之间的余弦相似度,并选取其中数值最大的余弦相似度的数值作为该变量字符向量的前语关系距弦值;计算每个变量字符向量分别与其后语关系距量之间的余弦相似度,并选取其中数值最大的余弦相似度的数值作为该变量字符向量的后语关系距弦值。
全文数据:
权利要求:
百度查询: 珠海盈米基金销售有限公司 一种订单数据汇聚方法、系统及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。