恭喜中国移动通信有限公司研究院;中国移动通信集团有限公司刘颖卿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国移动通信有限公司研究院;中国移动通信集团有限公司申请的专利一种数据解析方法、装置及计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114490703B 。
龙图腾网通过国家知识产权局官网在2025-03-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011253499.9,技术领域涉及:G06F16/242;该发明授权一种数据解析方法、装置及计算机可读存储介质是由刘颖卿;张星;李春梅;吕临颖;米婧;刘芳设计研发完成,并于2020-11-11向国家知识产权局提交的专利申请。
本一种数据解析方法、装置及计算机可读存储介质在说明书摘要公布了:本发明公开了一种数据解析方法、装置及计算机可读存储介质,涉及通信技术领域,以解决现有对Oracle流量数据中的SQL语句解析方式适用场景固定的问题。该方法包括:获取待解析目标数据库流量数据;依据预先获取的结构化查询语言SQL语句提取特征值,确定所述待解析目标数据库流量数据中的SQL语句的长度和起始位置,其中,所述SQL语句提取特征值包括子功能偏移值常量、SQL语句长度标识位的相对偏移值常量和SQL语句起始位的相对偏移值范围;依据所述SQL语句的长度和起始位置,从所述待解析目标数据库流量数据中提取SQL语句,得到所述待解析目标数据库流量数据中的SQL语句内容。本发明实施例可适用于对不同场景中的目标数据库流量数据进行SQL语句解析。
本发明授权一种数据解析方法、装置及计算机可读存储介质在权利要求书中公布了:1.一种数据解析方法,其特征在于,包括:获取待解析目标数据库流量数据;依据预先获取的结构化查询语言SQL语句提取特征值,确定所述待解析目标数据库流量数据中的SQL语句的长度和起始位置,其中,所述SQL语句提取特征值包括子功能偏移值常量、SQL语句长度标识位的相对偏移值常量和SQL语句起始位的相对偏移值范围;依据所述SQL语句的长度和起始位置,从所述待解析目标数据库流量数据中提取SQL语句,得到所述待解析目标数据库流量数据中的SQL语句内容;所述依据预先获取的结构化查询语言SQL语句提取特征值,确定所述待解析目标数据库流量数据中的SQL语句的长度和起始位置之前,所述方法还包括:获取N条目标数据库抽样流量数据,N为大于1的整数,所述N条目标数据库抽样流量数据包括不同场景中的目标数据库流量数据;确定每条目标数据库抽样流量数据的子功能偏移值、SQL语句起始位的相对偏移值和SQL语句长度标识位的相对偏移值;基于每条目标数据库抽样流量数据的子功能偏移值,确定子功能偏移值常量;基于每条目标数据库抽样流量数据中的SQL语句起始位的相对偏移值,确定SQL语句起始位的相对偏移值范围;基于每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值,确定SQL语句长度标识位的相对偏移值常量;将所述子功能偏移值常量、所述SQL语句起始位的相对偏移值范围和所述SQL语句长度标识位的相对偏移值常量确定为所述SQL语句提取特征值;所述基于每条目标数据库抽样流量数据的子功能偏移值,确定子功能偏移值常量,包括:对所述每条目标数据库抽样流量数据的子功能偏移值进行去重计数统计,将所述每条目标数据库抽样流量数据的子功能偏移值中计数最高的子功能偏移值确定为子功能偏移值常量;所述基于每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值,确定SQL语句长度标识位的相对偏移值常量,包括:对所述每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值进行去重计数统计,将所述每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值中计数最高的SQL语句长度标识位的相对偏移值,确定为SQL语句长度标识位的相对偏移值常量;所述确定每条目标数据库抽样流量数据的子功能偏移值、SQL语句起始位的相对偏移值和SQL语句长度标识位的相对偏移值,包括:分别检索每条目标数据库抽样流量数据中的目标子功能值位置,并依据每条目标数据库抽样流量数据中的目标子功能值位置,确定每条目标数据库抽样流量数据的子功能偏移值;分别检索每条目标数据库抽样流量数据中的SQL语句起始位置,并依据每条目标数据库抽样流量数据中的SQL语句起始位置,确定每条目标数据库抽样流量数据中的SQL语句起始位的相对偏移值;分别检索每条目标数据库抽样流量数据中的SQL语句结束位置,并依据每条目标数据库抽样流量数据中的SQL语句起始位置和SQL语句结束位置,确定每条目标数据库抽样流量数据中的SQL语句长度;依据每条目标数据库抽样流量数据中的SQL语句长度,确定每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值;所述依据每条目标数据库抽样流量数据中的SQL语句长度,确定每条目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值,包括:在确定第一目标数据库抽样流量数据中的SQL语句长度为k的情况下,若所述k的值小于第三预设值,则在所述第一目标数据库抽样流量数据中的第q+1个字节至第q+1+j个字节之间检索值为k的目标字节,其中,q等于第一预设值与所述第一目标数据库抽样流量数据的子功能偏移值之和,所述第三预设值根据一个字节所能存储的值范围确定;若所述k的值大于或等于第三预设值,则在所述第一目标数据库抽样流量数据中的第q+1个字节至第q+1+j个字节之间检索连续两个字节值分别为第三目标值和第四目标值的两个字节,并将所述两个字节中的第一个字节确定为目标字节,其中,所述第三目标值为k除以所述第三预设值的商,所述第四目标值为k除以所述第三预设值的余数;依据所述目标字节所在的位置,确定所述第一目标数据库抽样流量数据中的SQL语句长度标识位的相对偏移值;所述基于每条目标数据库抽样流量数据中的SQL语句起始位的相对偏移值,确定SQL语句起始位的相对偏移值范围,包括:对所述每条目标数据库抽样流量数据中的SQL语句起始位的相对偏移值进行去重计数统计,得到P个不同的SQL语句起始位的相对偏移值,并确定每个SQL语句起始位的相对偏移值对应的计数,P为小于或等于N的正整数;将所述P个不同的SQL语句起始位的相对偏移值按值的大小进行排序,得到排序后的SQL语句起始位的相对偏移值集合;依据预先设定的提取比例阈值,确定所述相对偏移值集合中计数之和大于目标计数值的最小相对偏移值子集合,其中,所述目标计数值等于所述相对偏移值集合中所有相对偏移值的计数之和与所述提取比例阈值的乘积;依据所述最小相对偏移值子集合中的最大相对偏移值和最小相对偏移值,确定SQL语句起始位的相对偏移值范围;所述依据预先获取的结构化查询语言SQL语句提取特征值,确定所述待解析目标数据库流量数据中的SQL语句的长度和起始位置,包括:将偏移量赋值为第一预设值M,M为大于1的整数;获取所述待解析目标数据库流量数据中的第M-1个字节和第M个字节的第三组合值;若所述第三组合值为第一目标值,则依据所述SQL语句长度标识位的相对偏移值常量OFF_LEN,获取所述待解析目标数据库流量数据中的第M+OFF_LEN个字节的值,得到SQL语句长度标识位数,所述第一目标值为目标子功能值;依据所述SQL语句长度标识位数和所述SQL语句长度标识位的相对偏移值常量,获取所述待解析目标数据库流量数据中的SQL语句的长度;依据所述SQL语句起始位的相对偏移值范围,从所述待解析目标数据库流量数据中检索SQL语句开始标识符;若检索到所述待解析目标数据库流量数据中的第M+r-1个字节为SQL语句开始标识符,则判断第M+r个字节是否为SQL语句的起始位置,r为正整数;若确定第M+r个字节为SQL语句的起始位置,则确定所述待解析目标数据库流量数据中的SQL语句的起始位置为第M+r个字节。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国移动通信有限公司研究院;中国移动通信集团有限公司,其通讯地址为:100053 北京市西城区宣武门西大街32号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。