买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种面向数据流滑动窗口的自适应直方图发布方法,属于信息安全技术领域。本发明首先利用数据流近似计数方法来预测下一时刻滑动窗口内数据的分布信息;再通过比较估计值与真实值之间的差异来选取合适的发布值;最后对排序后的直方图区间进行聚类处理并优化其组内数据的误差。本发明可以在数据流环境下快速的发布隐私数据直方图,并在高效处理数据流中数据的同时,达到用户满意的发布误差。
主权项:1.一种面向数据流滑动窗口的自适应直方图发布方法,其特征在于,其步骤为:步骤一、确定待发布加噪直方图的区间;步骤二、将整体隐私预算ε分为两部分,第一部分隐私预算为αε,用于对排序前的数据进行加噪,第二部分隐私预算为ε1-α,用于排序后的直方图利用贪心算法进行加噪;步骤三、对待发布直方图中每一个区间,利用滑动窗口近似统计预测下一时刻数据流直方图估计信息,并将第一部分隐私预算的加噪值与近似统计值进行比较,选取合适的噪音值,对排序后的直方图区间进行聚类处理并优化组内数据的误差,构建当前时刻近似统计直方图;利用滑动窗口近似统计预测下一时刻数据流直方图估计信息的计算过程为:1判断进入滑动窗口数据流的当前数据是否符合所判断统计的区间;若当前数据满足当前区间范围,当前数据置为1;若当前数据不满足当前区间范围,当前数据置为0;2检查当前数据进入子块中的位置:若当前数据不在子块的末尾位置,则当前子块的块内偏移量m增加1,计数器y的值增加1;若当前数据在子块的末尾位置,则下一数据进入下一子块,子块内偏移量m重新记为0,并且当计数器y的值增加1后超过子块的大小时,自计数器y的值中减去子块的大小后重新计数,同时数组b中与计数器y的值超过子块的大小次数对应位置的位数记为1;3输出当前i时刻的近似统计值其中,滑动窗口的大小为W,将滑动窗口划分为k个子块、子块的大小为Wk,k个位的数组为b,B为数组b中位数为1的统计量,m*bi为当前滑动窗口的过期数据,为区间的近似统计频数与真实频数的最大误差;4判断小于0的结果,全部置为0,得到最新的步骤四、对于当前时刻所选取直方图数据,通过误差下限函数对数据添加第二部分隐私预算的噪音值;步骤五、发布当前时刻滑动窗口的加噪直方图。
全文数据:
权利要求:
百度查询: 宝信软件(安徽)股份有限公司 一种面向数据流滑动窗口的自适应直方图发布方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。