买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安电子科技大学
摘要:本发明公开了一种移动小程序中隐私数据使用目的一致性检测方法及系统,该方法根据隐私声明的两类句式结构从小程序隐私保护指引中提取隐私数据及使用目的,基于聚类得到不同隐私数据的使用目的类别表;然后从小程序代码中提取与隐私数据相关的静态特征,基于静态多维特征训练使用目的多分类器,通过使用目的多分类器预测隐私数据的实际使用目的;最后通过一致性模型分析隐私数据的使用目的在隐私声明和实际使用之间的一致性,检测小程序中潜在的隐私风险;通过解析出小程序隐私声明的两类句式结构提高了提取准确率和效率;通过定义小程序中三种不一致的隐私披露,从多个维度检测了小程序隐私保护指引中的隐私披露风险,检测更加全面精准。
主权项:1.移动小程序中隐私数据使用目的一致性检测方法,其特征在于,包括以下步骤:步骤1:以小程序作为输入,包括小程序隐私保护指引和解包后的小程序代码,对小程序隐私保护指引中的隐私声明进行解析,得到小程序隐私声明的两类句式结构,即第一类句式结构为数据使用主体-数据处理动词-隐私数据-使用目的谓词-使用目的,第二类句式结构为使用目的谓词-使用目的-数据使用主体-数据处理动词-隐私数据-明示同意子句;步骤2:根据步骤1中的小程序隐私声明的两类句式结构,提取小程序隐私保护指引中的每条隐私声明的隐私数据及使用目的,得到隐私数据及使用目的的二元组集;步骤3:按照隐私数据类型对步骤2中隐私声明的隐私数据及使用目的的二元组集进行划分,得到不同的使用目的组集;基于K-means文本聚类算法对预处理后的使用目的组集进行聚类,得到对应的使用目的聚类簇;基于TF-IDF算法确定每个使用目的聚类簇的标签名,得到隐私数据类型的使用目的类别表;将隐私数据及使用目的的二元组集和隐私数据类型的使用目的类别表进行映射,得到小程序隐私保护指引中的隐私数据及使用目的类别的二元组集;步骤4:对步骤1中的小程序解包后的代码进行静态程序分析,得到隐私数据的三类静态特征,隐私数据的三类静态特征分别为敏感API特征、页面特征和小程序特征;步骤5:对于步骤4中提取的隐私数据的三类静态特征依次进行特征切割、特征过滤和特征还原,得到隐私数据的特征序列;步骤6:基于TF-IDF算法对步骤5中的特征序列进行向量化处理,得到特征序列的向量化表示;步骤7:基于SVM算法构建使用目的多分类器,所述使用目的多分类器的kernel参数设置为linear,C参数设置为1;对步骤4中小程序中隐私数据相关的静态特征进行标记,得到隐私数据和使用目的类别的已知标签数据集,将已知标签数据集输入到使用目的多分类器中进行训练,得到训练好的使用目的多分类器;步骤8:将步骤6中的特征序列的向量化表示输入到步骤7得到的训练好的使用目的多分类器中进行使用目的类别预测,得到小程序代码中的隐私数据及其使用目的类别的二元组集;步骤9:将步骤8中小程序代码中的隐私数据及其使用目的类别的二元组集与步骤3中的隐私保护指引文本的隐私声明的隐私数据及使用目的类别的二元组集进行一致性分析,确定移动小程序中隐私数据使用目的一致性是否存在风险。
全文数据:
权利要求:
百度查询: 西安电子科技大学 移动小程序中隐私数据使用目的一致性检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。