买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种数据筛查方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待过滤的表格,确定所述待过滤的表格中的待过滤属性,其中,所述待过滤的表格用于记录多个物品的多个属性,每个属性包括多个属性值,所述待过滤属性为所述多个属性中的其中一个属性,将所述待过滤属性的属性值作为第一标签;对于每一物品,利用所述待过滤的表格中除所述待过滤属性的其他属性的属性值和预设的模型,确定所述物品在每个所述第一标签下的第一概率;根据第一标签和第一概率,计算计数矩阵;根据第一概率和计数矩阵,确定所述待过滤的表格中错误的数据。该实施方式能够自动查找出表格中错误的数据,从而提高数据筛查的效率及准确性。
主权项:1.一种数据筛查方法,其特征在于,包括:获取待过滤的表格,确定所述待过滤的表格中的待过滤属性,其中,所述待过滤的表格用于记录多个物品的多个属性,每个属性包括多个属性值,所述待过滤属性为所述多个属性中的其中一个属性,将所述待过滤属性的属性值作为第一标签;对于每一物品,利用所述待过滤的表格中除所述待过滤属性的其他属性的属性值和预设的模型,确定所述物品在每个所述第一标签下的第一概率;根据所述第一标签和所述第一概率,计算计数矩阵,包括:对于每一第一标签,将所述第一标签作为目标标签,将物品在所述目标标签下的第一概率作为目标概率;计算所有物品的目标概率的平均值,将所有物品的目标概率的平均值作为与所述目标标签对应的目标置信度阈值;比较所述目标概率与所述目标置信度阈值,若所述目标概率大于或等于所述目标置信度阈值,则将所述目标标签作为第二标签;根据所述第一标签和所述第二标签,生成计数矩阵;根据所述第一概率和所述计数矩阵,确定所述待过滤的表格中错误的数据。
全文数据:
权利要求:
百度查询: 北京沃东天骏信息技术有限公司 北京京东尚科信息技术有限公司 数据筛查方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。