买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津大学
摘要:本发明提供了一种基于信息熵测度的数据价值评估方法即系统,方法包括获取待评估的数据集,对各数据集建立概率模型,根据所确定的模型复杂度和数据量的大小,选择参数估计方法,使用估计得到的模型参数估计这些数据点发生的概率;对于各数据集,使用信息量函数计算数据集的信息熵;通过计算得到的信息熵,对整个数据集的平均信息量或不确定性进行价值评估,得到各数据集的价值。本发明的方法不直接依赖于数据的具体内容,而是依赖于数据的整体分布和概率特性,因而能有效地解决数据复杂性高的问题,同时识别和过滤掉冗余信息。
主权项:1.一种基于信息熵测度的数据价值评估方法,其特征在于:包括如下步骤:步骤1:获取待评估的数据集,对各数据集建立概率模型,根据所确定的模型复杂度和数据量的大小,选择参数估计方法,使用估计得到的模型参数估计这些数据点发生的概率;步骤2:对于各数据集,使用信息量函数计算数据集的信息熵;步骤3:通过计算得到的信息熵,对整个数据集的平均信息量或不确定性进行价值评估,得到各数据集的价值。
全文数据:
权利要求:
百度查询: 天津大学 一种基于信息熵测度的数据价值评估方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。