首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于特征临界值分析的模型无关精确可解释方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广西师范大学

摘要:本发明公开一种基于特征临界值分析的模型无关精确可解释方法,对待解释样本每一维度的特征进行敏感性分析得到临界值,并利用临界值作为对实例进行扰动的扰动边界,可以帮助我们理解模型解释结果对不同特征的依赖程度,排除因为特征数值过大而产生的干扰。对于生成的扰动样本,使用混合概率方法,利用概率分布思想,基于多元正态分布,使用期望最大化算法,最终实现由多个线性回归方法组合而成的可以精确拟合机器学习模型局部高度非线性决策边界的模型,将与原模型预测结果最忠实的解释模型作为最终解释。本发明实现了对于一个黑盒模型进行解释,可有效地实现对待解释样本进行精确解释的结果,同时解释结果保持了较好的稳定性、忠实性、准确性。

主权项:1.基于特征临界值分析的模型无关精确可解释方法,其特征是,包括步骤如下:步骤1、将待解释样本输入到待解释模型中,得到待解释模型的基线预测值;步骤2、对待解释样本的一个特征进行扰动,通过在当前特征的最小取值和最大取值的范围内对当前特征的特征值进行逐步变化,得到基于当前特征的L个单扰动待解释样本;步骤3、将基于当前特征的L个单扰动待解释样本分别输入到待解释模型中,得到待解释模型的基于当前特征的L个单扰动预测值;步骤4、计算当前特征的敏感度: 其中,Si为当前特征的第i个敏感度,yi′为基于当前特征的第i个单扰动预测值,y为基线预测值,zi′为当前特征的第i个变化扰动特征值,z为当前特征的原始特征值,i=1,2,…,L,L为基于当前特征的单扰动待解释样本的数量;步骤5、基于当前特征的L个敏感度确定当前特征的临界值:即若存在当前特征的第i个变化扰动特征值zi′使当前特征的第i个敏感度Si的导数为0时,基于当前特征的第i个单扰动预测值yi′不等于基线预测值y,则将当前特征的第i个变化扰动特征值zi′记为当前特征的临界值;否则,将当前特征的原始值作为当前特征的临界值;步骤6、遍历待解释样本的所有特征,重复步骤2~5,得到待解释样本的各个特征的临界值;步骤7、对待解释样本的所有特征进行扰动,通过对每个特征的特征值在其临界值的范围内进行随机变化,得到M个全扰动待解释样本;其中M为人为设定的正整数;步骤8、通过混合概率方法对M个全扰动待解释样本进行分组,得到K个样本分组;其中K为人为设定的正整数;步骤9、分别对每个样本分组中的全扰动待解释样本进行线性回归拟合,得到K个拟合解释模型;步骤10、对于每个样本分组,将当前样本分组的每一个全扰动待解释样本分别输入到待解释模型和当前样本分组的拟合解释模型中,得到待解释预测值和拟合预测值,并据此计算当前样本分组的拟合解释模型和待解释模型的差异度: 式中,Φk表示当前样本分组的拟合解释模型gk和待解释模型f的差异度;x″j′表示样本分组k中的第j′个全扰动待解释样本,fx″j′表示样本分组k中的全扰动待解释样本x″j′的待解释预测值,gkx″j′表示样本分组k中的全扰动待解释样本x″j′的拟合预测值,j′=1,2,…,Mk,Mk表示样本分组k中全扰动待解释样本的数量;步骤11、将与待解释模型的差异度最小的样本分组的拟合解释模型作为最终的解释模型。

全文数据:

权利要求:

百度查询: 广西师范大学 基于特征临界值分析的模型无关精确可解释方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。