买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种强化因果信号指导的自合理化解释方法及装置,属于人工智能和自然语言处理技术领域。针对目前提升模型可解释能力的方法容易产生退化累积问题,本发明提供了一种装置,包括生成器模块、预测器模块、因果归因模块、强化学习模块、信号生成模块。本发明方法是一种基于协同博弈优化的自解释机制,其生成器和预测器通过协同优化得到最终预测标签。同时,在模型训练中引入因果干预算子量化解释训练过程中固有的因果效应,并利用强化学习过程来细化它们的学习偏差。最后,在这种强化的因果环境下构建指导信号指导模型中生成器和预测器下一步的训练动作,最终缓解模型退化的问题。
主权项:1.一种强化因果信号指导的自合理化解释装置,其特征在于:包括生成器模块、预测器模块、因果归因模块、强化学习模块、信号生成模块;所述生成器模块用于对模型的输入信息进行编码,并结合概率分布生成用于预测标签的解释信息;所述预测器模块是基于生成器模块给出的解释信息进行标签预测;所述因果归因模块用于根据输入信息对解释信息进行因果效应的归因和量化;所述强化学习模块用于将生成器模块和预测器模块协同博弈的过程建模为一种马尔可夫决策过程,并细化解释信息训练过程中的学习偏差;所述信号生成模块用于在结合预训练技术为生成器和预测器的博弈优化方向提供一个好的指导信号。
全文数据:
权利要求:
百度查询: 山西大学 一种强化因果信号指导的自合理化解释方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。