恭喜中国科学院自动化研究所杨宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国科学院自动化研究所申请的专利基于惩罚机制的安全强化学习任务卸载方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119311334B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411874791.0,技术领域涉及:G06F9/445;该发明授权基于惩罚机制的安全强化学习任务卸载方法和装置是由杨宁;吕品;梁剑设计研发完成,并于2024-12-18向国家知识产权局提交的专利申请。
本基于惩罚机制的安全强化学习任务卸载方法和装置在说明书摘要公布了:本公开涉及一种基于惩罚机制的安全强化学习任务卸载方法和装置,所述方法包括:接收用户端的计算服务请求;获取用户端当前的状态信息;将状态信息输入到安全强化学习模型,得到针对计算服务请求的决策结果,其中,安全强化学习模型是通过最大化包含障碍函数的目标函数训练得到的,障碍函数用于在安全强化学习模型的训练过程中根据第一约束条件对目标函数值进行惩罚性调整,决策结果为确定将计算服务请求对应的任务卸载到多个服务器中的哪个服务器中进行处理,多个服务器包括云服务器和至少一个边缘服务器;基于决策结果对计算服务请求对应的任务进行卸载。障碍函数能够自动触发预先惩罚机制,有效避免违规行为的发生。
本发明授权基于惩罚机制的安全强化学习任务卸载方法和装置在权利要求书中公布了:1.一种基于惩罚机制的安全强化学习任务卸载方法,其特征在于,所述方法包括:接收用户端的计算服务请求;获取所述用户端当前的状态信息;将所述状态信息输入到安全强化学习模型,得到针对所述计算服务请求的决策结果,其中,所述安全强化学习模型是通过最大化包含障碍函数的目标函数训练得到的,所述障碍函数用于在所述安全强化学习模型的训练过程中根据第一约束条件对目标函数值进行惩罚性调整,所述第一约束条件为针对能耗、延迟、带宽中的至少一项的约束条件,所述决策结果为确定将所述计算服务请求对应的任务卸载到多个服务器中的哪个服务器中进行处理,所述多个服务器包括云服务器和至少一个边缘服务器;基于所述决策结果对所述计算服务请求对应的任务进行卸载;其中,所述障碍函数用于在所述安全强化学习模型的当前策略的执行结果越接近所述第一约束条件的情况下,通过更大的惩罚项对所述目标函数值进行惩罚性调整;其中,所述障碍函数的表示形式包括: 其中,为所述障碍函数,是一个扩展的连续凸对数势垒函数,为对数势垒函数的给定常数,为所述第一约束条件的索引,为待优化的当前策略,为约束函数,为动作,为优势函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。