基于强化学习（RL）的用于倾斜优化的奖励

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：瑞典爱立信有限公司

摘要：本申请包括用于基于强化学习RL调整针对通信网络的第一小区的一个或多个操作参数的计算机实现的方法。这样的方法包括基于在对应的多个时间点处表示第一小区中和第一小区的一个或多个相邻小区中的条件的测量值来确定多个奖励度量值。这样的方法包括基于在相继时间点处的奖励度量值之间的差来确定多个奖励值，并且将奖励值中的每个与改变一个或多个操作参数的对应的先前动作相关联。这样的方法包括选择与最高奖励值相关联的先前动作作为改变一个或多个操作参数的动作。其他实施例包括被配置为执行这样的方法的RL代理和RL系统。

主权项：1.一种用于基于强化学习RL调整针对通信网络的第一小区的一个或多个操作参数的计算机实现的方法，所述方法包括：基于在对应的多个时间点处表示所述第一小区和所述第一小区的一个或多个相邻小区中的条件的测量值来确定610多个奖励度量值；基于在相继时间点处的奖励度量值之间的差来确定620多个奖励值；将所述奖励值中的每个与改变了所述一个或多个操作参数的对应的先前动作相关联630；以及选择640与最高奖励值相关联的先前动作，作为改变针对所述第一小区的所述一个或多个操作参数的动作。

全文数据：

权利要求：

百度查询：瑞典爱立信有限公司基于强化学习（RL）的用于倾斜优化的奖励

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光检测装置

下一篇：一种导电浆料电阻率测试装置及导电浆料电阻率测试方法

相关技术

光检测装置

一种导电浆料电阻率测试装置及导电浆料电阻率测试方法

一种内陆区域地下水封洞设计水位的确定方法

App自测试系统、方法、电子设备及存储介质

叔丁醇的制造方法

一种炉头自动生产线及其工艺

一种1-溴乙基乙酸酯的制备方法

一种线性工程快速出图方法及系统

一种热网加热器换热管泄漏在线定位系统及方法

一种基于机场场面空地互联的虚拟交通灯系统

一种低硬度彩色天然橡胶材料及其制备方法

路径规划方法、系统、设备及计算机可读存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于强化学习（RL）的用于倾斜优化的奖励

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务