模型训练方法、频谱资源分配方法、装置及电子设备

导航：龙图腾网> 最新专利技术> 模型训练方法、频谱资源分配方法、装置及电子设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请公开了一种模型训练方法、频谱资源分配方法、装置及电子设备。该方法通过获取经验数据集，经验数据集为在测试车辆行驶通过目标路段的过程中，利用初始评估模型生成的；基于经验数据集，对初始评估模型进行迭代训练，直至初始评估模型符合第一预设条件，得到训练后的初始评估模型作为策略评估模型，策略评估模型用于基于车辆的目标交互链路对应的状态数据集，输出目标交互链路对应的资源数据集中包括的每个频谱资源对应的回报值。通过初始评估模型在测试车辆行驶通过目标路段的过程中生成的经验数据集，对初始评估模型进行迭代训练，使得到的策略评估模型可以为目标交互链路分配最优的频谱资源，进而更好的满足车联网中的通信需求。

主权项：1.一种模型训练方法，其特征在于，所述方法包括：获取经验数据集，所述经验数据集为在测试车辆行驶通过目标路段的过程中，利用初始评估模型生成的，所述经验数据集中包括多条经验数据，每条所述经验数据包括所述测试车辆的测试交互链路对应的当前状态数据和预期状态数据、为所述测试交互链路分配的频谱资源数据、以及评估回报值；将每条所述经验数据输入至初始价值模型，得到所述初始价值模型输出的每条所述经验数据对应的目标奖励值；基于每条所述经验数据对应的目标奖励值、以及每条所述经验数据中包括的所述评估回报值，确定所述初始评估模型对应的评估损失值；根据所述评估损失值对所述初始评估模型进行迭代训练，直至所述初始评估模型符合第一预设条件，得到训练后的所述初始评估模型作为策略评估模型；所述第一预设条件包括：本次迭代训练后的初始评估模型对应的累计奖励值与前一次迭代训练得到的初始评估模型对应的累计奖励值之间的差值小于预设阈值；累计奖励值为基于所述测试交互链路对应的总信道容量、剩余载荷量以及所述初始评估模型对应的策略熵确定的，所述策略熵的大小与所述初始评估模型的迭代训练次数呈负相关；所述策略评估模型用于基于车辆的目标交互链路对应的状态数据集，输出所述目标交互链路对应的资源数据集中包括的每个频谱资源对应的回报值，所述状态数据集包括所述目标交互链路对应的信道增益，所述资源数据集包括可为所述目标交互链路分配的至少一个频段对应的频谱资源，所述频谱资源包括子载波频率和发射功率。

全文数据：

权利要求：

百度查询：广州汽车集团股份有限公司模型训练方法、频谱资源分配方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

相关技术

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

模型训练方法、频谱资源分配方法、装置及电子设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务