首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

融合深度强化学习及启发式方法视频码率自适应决策方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国网江苏省电力有限公司常州供电分公司

摘要:本发明涉及多媒体通信技术领域,具体涉及一种融合深度强化学习及启发式方法视频码率自适应决策方法。本发明包括如下步骤:S1、视频采集与编码;S2、传统启发式方法黑盒化;S3、特征融合与决策;S4、视频发送与接收;S5、状态记录与策略更新;S6、迭代优化。本发明在融合方式和深度强化学习模块的神经网络的更新策略两方面对Loki进行优化;相比原有的Loki方案,本发明在应用层具有更低的延迟和卡顿,而且维持与Loki相当的发送比特率;相比于原有的Loki方案,本发明的模型更能实时跟踪响应带宽变化,提高了在面对未知网络环境时融合模型的灵敏度,更广泛的适用于当今复杂多变的网络环境。

主权项:1.一种融合深度强化学习及启发式方法视频码率自适应决策方法,其特征在于,包括如下步骤:S1、视频采集与编码:实时视频发送端采集实时视频,然后由编码器对实时视频进行编码、组帧;S2、传统启发式方法黑盒化:传统启发式方法基于特定的规则预测下一时刻的发送码率,缺乏细粒度的特征表示能力;将传统启发式方法利用模仿学习等效成一个黑盒神经网络模型,使其具有高级表示能力的特征空间,从而与深度强化学习模块变得兼容,以便实现特征层面的融合;S3、特征融合与决策:传统启发式方法的黑盒模型的输出与深度强化学习模块的输出通过趋势融合方式进行融合,根据收集的历史时刻接收端的吞吐量以及传输层的丢包率、延迟及延迟抖动对融合模型的神经网络进行训练、推理,最终得到融合后的码率决策值;S4、视频发送与接收:根据码率控制算法模块得到的融合比特率发送编码好的视频帧,并在实时视频接收端进行接收、播放;S5、状态记录与策略更新:记录传输过程以及视频接收端的网络状态信息,根据状态信息计算神经网络的奖励和惩罚,更新神经网络的策略参数;S6、迭代优化:重复上述步骤S1至S5,直至收敛到最优的决策策略参数。

全文数据:

权利要求:

百度查询: 国网江苏省电力有限公司常州供电分公司 融合深度强化学习及启发式方法视频码率自适应决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。