买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及基于深度强化学习的数据产品动态定价方法及系统,属数据产品动态定价、数据交易平台和计算机领域。方法包括:初始化定价环境;构建基于深度强化学习的数据产品动态定价模型;训练数据产品动态定价模型,优化参数并更新模型的权重;利用经过训练的模型对数据产品进行动态定价;四个步骤通过环境处理模块、模型构建模块、训练模块、定价输出模块构成动态定价系统;本发明解决了深度强化学习DeepQ‑Network算法中“探索”与“利用”平衡和经验样本利用效率低的问题,提升数据产品动态定价性能,间接辅助实现数据产品累积收益的最大化。
主权项:1.一种基于深度强化学习的数据产品动态定价方法,其特征在于:所述方法包括:步骤1、初始化定价环境,包括对系统参数、网络参数、经验池、定价环境和市场环境进行初始化;步骤2、构建基于深度强化学习的数据产品动态定价模型;此模型包括构建探索策略选择定价模块、经验池维护模块、评估网络模块、目标网络模块、模型更新模块;其中,探索策略选择定价模块采用改进的带有退火机制的ε-greedy探索策略,进行定价动作的选择;经验池维护模块采用了带有优先级的经验回放机制对经验池中的经验回放机制进行了改进;步骤3、利用初始化的环境,对构建的数据产品动态定价模型进行训练,通过模块间的协调与数据共享,反向传播计算损失对网络权重的梯度,优化参数并更新模型的权重;步骤4、利用经过训练的模型对数据产品进行动态定价。
全文数据:
权利要求:
百度查询: 昆明理工大学 一种基于深度强化学习的数据产品动态定价方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。