首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

DeFi协议链上治理智能决策模型、方法、设备及介质 

申请/专利权人:中新宽维传媒科技有限公司

申请日:2024-06-05

公开(公告)日:2024-07-05

公开(公告)号:CN118297687A

主分类号:G06Q40/00

分类号:G06Q40/00;G06N3/092

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.23#实质审查的生效;2024.07.05#公开

摘要:本申请提供一种DeFi协议链上治理智能策略模型、方法、设备及介质,其中包括预测网络、目标网络和误差函数;预测网络根据输入的DeFi环境状态,获得链上各个动作的预测值,并将最大预测值对应的动作作为最优动作向目标网络输出;目标网络接收预测网络输出的最优动作,并根据所述最优动作选择出所述最优动作对应的动作值和奖励值;误差函数计算最优动作对应的预测值和目标值之间的误差,并在误差满足预设阈值时将最优动作输出,以及在误差未满足预设阈值时,更新所述预测网络的网络参数并重新训练所述预测网络,直到误差满足预设阈值。降低人工成本、减少人为误差,提高治理效率还可灵活适应不同的DeFi协议环境。

主权项:1.一种DeFi协议链上治理智能决策模型,其特征在于,包括预测网络、目标网络和误差函数;所述预测网络用于根据输入的DeFi环境状态,获得链上各个动作的预测值,并将最大预测值对应的动作作为最优动作向目标网络输出;其中,采用策略随机选择DeFi环境状态中的任意一个动作执行,并生成动作对应的动作值和与DeFi环境交互得到的奖励值,其中动作的动作值和奖励值记为预测网络得到动作的预测值;所述目标网络用于接收所述预测网络输出的最优动作,并根据所述最优动作选择出所述最优动作对应的动作值和奖励值;其中,最优动作对应的动作值和奖励值为所述目标网络根据自身的权重参数计算得到,最优动作对应的动作值和奖励值记为目标值,所述目标网络的权重参数由所述预测网络将训练得到的自身权重参数在间隔预设时间后赋值得到;所述误差函数用于计算最优动作对应的预测值和目标值之间的误差,并在误差满足预设阈值时将最优动作输出,以及在误差未满足预设阈值时,更新所述预测网络的网络参数并重新训练所述预测网络,直到误差满足预设阈值。

全文数据:

权利要求:

百度查询: 中新宽维传媒科技有限公司 DeFi协议链上治理智能决策模型、方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。