首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多模型的资源分配方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明涉及负载调配技术,揭露了一种基于多模型的资源分配方法,包括:利用容器封装技术封装网络模型得到模型容器;调用POD单元,得到模型容器的POD单元集并生成服务标签;利用负载均衡组件将请求数据分配至对应的模型容器中;对请求数据中的请求内容进行请求拆分,得到请求块集,利用分配的模型容器对应的服务标签动态调整POD单元集中POD单元的数量,并利用POD单元集从服务端获取运算空间资源执行对所述请求块集的数据处理。本发明还涉及区块链技术,网络模型模型容器可存储于区块链节点中。本发明还提出了基于多模型的资源分配装置、设备及计算机可读存储介质。本发明可以对多个网络模型进行资源动态分配。

主权项:1.一种基于多模型的资源分配方法,其特征在于,所述方法包括:获取多个网络模型,利用预构建的容器封装技术封装每个所述网络模型的运行环境,得到每个所述网络模型的模型容器,并将每个所述模型容器的地址信息存储于一个负载均衡组件中;运行所述模型容器,得到在预设多种情况下运行所述模型容器所需要的POD单元的数量集,根据所述数量集,设置所述模型容器中POD单元的数量区间,随机调用所述数量区间内任意数量的POD单元,得到所述模型容器的POD单元集,设置弹性伸缩监控对象及自动化伸缩对象,根据所述POD单元的数量区间以及所述弹性伸缩监控对象及自动化伸缩对象生成服务标签;利用所述负载均衡组件,接收用户端传输的请求数据集,将所述请求数据集中各个请求数据中的请求地址与所述模型容器的地址信息进行匹配,根据匹配结果,将所述请求数据分配至对应的模型容器中;对所述请求数据中的请求内容进行请求拆分,得到请求块集,并根据所述请求块集,利用所述分配的模型容器对应的服务标签动态调整对应的POD单元集中POD单元的数量,并利用所述POD单元集从预构建的服务端获取运算空间资源执行对所述请求块集的数据处理;其中,所述根据所述请求块集,利用所述分配的模型容器对应的服务标签动态调整对应的POD单元集中POD单元的数量,包括:根据所述请求块集中请求块的数量,利用所述服务标签中弹性伸缩监控对象,监控所述POD单元集中的POD单元的数量,并利用所述服务标签中的自动化伸缩对象增加或删减所述POD单元集中的POD单元;当所述POD单元的数量等于所述请求块集中请求块的数量或者达到所述数量区间的上限时,停止增加所述POD单元,将每一个请求块分配一个POD单元;所述利用所述POD单元集从预构建的服务端获取运算空间资源执行对所述请求块集的数据处理之前,所述方法还包括:侦测每台服务端的模型容器的连接数量;将所述分配的模型容器连接至模型容器的连接数量最小的服务端;所述利用所述POD单元集从预构建的服务端获取运算空间资源执行对所述请求块集的数据处理,包括:监控所述服务端中内存运算空间中的剩余空间,当剩余空间小于所述POD单元集的消耗空间时,利用预设的淘汰策略,清理所述服务端的内存运算空间,直至所述剩余空间大于所述POD单元集的消耗空间,利用所述POD单元集接收内存资源,执行对所述请求块集的数据处理;所述利用所述负载均衡组件,接收用户端传输的请求数据集,将所述请求数据集中各个请求数据中的请求地址与所述模型容器的地址信息进行匹配,包括:利用所述负载均衡组件中的HTTP协议,截取所述用户端发送的所述请求数据集;获取所述请求数据集中每个请求数据包括的请求地址及请求内容;将所述请求地址与所述负载均衡组件中存储的模型容器的地址信息进行匹配,得到匹配结果。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 基于多模型的资源分配方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术