首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于云计算的分布式储存系统及其文件备份方法 

申请/专利权人:北京浩普诚华科技有限公司

申请日:2024-04-02

公开(公告)日:2024-07-05

公开(公告)号:CN117971789B

主分类号:G06F16/172

分类号:G06F16/172;G06F16/182;G06F16/18;G06F16/16;G06F11/14

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明涉及数据处理技术领域,尤其涉及一种基于云计算的分布式储存系统及其文件备份方法。包括:获取数据存储请求,并将数据存储请求作为数据项;对数据项的存储节点进行分布处理,并使用基于版本控制的数据一致性算法得到数据项的更新操作信息;然后进行增量数据备份和去重处理,得到备份操作确认信息;同时对文件的版本历史记录进行管理和维护;进一步调整数据项的存储位置和备份策略,并生成文件备份操作指令;基于备份操作确认信息以及数据恢复请求,在分布式储存系统发生故障或数据丢失时,从备份中恢复数据。解决了在现有的基于云计算的分布式存储系统中,数据存取的效率低,数据完整性差、数据备份和恢复的效率低和灵活性差的问题。

主权项:1.一种基于云计算的分布式储存系统,其特征在于,包括以下部分:分布式散列存储模块,数据一致性和版本控制模块,数据备份优化模块,动态数据访问调度模块,文件版本管理模块,灾难恢复和数据恢复模块;分布式散列存储模块,将要存储的数据本身作为数据项,并使用基于散列的智能分布算法对每个数据项的存储节点进行分布处理,得到数据项的存储位置信息;并将数据项的存储位置信息发送至数据一致性和版本控制模块和动态数据访问调度模块;基于散列的智能分布算法的具体实现过程如下:首先,对每一个数据项的键值,应用散列函数,计算散列值h;基于数据项大小和存储节点负载,引入由当前存储的数据量和存储节点的最大容量决定的负载因子;进一步,确定存储节点;记分布式储存系统中有N个存储节点,引入节点权重,并计算加权散列值h′来确定数据项的存储节点S;h′=h·LavgmodN 其中,Lavg是所有存储节点负载因子的平均值;Wi是存储节点i的权重;mod是取模运算;表示向下取整;最后,将计算得到的存储节点S作为数据项的存储位置信息,将数据项的存储位置信息发送给数据一致性和版本控制模块;数据一致性和版本控制模块,基于数据项的存储位置信息,使用基于版本控制的数据一致性算法,得到数据项的更新操作信息;具体实现过程如下:基于数据项的存储位置信息F和数据项的键值K,以及代表分布式储存系统中所有数据项的当前版本信息的版本向量V=[v1,v2,…,vN];首先基于散列值h,引入时间因素t更新数据项的版本号vi: 其中,Δt是自上次更新以来的时间差,τ是时间常数;是更新后的数据项版本号;进行一致性验证;基于每个存储节点的版本贡献度wi计算加权全局版本一致性指标GCIw: 最后,生成数据项的更新操作信息Ui: 其中,Fi表示数据项的最新存储位置;将数据项的更新操作信息发送至数据备份优化模块、动态数据访问调度模块和文件版本管理模块;数据备份优化模块,基于数据项的更新操作信息,实施增量备份和数据去重技术,得到备份操作确认信息;并将备份操作确认信息发送至动态数据访问调度模块和灾难恢复和数据恢复模块;动态数据访问调度模块,基于数据项的存储位置信息和更新操作信息、备份操作确认信息以及数据访问请求的历史记录和模式,改变数据项的存储位置和备份策略,得到数据访问和备份策略调整操作的结果;文件版本管理模块,基于数据项的更新操作信息和用户对文件版本的访问请求,对文件的版本历史记录进行管理和维护;灾难恢复和数据恢复模块,基于备份操作确认信息以及数据恢复请求,在分布式储存系统发生故障或数据丢失时,从备份中恢复数据。

全文数据:

权利要求:

百度查询: 北京浩普诚华科技有限公司 一种基于云计算的分布式储存系统及其文件备份方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。