一种可证明文件所有权的重复数据删除方法.pdf

上传人:a**** 文档编号:1666936 上传时间:2018-07-03 格式:PDF 页数:7 大小:209.21KB
返回 下载 相关 举报
摘要
申请专利号:

CN201310557417.3

申请日:

2013.11.07

公开号:

CN104636369A

公开日:

2015.05.20

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20131107|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京安码科技有限公司

发明人:

王立进; 徐勤; 李荣; 朱燕涛; 刘传宇

地址:

100082北京市海淀区西直门北大街32号院1号楼612

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明公开了一种可证明文件所有权的重复数据删除方法,包括如下步骤:本地客户端接受需要存储数据文件;用哈希算法将文件压缩成固定长度,并对压缩后文件建立Merkle哈希树;再与主存储服务器进行信息交换,从而判断用户对文件拥有所有权;最后删除重复数据,确保了各用户数据文件存储的安全性。

权利要求书

权利要求书
1.  一种可证明文件所有权的重复数据删除方法,其特征在于,包括如下 步骤:
本地客户端接受用户需要存储的数据文件;
用通用哈希函数将文件压缩成固定大小(如64M),对压缩后的文件分割 成若干块数据,将数据块用SHA256算法生产一个唯一的长为128位(bits) 的散列值,再对每两个散列值一组计算建立Merkle哈希树。
本地客户端通过Merkle哈希树与主存储服务器进行信息交换,确定用户 是否拥有该数据文件的所有权,如果拥有,则进行文件级重复数据删除,否则 本地客户端上传并保存数据文件至主存储服务器。

说明书

说明书一种可证明文件所有权的重复数据删除方法
技术领域
本发明涉及计算机云存储的重复数据删除方法,具体涉及用户能够及时有 效地证明服务器上文件所有权的一种重复数据删除方法。
背景技术
随着各行各业信息化的要求越来越高,需要存储的数据量越来越庞大,然 而,已经存储的数据中有相当一部分是重复的,这样既浪费存储空间又增加了 存储的工作量。为了缓解存储系统的空间增长问题,提出了重复数据删除技术, 有效地节约存储空间和应用更加合理的方式来管理数据。据报告,商业应用在 存储和备份中能够实现的重复删除比率从1:10到高达1:500,从而节约存储空 间和宽带达到90%。
在传统应用重复数据删除技术的云存储系统中,各用户首先向服务器上传 文件的哈希值,然后云存储服务器检查数据库中是否存在该哈希值。如果哈希 值在数据库不存在,服务器则要求用户上传整个文件,否则不上传整个文件。
但是,对于文件级重复数据删除技术而言,目前存在的主要问题是:云存 储服务器通过一些短小的信息(如哈希值)来判断用户是否拥有整个文件,针 对多用户而言,如果该哈希值泄露,其他用户就可以通过短小的信息来获得整 个文件,因此用户存储在服务器的文件就很不安全。
发明内容
发明的目:提出一种先快速有效地证明用户对文件拥有所有权,再删除用 户的重复数据文件的方法,解决了传统重复数据删除方法中通过一些短小的信 息(如哈希值)来判断文件是否重复,而没有判断用户是否对文件具有所有权 的安全性问题。
技术方案:一种可证明文件所有权的重复数据删除方法,包括如下步骤:
本地客户端接受用户需要存储的数据文件;
用通用哈希函数将文件压缩成固定大小(如64M),对压缩后的文件分割 成若干数据块,将数据块用SHA256算法生产一个唯一的长为128位(bits) 的散列值,再对每两个散列值一组计算建立Merkle哈希树。
本地客户端通过Merkle哈希树与主存储服务器进行信息交换,确定用户 是否拥有该数据文件的所有权,如果拥有,则进行文件级重复数据删除,否则 本地客户端上传并保存数据文件至主存储服务器。
本发明采用上述技术方案,具有以下有益效果:本发明提供了一种可证明 文件所有权的重复数据删除方法,通过对数据文件建立Merkle哈希树与主存 储服务器进行信息交换,确定用户对文件拥有所有权后再删除重复数据,实现 了在保证数据压缩率情况下,服务器能够确定用户对文件拥有所有权,保证了 用户文件的安全性。
附图说明
图1为本发明实施流程图;
图2为数据文件的Merkle树;
图3为本地客户端与主服务器确定文件所有权流程图。
具体实施方式
下面结合附图对本发明的方法作进一步说明。
一种可证明文件所有权的重复数据删除方法,包括:本地客户端接收需要存储 数据文件;用通用哈希算法将文件压缩成固定长度,并对压缩后文件建立 Merkle哈希树;再与主存储服务器进行进行信息交换,从而判断用户对文件拥 有所有权;最后删除重复数据;其具体步骤如下:
1)本地客户端接收需要存储的数据文件;
2)采用通用哈希函数将数据文件压缩成固定大小(如64M),如果数据文 件小于固定大小,则直接跳到3);
3)对压缩后文件按照指定的块数(如256块)进行分割;
4)用抗碰撞哈希函数计算数据块的哈希值;
5)对数据块的哈希值每两个一组进行哈希计算,建立Merkle哈希树;
6)传送数据块Merkle哈希树根值至主存储服务器,判断是否存在;
A.存在,(1)主存储服务器随机返回一定数量Merkle哈希树叶子结点, 本地客户端响应叶子结点的兄弟路径的哈希值;(2)主存储服务器判断兄弟路 径的哈希值是正确的,则标记该用户完成存储文件,并标记用户具有文件的所 有权;(3)主服务器判断兄弟路径不正确,则转到B;
B.不存在,(1)在本地客户端存储数据文件Merkle哈希树;(2)将数据 文件以及数据文件Merkle哈希树发送至主存储服务器,并进行存储;
7)完成数据重复删除。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

一种可证明文件所有权的重复数据删除方法.pdf_第1页
第1页 / 共7页
一种可证明文件所有权的重复数据删除方法.pdf_第2页
第2页 / 共7页
一种可证明文件所有权的重复数据删除方法.pdf_第3页
第3页 / 共7页
点击查看更多>>
资源描述

《一种可证明文件所有权的重复数据删除方法.pdf》由会员分享,可在线阅读,更多相关《一种可证明文件所有权的重复数据删除方法.pdf(7页珍藏版)》请在专利查询网上搜索。

本发明公开了一种可证明文件所有权的重复数据删除方法,包括如下步骤:本地客户端接受需要存储数据文件;用哈希算法将文件压缩成固定长度,并对压缩后文件建立Merkle哈希树;再与主存储服务器进行信息交换,从而判断用户对文件拥有所有权;最后删除重复数据,确保了各用户数据文件存储的安全性。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1