一种待清理文件确定方法及装置.pdf

上传人:1*** 文档编号:6361796 上传时间:2019-06-04 格式:PDF 页数:22 大小:1.45MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510391809.6

申请日:

2015.07.06

公开号:

CN104965916A

公开日:

2015.10.07

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20150706|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京金山安全软件有限公司

发明人:

白锡亮

地址:

100085北京市海淀区小营西路33号二层东区

优先权:

专利代理机构:

北京柏杉松知识产权代理事务所(普通合伙)11413

代理人:

马敬; 项京

PDF下载: PDF下载
内容摘要

本发明实施例公开了一种待清理文件确定方法及装置,通过对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;判断目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;根据判断结果,确定目标文件是否为待清理文件。本发明可以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定出该文件为待清理文件,没有额外占用存储空间,比较过程给系统造成的运行负担也较小。

权利要求书

权利要求书
1.  一种待清理文件确定方法,其特征在于,包括:
对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
根据判断结果,确定所述目标文件是否为待清理文件。

2.  根据权利要求1所述的方法,其特征在于,所述对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息,包括:
接收用户的开始扫描指令;
根据所述开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
或者,
判断是否满足预设的时间条件;
在满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。

3.  根据权利要求2所述的方法,其特征在于,所述判断是否满足预设的时间条件,包括:
判断当前时刻是否到达预设的扫描时间点;或者,
判断上一次扫描后经过的时长是否达到预设的时长阈值。

4.  根据权利要求1所述的方法,其特征在于,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值,包 括:
在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。

5.  根据权利要求4所述的方法,其特征在于,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,包括:
将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
如果存在,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。

6.  根据权利要求5所述的方法,其特征在于,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,还包括:
在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清 理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
获取可清理文件所属应用程序的安装包名称的分类信息;
判断所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息是否一致;
在所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息一致的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。

7.  根据权利要求1所述的方法,其特征在于,所述根据判断结果,确定所述目标文件是否为待清理文件,包括:
在所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。

8.  一种待清理文件确定装置,其特征在于,包括:
提取模块,用于对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
第一判断模块,用于根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
第二判断模块,用于在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
确定模块,用于根据所述第二判断模块的判断结果,确定所述目标文件是否为待清理文件。

9.  根据权利要求8所述的装置,其特征在于,所述提取模块,包括:
接收单元,用于接收用户的开始扫描指令;
第一提取单元,用于根据所述接收单元接收的开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
第一判断单元,用于判断是否满足预设的时间条件;
第二提取单元,用于在所述判断单元判断满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。

10.  根据权利要求9所述的装置,其特征在于,所述第一判断单元,具体用于:
判断当前时刻是否到达预设的扫描时间点;或者,
判断上一次扫描后经过的时长是否达到预设的时长阈值。

11.  根据权利要求8所述的装置,其特征在于,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述第二判断模块,包括:
包名获得单元,用于在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
相似度计算单元,用于计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
第二判断单元,用于判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
第一确定单元,用于在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。

12.  根据权利要求11所述的装置,其特征在于,所述第二判断单元,包括:
切分子单元,用于将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
第一判断子单元,用于判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
第一确定子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。

13.  根据权利要求12所述的装置,其特征在于,所述第二判断单元,还包括:
第一获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
第二获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取可清理文件所属应用程序的安装包名称的分类信息;
第二判断子单元,用于判断所述第一获取子单元获取的目标文件所属应用程序的安装包名称的分类信息和所述第二获取子单元获取的可清理文件所属应用程序的安装包名称的分类信息是否一致;
第二确定子单元,用于在所述第二判断子单元判断结果为是的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。

14.  根据权利要求8所述的装置,其特征在于,所述确定模块,包括:
第三判断单元,用于在所述第二判断模块判断结果为是的情况下,根据预 设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
第二确定单元,用于在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。

说明书

说明书一种待清理文件确定方法及装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种待清理文件确定方法及装置。
背景技术
在移动设备中,安装有各种各样的应用程序,在用户使用移动设备的过程中,这些应用程序会创建一些文件,比如,应用程序接收到的一些图片会存储在图片文件中,应用程序运行时需要的一些数据会存在缓存文件中,这些图片文件或者缓存文件可能在使用过之后就不再需要了,但是却会占用移动设备大量的存储空间,造成移动设备的存储空间不足。因此需要清理这些文件,以释放移动设备的存储空间。
根据现有技术,为了实现对移动设备文件的清理,需要预先设置一个可清理文件列表,该列表中记载了若干已知可清理文件的文件特征信息(例如文件的路径、文件所属的应用程序安装包名称等等)。进行文件清理时,首先对移动终端存储空间进行扫描,提取存储空间中文件的特征信息,将提取到的特征信息与列表中记载的特征信息进行比较,如果列表中记载的一个已知可清理文件的所有特征信息分别与存储空间中某个文件的相应特征信息一致,则将存储空间中的该文件确定为可清理文件。
根据现有技术的方案,要求列表中记载的一个已知可清理文件的所有特征信息分别与存储空间中某个文件的相应特征信息一致,才允许对存储空间中的这个文件进行清理。为了减小被清理的概率,可清理文件对应的应用程序的生产商往往会对可清理文件的部分特征信息进行一些微小的变化,如改变安装包名称中的一个字,从而使得现有的清理技术无法将改变了特征信息的文件识别为可清理文件,不对改变了特征信息的文件进行清理。现有技术通过将变化后的特征信息及时得加入可清理文件列表中来解决这个问题。但是,特征信息的增加会占用额外的空间,同时进行特征信息比较时需要比较的特征信息也较多,提高了比较过程给系统造成的运行负担。
发明内容
本发明实施例的目的在于提供一种待清理文件确定方法和装置,以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定待清理文件。
为达到上述的一个目的,本发明实施例公开了一种待清理文件确定方法,包括:
对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
根据判断结果,确定所述目标文件是否为待清理文件。
可选的,所述对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息,包括:
接收用户的开始扫描指令;
根据所述开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
或者,
判断是否满足预设的时间条件;
在满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
可选的,所述判断是否满足预设的时间条件,包括:
判断当前时刻是否到达预设的扫描时间点;或者,
判断上一次扫描后经过的时长是否达到预设的时长阈值。
可选的,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息 的相似度是否超过预设的相似度阈值,包括:
在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
可选的,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,包括:
将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
如果存在,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
可选的,所述判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,还包括:
在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清 理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
获取可清理文件所属应用程序的安装包名称的分类信息;
判断所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息是否一致;
在所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息一致的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
可选的,所述根据判断结果,确定所述目标文件是否为待清理文件,包括:
在所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。
一种待清理文件确定装置,包括:
提取模块,用于对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
第一判断模块,用于根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
第二判断模块,用于在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
确定模块,用于根据所述第二判断模块的判断结果,确定所述目标文件是否为待清理文件。
可选的,所述提取模块,包括:
接收单元,用于接收用户的开始扫描指令;
第一提取单元,用于根据所述接收单元接收的开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
第一判断单元,用于判断是否满足预设的时间条件;
第二提取单元,用于在所述判断单元判断满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
可选的,所述第一判断单元,具体用于:
判断当前时刻是否到达预设的扫描时间点;或者,
判断上一次扫描后经过的时长是否达到预设的时长阈值。
可选的,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述第二判断模块,包括:
包名获得单元,用于在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
相似度计算单元,用于计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
第二判断单元,用于判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
第一确定单元,用于在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
可选的,所述第二判断单元,包括:
切分子单元,用于将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
第一判断子单元,用于判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相 同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
第一确定子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
可选的,所述第二判断单元,还包括:
第一获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
第二获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取可清理文件所属应用程序的安装包名称的分类信息;
第二判断子单元,用于判断所述第一获取子单元获取的目标文件所属应用程序的安装包名称的分类信息和所述第二获取子单元获取的可清理文件所属应用程序的安装包名称的分类信息是否一致;
第二确定子单元,用于在所述第二判断子单元判断结果为是的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
可选的,所述确定模块,包括:
第三判断单元,用于在所述第二判断模块判断结果为是的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
第二确定单元,用于在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。
本发明实施例提供的技术方案,通过对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;判断目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;根据判断结果,确定目标文件是否为待清理文件。本发明实施例提供的技术方案通过第一类特征信息相同,第二类特征信息的相似度满足预设的相似度阈值就可以确定出待清理文件,降低了目标文件和可清理文件之间的匹配标准。这样,当可清理文件的部分特征信息发生一些微小的变化时,本发明可以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定出该文件为待清理文件,没有额外占用存储空间,比较过程给系统造成的运行负担也较小。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种待清理文件确定方法流程图一;
图2为本发明实施例提供的一种待清理文件确定方法流程图二;
图3为本发明实施例提供的一种待清理文件确定方法流程图三;
图4为本发明实施例提供的一种待清理文件确定方法流程图四;
图5为本发明实施例提供的一种待清理文件确定方法流程图五;
图6为本发明实施例提供的一种待清理文件确定装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种待清理文件确定方法,该方法可以包括以下步骤:
S100:对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
其中,第一类特征信息可以为路径,第二类特征信息可以为安装包名称。当然,第一类型特征信息也可以为其他特征信息,如目标文件所属应用程序的安装包名称的分类信息;第二类型特征信息也可以为其他特征信息,如目标文件的数据量信息。
具体的,可以对移动设备存储空间中的文件逐一进行扫描,将扫描到的文件都确定为目标文件,在扫描到一个目标文件的时候就提取出目标文件的特征信息,如:目标文件的路径和目标文件所属应用程序的安装包名称。具体地,可以是从目标文件的属性信息中提取出路径。在本发明实施例中,应用程序都是在安卓系统下安装的应用程序,因此应用程序的安装包名称符合安卓应用程序的命名。例如,com.mstar.games.chess.XXX,表示mstar公司,游戏项目组,中国象棋项目,XXX为具体应用程序名称。
在本发明实施例中,可以是通过接收用户的清理文件指令对存储空间进行扫描;当接收到用户清理文件的指令,根据所述清理文件指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;还可以是预先设置一个时间条件,判断是否满足预设的时间条件;在满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
也即:步骤S100可以包括:
接收用户的开始扫描指令;
根据所述开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
或者,
判断是否满足预设的时间条件;
在满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
具体地,判断是否满足预设的时间条件可以包括:判断当前时刻是否到达预设的扫描时间点;或者,判断上一次扫描后经过的时长是否达到预设的时长阈值。例如,设置每天中午的12点为扫描时间点,在判断到达中午12点时,开始对移动设备的存储空间进行扫描。还可以预设两次扫描之间的时长阈值为一天,在完成一次扫描后判断已经到达了一天的时间,开始对移动设备的存储空间进行扫描。
需要说明的是,本发明实施例中不对以何种方式开始扫描进行限制,也不对预设的时间条件进行限制,用户可以任意设置开始扫描的方式,也可以任意设置时间条件。
S200:根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
预设的可清理文件列表为预先设置的已被判断为可清理文件的列表,在可清理文件列表中包括所有可清理文件的特征信息,每一条可清理文件还可以包括用户清理次数,该用户清理次数可以是通过统计可清理文件携带的用户标识得到的。
在本发明实施例判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同,如果不是相同,则确定目标文件不为待清理的文件。
S300:在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
下面以所述第一类特征信息为路径且所述第二类特征信息为安装包名称为例进行说明:
在实际中,用户会在移动设备中下载很多的应用程序,有一些应用程序,尤其是同一类型或者不同版本的应用程序,可能会在安装过程或使用过程中,在同一路径下产生文件,这些同一路径下的文件通过文件所属应用程序的安装包名称进行区分。在现有技术中,在目标文件的路径与可清理文件的路径相同的情况下,进一步判断目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称是否相同,需要在可清理文件列表中也存在具有同样安装包名称的可清理文件,在应用程序种类增加的时候可清理文件列表也需要增 加新的特征信息才能彻底清理文件。本发明实施例可以在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值,无需文件的全部特征均相同。当可清理文件的部分特征信息发生了微小的变化时,由于变化前后的特征信息相似度较高,因此本发明仍可使用变化前的特征信息识别可清理文件,无需添加新的特征信息。
S400:根据判断结果,确定目标文件是否为待清理文件。
在本发明实施例中,在判断结果为目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度未超过预设的相似度阈值时,直接确定目标文件不是待清理的文件。可以在判断结果为目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值时,直接确定目标文件是待清理的文件。还可以为了保证得到的待清理文件的准确性,继续判断与目标文件匹配的可清理文件列表中可清理文件的用户清理次数,在用户清理次数大于一定阈值的情况下,确定目标文件为待清理文件。可清理文件列表中可清理文件的用户清理次数是通过统计用户上传可清理文件时,可清理文件携带的用户标识得到的,通过统计用户标识可以知道有多少用户对该可清理文件进行了清理,如果用户标识数量超过一定的阈值,说明该可清理文件确实属于应该被清理的文件,因此根据用户清理次数大于一定阈值确定目标文件是待清理文件。
因此,S400可以包括:
在所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。
本发明实施例提供的一种待清理文件确定方法,通过对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;判断目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;根 据判断结果,确定目标文件是否为待清理文件。本发明实施例提供的技术方案通过第一类特征信息相同,第二类特征信息的相似度满足预设的相似度阈值就可以确定出待清理文件,降低了目标文件和可清理文件之间的匹配标准。这样,当可清理文件的部分特征信息发生一些微小的变化时,本发明可以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定出该文件为待清理文件,没有额外占用存储空间,比较过程给系统造成的运行负担也较小。
在上述实施例的基础上,如图2所示,本发明实施例提供的一种待清理文件确定方法,还可以包括:
S500:显示待清理文件;
在本发明实施例中,在确定出待清理的文件后,先在移动设备的显示界面上显示待清理的文件。
需要说明的是,在确定出待清理的文件后,可以直接将待清理的文件进行清理,但是,为了能让用户对待清理文件有更清楚的了解,在本发明实施例中,可以在移动设备的显示界面上显示待清理文件,用户可以清楚看到将要清理的文件,防止误清理。
S600:接收用户对显示的待清理文件执行清理的操作;
具体地,在显示的待清理文件的界面上提供有接收用户执行清理操作的控件,通过接收用户对控件的点击执行清理操作。
需要说明的是,可以在显示界面上提供一个一键清理的控件,还可以在每个可清理文件旁都提供一个可选中的控件,由用户进行选择需要清理的待清理文件。
S700:根据用户执行的清理操作清理待清理的文件。
本发明实施例通过显示待清理文件,在接收用户执行的清理操作后才进行清理待清理的文件,能让用户对待清理文件有更清楚的了解,防止误清理。
在上述实施例的基础上,如图3所示,步骤S300可以包括以下步骤:
S310、在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装 包名称;
S320、计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
S330、判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
S340、在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度未超过预设的第一文本相似度阈值的情况下,可以确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度未超过预设的相似度阈值。
其中,如图4所示,步骤S330可以包括:
S331、将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
具体地,将安装包名称按照字符段切分为多个安装包名称片段可以为按照字符“.”进行安装包名称的切分,例如目标文件的安装包名称为com.mstar.games.chess.XXX,按照字符“.”切分为“com”、“mstar”、“games”、“chess”、“XXX”这几个安装包名称片段。可清理文件的安装包名称也按照同样的方式进行切分。
S332、判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
具体地,将切分后的安装包名称片段去除通用字符,比如android、google、com等字符串,以安装包名称为com.mstar.games.chess.XXX为例,切分后的安装 包名称片段要去除“com”。比较目标文件的安装包名称片段和可清理文件的安装包名称片段是否相似或相同。
S333、如果存在,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
如果不存在,可以直接确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度未超过预设的第一文本相似度阈值,也可以根据文件所属应用程序的安装包名称的分类信息确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值。
在本发明实施例中,通过判断切分后的安装包名称片段中是否相同或者相似,就可以确定目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值,无需使用变化后的特征信息。
如图5所示,在图4所示实施例基础上,本发明实施例提供的另一种待清理文件确定方法中,步骤S330还可以包括:
S334、在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
安装包名称的分类信息就是应用程序的分类信息,分类信息可以包括游戏类、办公类、即时通讯类等,在应用程序开发时,都会给出一个分类信息,这些分类信息都可以通过查询已知的应用程序分类表得知。
S335、获取可清理文件所属应用程序的安装包名称的分类信息;
其中,步骤S334和步骤S335的执行先后顺序可以任意,本发明对此不作限定。
S336、判断所述目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息是否一致;
S337、在所述目标文件所属应用程序的安装包名称的分类信息和可清理文 件所属应用程序的安装包名称的分类信息一致的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
如果不一致,可以确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度未超过预设的第一文本相似度阈值。
在本发明实施例中,只要判断安装包名称的分类信息一致,就确定目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。例如不同公司开发的同一种类型的游戏类应用程序,在取安装包名称的时候是不相同的,但是属于同一类型的应用程序,在匹配的过程认为安装包名称的相似度超过预设的第一文本相似度阈值。
需要说明的是,在本发明实施例中也可以在没有判断安装包名称相似或相同的情况下,直接获取安装包名称的分类信息。
在本发明实施例中,在不存在相似或相同的安装包名称的情况下,通过获取安装包名称的分类信息,进行匹配,只要目标文件所属应用程序的安装包名称的分类信息和可清理文件所属应用程序的安装包名称的分类信息一致,就确定目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。本发明可以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定出该文件为待清理文件,没有额外占用存储空间,比较过程给系统造成的运行负担也较小。
相应于上述的方法实施例,本发明实施例还提供一种待清理文件确定装置,如图6所示,该装置可以包括:提取模块100、第一判断模块200、第二判断模块300和确定模块400,
提取模块100,用于对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
其中,第一类特征信息可以为路径,第二类特征信息可以为安装包名称。当然,第一类型特征信息也可以为其他特征信息,如目标文件所属应用程序的 安装包名称的分类信息;第二类型特征信息也可以为其他特征信息,如目标文件的数据量信息。
其中,所述提取模块100,可以包括:接收单元和第一提取单元,或者,所述提取模块100,可以包括:第一判断单元和第二提取单元,或者,所述提取模块100,可以包括:接收单元、第一提取单元、第一判断单元和第二提取单元,
接收单元,用于接收用户的开始扫描指令;
第一提取单元,用于根据所述接收单元接收的开始扫描指令对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;
第一判断单元,用于判断是否满足预设的时间条件;
第二提取单元,用于在所述判断单元判断满足预设的时间条件的情况下,对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息。
其中,所述第一判断单元,具体用于:
判断当前时刻是否到达预设的扫描时间点;或者,
判断上一次扫描后经过的时长是否达到预设的时长阈值。
例如,设置每天中午的12点为扫描时间点,在判断到达中午12点时,开始对移动设备的存储空间进行扫描。还可以预设两次扫描之间的时长阈值为一天,在完成一次扫描后判断已经到达了一天的时间,开始对移动设备的存储空间进行扫描。
需要说明的是,本发明实施例中不对以何种方式开始扫描进行限制,也不对预设的时间条件进行限制,用户可以任意设置开始扫描的方式,也可以任意设置时间条件。
第一判断模块200,用于根据预设的可清理文件列表,判断所述目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;
预设的可清理文件列表为预先设置的已被判断为可清理文件的列表,在可清理文件列表中包括所有可清理文件的特征信息,每一条可清理文件还可以包括用户清理次数,该用户清理次数可以是通过统计可清理文件携带的用户标识得到的。
第二判断模块300,用于在所述目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;
具体的,所述第一类特征信息为路径,所述第二类特征信息为安装包名称,所述第二判断模块300,可以包括:包名获得单元、相似度计算单元、第二判断单元和第一确定单元,
包名获得单元,用于在所述目标文件的路径与可清理文件的路径相同的情况下,获取所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称;
相似度计算单元,用于计算所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度;
第二判断单元,用于判断所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度是否超过预设的第一文本相似度阈值;
第一确定单元,用于在所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值的情况下,确定所述目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度超过预设的相似度阈值。
其中,所述第二判断单元,可以包括:切分子单元、第一判断子单元和第一确定子单元,
切分子单元,用于将所述目标文件所属应用程序的安装包名称与可清理文件所属应用程序的安装包名称分别按照字符段切分为多个安装包名称片段;
第一判断子单元,用于判断所述目标文件所属应用程序的多个安装包名称片段中是否存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段,所述相似指所述目标文件所属应用程序的安装包名称片段和所述可清理文件所属应用程序的安装包名称片段的相似度超过预设的第二文本相似度阈值;
第一确定子单元,用于在所述目标文件所属应用程序的多个安装包名称片 段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
可选的,所述第二判断单元,还可以包括:第一获取子单元、第二获取子单元、第二判断子单元和第二确定子单元,
第一获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取所述目标文件所属应用程序的安装包名称的分类信息;
第二获取子单元,用于在所述目标文件所属应用程序的多个安装包名称片段中不存在与所述可清理文件所属应用程序的至少一个安装包名称片段相同或相似的安装包名称片段的情况下,获取可清理文件所属应用程序的安装包名称的分类信息;
第二判断子单元,用于判断所述第一获取子单元获取的目标文件所属应用程序的安装包名称的分类信息和所述第二获取子单元获取的可清理文件所属应用程序的安装包名称的分类信息是否一致;
第二确定子单元,用于在所述第二判断子单元判断结果为是的情况下,确定所述目标文件所属应用程序的安装包名称和所述可清理文件所属应用程序的安装包名称的相似度超过预设的第一文本相似度阈值。
确定模块400,用于根据所述第二判断模块300的判断结果,确定所述目标文件是否为待清理文件。
其中,所述确定模块400,可以包括:
第三判断单元,用于在所述第二判断模块300判断结果为是的情况下,根据预设的可清理文件列表,判断所述可清理文件的用户清理次数是否超过预设值;
第二确定单元,用于在所述可清理文件的用户清理次数超过预设值的情况下,确定所述目标文件为待清理文件。
本发明实施例提供的一种待清理文件确定装置,通过对存储空间进行扫描, 提取目标文件的第一类特征信息和第二类特征信息;判断目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;根据判断结果,确定目标文件是否为待清理文件。本发明实施例提供的技术方案通过第一类特征信息相同,第二类特征信息的相似度满足预设的相似度阈值就可以确定出待清理文件,降低了目标文件和可清理文件之间的匹配标准。这样,当可清理文件的部分特征信息发生一些微小的变化时,本发明可以在不增加可清理文件列表中可清理文件的特征信息的数量的情况下,确定出该文件为待清理文件,没有额外占用存储空间,比较过程给系统造成的运行负担也较小。
在图6所示装置基础上,本发明实施例提供的另一种待清理文件确定装置,还可以包括:显示模块、接收模块和清理模块,
显示模块,用于显示待清理文件;
在本发明实施例中,在确定出待清理的文件后,先在移动设备的显示界面上显示待清理的文件。
需要说明的是,在确定出待清理的文件后,可以直接将待清理的文件进行清理,但是,为了能让用户对待清理文件有更清楚的了解,在本发明实施例中,可以在移动设备的显示界面上显示待清理文件,用户可以清楚看到将要清理的文件,防止误清理。
接收模块,用于接收用户对显示模块显示的待清理文件执行清理的操作;
具体地,在显示的待清理文件的界面上提供有接收用户执行清理操作的控件,通过接收用户对控件的点击执行清理操作。
需要说明的是,可以在显示界面上提供一个一键清理的控件,还可以在每个可清理文件旁都提供一个可选中的控件,由用户进行选择需要清理的待清理文件。
清理模块,用于根据接收模块接收的用户执行的清理操作清理待清理的文件。
本发明实施例通过显示待清理文件,在接收用户执行的清理操作后才进行 清理待清理的文件,能让用户对待清理文件有更清楚的了解,防止误清理。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

一种待清理文件确定方法及装置.pdf_第1页
第1页 / 共22页
一种待清理文件确定方法及装置.pdf_第2页
第2页 / 共22页
一种待清理文件确定方法及装置.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《一种待清理文件确定方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种待清理文件确定方法及装置.pdf(22页珍藏版)》请在专利查询网上搜索。

本发明实施例公开了一种待清理文件确定方法及装置,通过对存储空间进行扫描,提取目标文件的第一类特征信息和第二类特征信息;判断目标文件的第一类特征信息与可清理文件的第一类特征信息是否相同;在目标文件的第一类特征信息与可清理文件的第一类特征信息相同的情况下,判断目标文件的第二类特征信息与可清理文件的第二类特征信息的相似度是否超过预设的相似度阈值;根据判断结果,确定目标文件是否为待清理文件。本发明可以在不。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1