一种时间序列数据挖掘系统.pdf

上传人:1520****312 文档编号:467200 上传时间:2018-02-18 格式:PDF 页数:6 大小:682.12KB
返回 下载 相关 举报
摘要
申请专利号:

CN201410347432.X

申请日:

2014.07.21

公开号:

CN104182461A

公开日:

2014.12.03

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20140721|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

安徽华贞信息科技有限公司

发明人:

贾岩

地址:

230000 安徽省合肥市高新区黄山路602号国家大学科技园A502

优先权:

专利代理机构:

合肥市长远专利代理事务所(普通合伙) 34119

代理人:

程笃庆;黄乐瑜

PDF下载: PDF下载
内容摘要

本发明提出了一种时间序列数据挖掘系统,适用范围广,易于理解,便于操作,适合中小企业竞争情报分析系统,其包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。其中,原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理;时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列;单条时间序列模式发现模块,整理第一元模式集……第N-1元模式集、第N元模式集;同类别多条时间序列模式发现模块,计算时间序列频繁模式。

权利要求书

1.  一种时间序列数据挖掘系统,其特征在于,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。

2.
  如权利要求1所述的时间序列数据挖掘系统,其特征在于,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。

3.
  如权利要求1或2所述的时间序列数据挖掘系统,其特征在于,时间序列数据为确定时间序列数据和/或随机时间序列数据。

4.
  如权利要求1所述的时间序列数据挖掘系统,其特征在于,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。

说明书

一种时间序列数据挖掘系统
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种时间序列数据挖掘系统。
背景技术
数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。
数据库中的数据量非常庞大,分析数据时必须遵循一定的规律。由于时间序列时普遍存在的,现在常用的数据挖掘为时间序列数据挖掘,即在不同时间点上收集数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
时间序列数据挖掘是现有的数据挖掘最常用的手段,但是,现有的时间序列数据挖掘方法针对性强,不同环境、不同对象之间的时间序列挖掘方法及模型往往相差巨大,例如,季节降雨量、中国GDP的变化、金融市场分析等等都需要不同的时间序列数据挖掘模型。另外,随着企业竞争的日益激烈,竞争情报分析也越来越受到重视,但是现有的竞争情报数据分析系统耗资甚巨,中小型企业难以承受,他们急需一种简洁、快速、方便的数据挖掘方法。
发明内容
基于背景技术存在的问题,本发明提出了一种时间序列数据挖掘系统,适用范围广,且易于理解,便于操作,适用于中小企业竞争情报分析系统。
本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理 模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1;
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
优选地,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。
优选地,时间序列数据为确定时间序列数据和/或随机时间序列数据。
优选地,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手动设置。
本发明提出的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需求,适用范围广泛,能够满足竞争情报分析的需要;而且本发明中,采集数据的时间顺序、数据相似度算法既可以自动设置又可以手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高;同理,时间序列数 据可根据需要选择确定时间序列数据和/或随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。本发明条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
附图说明
图1为本发明提出的一种时间序列数据挖掘系统的结构图;
图2为图1所示系统的工作流程图。
具体实施方式
参照图1、图2,本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。
原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,使得时间序列数据变化模式更加清晰也更具有代表性。处理后的时间序列数据被发送到时间序列聚类分析模块。
时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列……第N-1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N>1。
单条时间序列模式发现模块,分别针对第一类别时间序列……第N-1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集……第N-1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块。
同类别多条时间序列模式发现模块,根据第一元模式集……第N-1元模式 集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。
以上实施方式的原始数据处理模块中,采集时间序列数据的时间顺序可自动设置也可手动设置,时间序列数据可以是确定时间序列数据也可以是随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。
以上实施方式的时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置也可手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高。
以上实施方式中的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需要,适用范围广泛,能够满足竞争情报分析的需要,而且,条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

一种时间序列数据挖掘系统.pdf_第1页
第1页 / 共6页
一种时间序列数据挖掘系统.pdf_第2页
第2页 / 共6页
一种时间序列数据挖掘系统.pdf_第3页
第3页 / 共6页
点击查看更多>>
资源描述

《一种时间序列数据挖掘系统.pdf》由会员分享,可在线阅读,更多相关《一种时间序列数据挖掘系统.pdf(6页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104182461A43申请公布日20141203CN104182461A21申请号201410347432X22申请日20140721G06F17/3020060171申请人安徽华贞信息科技有限公司地址230000安徽省合肥市高新区黄山路602号国家大学科技园A50272发明人贾岩74专利代理机构合肥市长远专利代理事务所普通合伙34119代理人程笃庆黄乐瑜54发明名称一种时间序列数据挖掘系统57摘要本发明提出了一种时间序列数据挖掘系统,适用范围广,易于理解,便于操作,适合中小企业竞争情报分析系统,其包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模。

2、块、同类别多条时间序列模式发现模块。其中,原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理;时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列第N1类别时间序列、第N类别时间序列;单条时间序列模式发现模块,整理第一元模式集第N1元模式集、第N元模式集;同类别多条时间序列模式发现模块,计算时间序列频繁模式。51INTCL权利要求书1页说明书3页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书3页附图1页10申请公布号CN104182461ACN10418246。

3、1A1/1页21一种时间序列数据挖掘系统,其特征在于,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列第N1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N1;单条时间序列模式发现模块,分别针对第一类别时间序列第N1类别时间序列、第N类别时间序列,分。

4、析其变化模式,整理对应的第一元模式集第N1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;同类别多条时间序列模式发现模块,根据第一元模式集第N1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。2如权利要求1所述的时间序列数据挖掘系统,其特征在于,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。3如权利要求1或2所述的时间序列数据挖掘系统,其特征在于,时间序列数据为确定时间序列数据和/或随机时间序列数据。4如权利要求1所述的时间序列数据挖掘系统,其特征在于,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度。

5、计算方法可自动设置和/或手动设置。权利要求书CN104182461A1/3页3一种时间序列数据挖掘系统技术领域0001本发明涉及数据挖掘技术领域,尤其涉及一种时间序列数据挖掘系统。背景技术0002数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。0003数据库中的数据量非常庞大,分析数据时必须遵循一定的规律。由于时间序列时普遍存在的,现在常用的数据挖掘为时间序列数据挖掘,即。

6、在不同时间点上收集数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。0004时间序列数据挖掘是现有的数据挖掘最常用的手段,但是,现有的时间序列数据挖掘方法针对性强,不同环境、不同对象之间的时间序列挖掘方法及模型往往相差巨大,例如,季节降雨量、中国GDP的变化、金融市场分析等等都需要不同的时间序列数据挖掘模型。另外,随着企业竞争的日益激烈,竞争情报分析也越来越受到重视,但是现有的竞争情报数据分析系统耗资甚巨,中小型企业难以承受,他们急需一种简洁、快速、方便的数据挖掘方法。发明内容0005基于背景技术存在的问题,本发明提出了一种时间序列数据挖掘系统,适用范围广,且易于理解,便于操作,适用。

7、于中小企业竞争情报分析系统。0006本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块;其中,0007原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,并将处理后的时间序列数据发送到时间序列聚类分析模块;0008时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第一类别时间序列第N1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N1;0009单条时间序列模式发现模块,分别针对第一类别时间。

8、序列第N1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集第N1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块;0010同类别多条时间序列模式发现模块,根据第一元模式集第N1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。0011优选地,原始数据处理模块中,采集时间序列数据的时间顺序可自动设置和/或手动设置。说明书CN104182461A2/3页40012优选地,时间序列数据为确定时间序列数据和/或随机时间序列数据。0013优选地,时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置和/或手。

9、动设置。0014本发明提出的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需求,适用范围广泛,能够满足竞争情报分析的需要;而且本发明中,采集数据的时间顺序、数据相似度算法既可以自动设置又可以手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高;同理,时间序列数据可根据需要选择确定时间序列数据和/或随机时间序列数据,确定时间序列数据比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。本发明条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。附图。

10、说明0015图1为本发明提出的一种时间序列数据挖掘系统的结构图;0016图2为图1所示系统的工作流程图。具体实施方式0017参照图1、图2,本发明提出的一种时间序列数据挖掘系统,包括依次连接的原始数据处理模块、时间序列聚类分析模块、单条时间序列模式发现模块、同类别多条时间序列模式发现模块。0018原始数据处理模块,按访问时间顺序采集时间序列数据,并对其进行划分和平滑处理,使得时间序列数据变化模式更加清晰也更具有代表性。处理后的时间序列数据被发送到时间序列聚类分析模块。0019时间序列聚类分析模块,分析接收到的时间序列数据相似度,利用聚类算法对时间序列数据进行聚类,将时间序列数据按关联程度分为第。

11、一类别时间序列第N1类别时间序列、第N类别时间序列并发送到单条时间序列模式发现模块,N1。0020单条时间序列模式发现模块,分别针对第一类别时间序列第N1类别时间序列、第N类别时间序列,分析其变化模式,整理对应的第一元模式集第N1元模式集、第N元模式集并发送到同类别多条时间序列模式发现模块。0021同类别多条时间序列模式发现模块,根据第一元模式集第N1元模式集、第N元模式集,分析整理多条时间序列通用的模式,计算时间序列频繁模式。0022以上实施方式的原始数据处理模块中,采集时间序列数据的时间顺序可自动设置也可手动设置,时间序列数据可以是确定时间序列数据也可以是随机时间序列数据,确定时间序列数据。

12、比较适合事件时间确定的分析场合,大大减少了数据量,提高分析速率并节约成本,随机时间序列数据更为适合事件时间不确定的分析场合,采用大面积撒网的策略,防止重要数据遗漏。0023以上实施方式的时间序列聚类分析模块中,通过相似度计算方法分析时间序列数据相似度,相似度计算方法可自动设置也可手动设置,自动设置时,效率高,人工成本低,手动设置时,针对性强,准确率高。说明书CN104182461A3/3页50024以上实施方式中的时间序列数据挖掘系统,符合大多数数据挖掘场景的应用需要,适用范围广泛,能够满足竞争情报分析的需要,而且,条理清晰,便于理解,可操作性强,尤其适合中小型企业的竞争情报分析系统。0025以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。说明书CN104182461A1/1页6图1图2说明书附图CN104182461A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1