《一种数据挖掘系统.pdf》由会员分享,可在线阅读,更多相关《一种数据挖掘系统.pdf(5页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104281596 A (43)申请公布日 2015.01.14 CN 104281596 A (21)申请号 201310280411.6 (22)申请日 2013.07.04 G06F 17/30(2006.01) (71)申请人 上海朗迈网络科技有限公司 地址 200030 上海市徐汇区虹桥路 333 号 1 幢 229 室 (72)发明人 不公告发明人 (54) 发明名称 一种数据挖掘系统 (57) 摘要 本发明公开一种数据挖掘系统, 该数据挖掘 系统包括数据挖掘终端, 该数据挖掘终端用于挖 掘网络中符合用户预设条件的数据, 并且该数据 挖掘终端通过总线接入该。
2、网络中, 其中, 该数据挖 掘终端还包括 : 配置模块, 用于配置数据挖掘条 件以及数据结构和数据类型 ; 识别模块用于识别 网络的物理层、 链路层和应用协议层 ; 存储器, 用 于存储所配置的数据挖掘条件以及按照所配置的 数据结构和数据类型存储挖掘所得的数据 ; 本发 明的优点是 : 本发明中采用统计分析、 决策树、 粗 糙集、 模糊集、 基于范例的推理、 神经网络等数据 挖掘方法对信息数据集中的海量数据进行分析、 处理、 推理、 预测, 最终根据用户设定的条件, 实现 最优方案的自动推送。 (51)Int.Cl. 权利要求书 1 页 说明书 3 页 (19)中华人民共和国国家知识产权局 (。
3、12)发明专利申请 权利要求书1页 说明书3页 (10)申请公布号 CN 104281596 A CN 104281596 A 1/1 页 2 1. 一种数据挖掘系统, 其特征在于, 该数据挖掘系统包括数据挖掘终端, 该数据挖掘 终端用于挖掘网络中符合用户预设条件的数据, 并且该数据挖掘终端通过总线接入该网络 中, 其中, 该数据挖掘终端还包括 : 配置模块, 用于配置数据挖掘条件以及数据结构和数据类型 ; 识别模块, 用于识别网络的物理层、 链路层和应用协议层 ; 存储器, 用于存储所配置的数据挖掘条件以及按照所配置的数据结构和数据类型存储 挖掘所得的数据, 其中, 该配置模块分别与该识别模。
4、块和存储器相连 ; 程序脚本处理模块, 其获取对应于不同的数据挖掘子过程的多个程序脚本, 其中, 一个 所述数据挖掘子过程包括至少一个所述程序脚本, 每个所述程序脚本具有一个对应的脚本 标识, 所述脚本标识用于标示该脚本标识对应的程序脚本归属的数据挖掘子过程 ; 获取所 述多个程序脚本对应的多个脚本标识 ; 按照所述不同的数据挖掘子过程的执行顺序, 确定 所述多个脚本标识对应的所述多个程序脚本的调用顺序 ; 按照确定的所述调用顺序依次调 用所述多个程序脚本, 进行数据挖掘 ; 工作流模块, 用于设置数据挖掘的工作流, 所述工作流中包括多个并行的挖掘算法实 现处理任务 ; 挖掘算法实现模块, 用。
5、于当所述工作流中的所述多个并行的挖掘算法实现处理任务被 触发时, 为其中的每个挖掘算法实现处理任务分配执行节点, 以使所述多个并行的挖掘算 法实现处理任务在分配的执行节点上并行执行, 并处理得到相应挖掘算法实现处理任务的 处理结果。 2. 根据权利要求 1 所述的数据挖掘系统, 其特征在于, 所述配置的数据挖掘条件包括 条件代码、 条件参数, 其中, 条件代码指明挖掘条件, 配置的数据类型包括数据 ID、 字节地 址、 位地址和数据长度, 该数据结构为链表数据结构。 3. 如权利要求 2 所述的数据挖掘系统, 其特征在于, 所述配置的数据挖掘条件还包括 与条件参数相对应的控制命令。 4. 如权。
6、利要求 3 所述的数据挖掘系统, 其特征在于, 该存储器还包括 : 数据 ID 存储单 元, 用于存储数据 ID 以及数据 ID 指针 ; 配置存储单元, 用于存储字节地址、 位地址和数据长度, 条件代码、 条件参数, 以及与条 件参数相对应的控制命令的控制命令指针 ; 控制命令存储单元, 用于存储与条件参数相对应的控制命令, 其中, 所述数据 ID 指针指向配置存储单元中相对应的数据类型, 所述控制命令指针指 向控制命令存储单元中与条件参数相对应的控制命令。 5. 如权利要求 1-4 中任意一项所述的数据挖掘系统, 其特征在于, 该数据挖掘系统还 包括控制中心, 该控制中心用于发送配置指令至。
7、该数据挖掘终端以及接收该数据挖掘终端 回传的挖掘所得的数据, 其中, 该数据挖掘终端根据该配置指令配置数据挖掘条件以及数 据结构和数据类型, 该数据挖掘终端还包括与配置模块相连的通信模块, 该通信模块用于 与该控制中心进行通信, 接收来自控制中心的配置指令以及将挖掘所得的数据发送至控制 中心。 权 利 要 求 书 CN 104281596 A 2 1/3 页 3 一种数据挖掘系统 技术领域 0001 本发明涉及一种数据挖掘系统。 背景技术 0002 数据挖掘(data mining)是从大量的、 不完全的、 有噪声的、 模糊的、 随机的实际应 用数据中, 提取隐含在其中的、 人们事先不知道但又。
8、是潜在有用的信息和知识的过程。 0003 数据挖掘应用的领域很广泛, 在如银行、 电信、 保险、 交通、 零售等商业领域 都有着广泛的应用。数据挖掘所能解决的典型商业问题包括 : 数据库营销 (Database Marketing)、 客 户 群 体 划 分 (Customer Segmentation &Classification)、 背 景 分 析 (ProfileAnalysis)、 交叉销售 (Crossselling) 等市场分析行为, 以及客户流失性分析 (ChurnAnalysis)、 客户信用记分 (Credit Scoring)、 欺诈发现 (Fraud Detection。
9、) 等等。 0004 数据挖掘流程通常包括 : 数据预处理 (ETL)、 数据挖掘算法实现、 结果展示三个主 要步骤。 通过ETL步骤, 可对源数据进行预处理以得到待挖掘数据 ; 通过数据挖掘算法实现 步骤, 可实现满足此务需要的数据挖掘算法得出分析结果 ; 通过结果展示步骤, 可将数据挖 掘算法的处理结果展示给用户。 0005 现有技术操作比较复杂, 成本高、 软硬件相对封闭、 对厂商依赖性强, 而且该方法 依然采用串行的数据挖掘机制, 因而其性能仍然难以较大提高。 发明内容 0006 本发明的目的是提供一种数据挖掘系统, 其可以解决现有技术中的上述缺点。 0007 本发明采用以下技术方案 。
10、: 0008 一种数据挖掘系统, 该数据挖掘系统包括数据挖掘终端, 该数据挖掘终端用于挖 掘网络中符合用户预设条件的数据, 并且该数据挖掘终端通过总线接入该网络中, 其中, 该 数据挖掘终端还包括 : 0009 配置模块, 用于配置数据挖掘条件以及数据结构和数据类型 ; 0010 识别模块, 用于识别网络的物理层、 链路层和应用协议层 ; 0011 存储器, 用于存储所配置的数据挖掘条件以及按照所配置的数据结构和数据类型 存储挖掘所得的数据, 其中, 该配置模块分别与该识别模块和存储器相连 ; 0012 程序脚本处理模块, 其获取对应于不同的数据挖掘子过程的多个程序脚本, 其中, 一个所述数据。
11、挖掘子过程包括至少一个所述程序脚本, 每个所述程序脚本具有一个对应的 脚本标识, 所述脚本标识用于标示该脚本标识对应的程序脚本归属的数据挖掘子过程 ; 获 取所述多个程序脚本对应的多个脚本标识 ; 按照所述不同的数据挖掘子过程的执行顺序, 确定所述多个脚本标识对应的所述多个程序脚本的调用顺序 ; 按照确定的所述调用顺序依 次调用所述多个程序脚本, 进行数据挖掘 ; 0013 工作流模块, 用于设置数据挖掘的工作流, 所述工作流中包括多个并行的挖掘算 法实现处理任务 ; 说 明 书 CN 104281596 A 3 2/3 页 4 0014 挖掘算法实现模块, 用于当所述工作流中的所述多个并行的。
12、挖掘算法实现处理任 务被触发时, 为其中的每个挖掘算法实现处理任务分配执行节点, 以使所述多个并行的挖 掘算法实现处理任务在分配的执行节点上并行执行, 并处理得到相应挖掘算法实现处理任 务的处理结果。 0015 所述配置的数据挖掘条件包括条件代码、 条件参数, 其中, 条件代码指明挖掘条 件, 配置的数据类型包括数据 ID、 字节地址、 位地址和数据长度, 该数据结构为链表数据结 构。 0016 所述配置的数据挖掘条件还包括与条件参数相对应的控制命令。 0017 该存储器还包括 : 数据 ID 存储单元, 用于存储数据 ID 以及数据 ID 指针 ; 0018 配置存储单元, 用于存储字节地址。
13、、 位地址和数据长度, 条件代码、 条件参数, 以及 与条件参数相对应的控制命令的控制命令指针 ; 0019 控制命令存储单元, 用于存储与条件参数相对应的控制命令, 0020 其中, 所述数据 ID 指针指向配置存储单元中相对应的数据类型, 所述控制命令指 针指向控制命令存储单元中与条件参数相对应的控制命令。 0021 该数据挖掘系统还包括控制中心, 该控制中心用于发送配置指令至该数据挖掘终 端以及接收该数据挖掘终端回传的挖掘所得的数据, 其中, 该数据挖掘终端根据该配置指 令配置数据挖掘条件以及数据结构和数据类型, 该数据挖掘终端还包括与配置模块相连的 通信模块, 该通信模块用于与该控制中。
14、心进行通信, 接收来自控制中心的配置指令以及将 挖掘所得的数据发送至控制中心。 0022 本发明的优点是 : 本发明中采用统计分析、 决策树、 粗糙集、 模糊集、 基于范例的推 理、 神经网络等数据挖掘方法对信息数据集中的海量数据进行分析、 处理、 推理、 预测, 最终 根据用户设定的条件, 实现最优方案的自动推送。 具体实施方式 0023 下面进一步阐述本发明的具体实施方式 : 0024 本发明公开一种数据挖掘系统, 该数据挖掘系统包括数据挖掘终端, 该数据挖掘 终端用于挖掘网络中符合用户预设条件的数据, 并且该数据挖掘终端通过总线接入该网络 中, 其中, 该数据挖掘终端还包括 : 配置模块。
15、, 用于配置数据挖掘条件以及数据结构和数据 类型 ; 识别模块, 用于识别网络的物理层、 链路层和应用协议层 ; 存储器, 用于存储所配置 的数据挖掘条件以及按照所配置的数据结构和数据类型存储挖掘所得的数据, 其中, 该配 置模块分别与该识别模块和存储器相连 ; 程序脚本处理模块, 其获取对应于不同的数据挖 掘子过程的多个程序脚本, 其中, 一个所述数据挖掘子过程包括至少一个所述程序脚本, 每 个所述程序脚本具有一个对应的脚本标识, 所述脚本标识用于标示该脚本标识对应的程序 脚本归属的数据挖掘子过程 ; 获取所述多个程序脚本对应的多个脚本标识 ; 按照所述不同 的数据挖掘子过程的执行顺序, 确。
16、定所述多个脚本标识对应的所述多个程序脚本的调用顺 序 ; 按照确定的所述调用顺序依次调用所述多个程序脚本, 进行数据挖掘 ; 工作流模块, 用 于设置数据挖掘的工作流, 所述工作流中包括多个并行的挖掘算法实现处理任务 ; 0025 挖掘算法实现模块, 用于当所述工作流中的所述多个并行的挖掘算法实现处理任 务被触发时, 为其中的每个挖掘算法实现处理任务分配执行节点, 以使所述多个并行的挖 说 明 书 CN 104281596 A 4 3/3 页 5 掘算法实现处理任务在分配的执行节点上并行执行, 并处理得到相应挖掘算法实现处理任 务的处理结果。 0026 所述配置的数据挖掘条件包括条件代码、 条。
17、件参数, 其中, 条件代码指明挖掘条 件, 配置的数据类型包括数据 ID、 字节地址、 位地址和数据长度, 该数据结构为链表数据结 构。 0027 所述配置的数据挖掘条件还包括与条件参数相对应的控制命令。 0028 该存储器还包括 : 数据 ID 存储单元, 用于存储数据 ID 以及数据 ID 指针 ; 0029 配置存储单元, 用于存储字节地址、 位地址和数据长度, 条件代码、 条件参数, 以及 与条件参数相对应的控制命令的控制命令指针 ; 0030 控制命令存储单元, 用于存储与条件参数相对应的控制命令, 0031 其中, 所述数据 ID 指针指向配置存储单元中相对应的数据类型, 所述控制。
18、命令指 针指向控制命令存储单元中与条件参数相对应的控制命令。 0032 该数据挖掘系统还包括控制中心, 该控制中心用于发送配置指令至该数据挖掘终 端以及接收该数据挖掘终端回传的挖掘所得的数据, 其中, 该数据挖掘终端根据该配置指 令配置数据挖掘条件以及数据结构和数据类型, 该数据挖掘终端还包括与配置模块相连的 通信模块, 该通信模块用于与该控制中心进行通信, 接收来自控制中心的配置指令以及将 挖掘所得的数据发送至控制中心。 0033 本发明数据挖掘从海量的数据中抽取出潜在的、 有价值的知识 (模型或规则) 的过 程。它涉及数据库技术、 人工智能、 数学、 统计学、 模式识别、 信息提取、 高性。
19、能计算、 并行计 算、 数据可视化等多 方面知识, 是数据库研究、 开发和应用最活跃的一个多学科交叉领域。 数据挖掘技术不仅是面向特定数据库的简单检索查询调用, 而且要对这些数据进行微观、 中观乃至宏观的统计、 分析、 综合和推理, 以指导实际问题的求解, 企图发现事件间的相互 关联, 甚至利用已有的数据对未来的活动进行预测。数据挖掘的主要任务有数据汇总、 分 类、 聚类、 关联分析、 偏差分析、 预测、 时序模式等。采用统计分析、 决策树、 粗糙集、 模糊集、 基于范例的推理、 神经网络等数据挖掘方法对信息数据集、 中的海量数据进行分析、 处理、 推理、 预测, 最终根据用户设定的条件, 实现最优方案的自动推送。 0034 以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内所作的任何修改、 等同替换和改进等, 均应包含在本发明的保护范围之内。 说 明 书 CN 104281596 A 5 。