《一种基于海量烟叶数据的自动定级系统和方法.pdf》由会员分享,可在线阅读,更多相关《一种基于海量烟叶数据的自动定级系统和方法.pdf(13页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103743486 A (43)申请公布日 2014.04.23 CN 103743486 A (21)申请号 201410001552.4 (22)申请日 2014.01.02 G01J 3/46(2006.01) G01B 11/00(2006.01) G01B 11/24(2006.01) G01N 21/84(2006.01) G06K 9/54(2006.01) G06K 9/62(2006.01) (71)申请人 上海大学 地址 200444 上海市宝山区上大路 99 号 (72)发明人 陈一民 邹一波 黄晨 张典华 张云华 李泽宇 (74)专利代理机构 。
2、上海上大专利事务所 ( 普通 合伙 ) 31205 代理人 何文欣 (54) 发明名称 一种基于海量烟叶数据的自动定级系统和方 法 (57) 摘要 本发明涉及的是一个基于海量烟叶数据的自 动定级系统和方法, 它是一种利用计算机视觉、 图 像分析、 机器学习、 大数据检索和人工智能的技术 算法对烟叶图像进行分析、 存储、 检索和自动定级 的系统。将海量数据搜索的技术引入了自动烟叶 评级系统中, 构建相应的数据库和高效的检索引 擎, 使定级的结果更准确, 随着计算机技术的发 展, 这种大数据理念将成为必然的趋势。 引入人工 智能的专家系统的算法, 运用特定领域的烟叶知 识构造专家知识库, 模拟人类。
3、专家才能解决的各 类复杂烟叶分级的问题, 达到与该领域专家具有 同等解决问题能力的计算机智能。 (51)Int.Cl. 权利要求书 3 页 说明书 8 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书3页 说明书8页 附图1页 (10)申请公布号 CN 103743486 A CN 103743486 A 1/3 页 2 1. 一种基于海量烟叶数据的自动定级系统, 其特征在于包括以下组成部分, 通过千兆 交换机 (8) 连接 : 摄像头和视频采集卡 (2) : 用于采集烟叶 (1) 图像 ; PC1 图像采集与处理器 (3) : 通过使用摄像头 (2) 。
4、和视频采集卡对真实场景进行采集、 预处理和特征提取, 构建相关烟叶的分类模型 ; PC2 存储和搜索引擎处理器 (4) : 负责系统数据查询、 存储和搜索相关烟草图像和特征 数据, 管理专家烟叶定级规则库 ; PC3 通信与系统监控处理器 (5) : 是系统的通信和控制中心, 还完成定级信息音频输出 控制、 定级信息显示控制以及硬件设备状态监控等任务 ; 音频系统 (6) : 分级信息音频输出 ; 显示系统 (7) : 分级信息视频输出 ; 烟叶图像数据库集群 (9) : 多个存储采集的烟叶图像数据库 ; 烟叶特征数据库集群 (10) : 多个存储采集的烟叶特征数据库 ; PC4 分类模型数据。
5、库存储器 (11) : 用于存储和训练各种不同烟叶的分类模型 ; PC5 专家烟叶定级规则库存储器 (12) : 用于存储国家标准和专家相关定级经验, 并且 完成烟叶定级工作。 2. 根据权利要求 1 所述的基于海量烟叶数据的自动定级系统, 其特征在于如下 : 1) 所述摄像头和视频采集卡 (2) : 采用的是CBC公司的LCH-P49A工业摄像头, 它具有背光补偿, 自动白平衡, 自动增益控 制等功能 ; 其摄像头使用1/4“CCD(3.22.4mm), 水平清晰度500线 ; 镜头的参数可调, 焦距 范围为4-9mm, 最大光圈口径比为1:1.6, 水平视角范围为51.8-23.8, 垂直。
6、视角可调范 围为 38.3 -17.8, 该摄像头有许多可调节的参数, 分辨率较高, 使用它捕捉的图像质量 很好, 是一个比较符合设计初衷的选择 ; 针对摄像头, 使用了Microview V211视频采集卡, 它是基于PCI总线, 采集PAL制、 NTSC 制标准黑白 / 彩色信号的两路高画质实时专业图像采集卡, 支持多路视频输入并实时采集 显示, 单卡支持两路 76828824 bit25 场 / 秒实时采集、 显示, 不占用 CPU 资源, 支持 一机多卡 ; 2) 所述 PC1 图像采集与处理器 (3) : PC1 是配置较高的图形图像工作站, 使用的工作站型号为 XASUN EX58。
7、0s, 它提供 32 核 计算能力超级图形工作站, 为超大规模数据计算、 图形图像处理、 复杂 3D 模型实时生成、 4K 视频实时编辑等高端应用, 提供超级计算能力、 海量图形图像处理、 超高分辨率的 3D 可视 化, 高密集数据存储与高速读写性能, 同时具有绿色环境要求的静音、 零辐射 ; 3) 所述 PC2 存储和搜索引擎处理器 (4)、 PC4 分类模型数据库存储器 (11)、 PC5 专家烟 叶定级规则库存储器 (12) : 采用企业数据库服务器 -IBM xSeries 255 8685-A1D, 它是 IBM 公司推出的一款性 能超强的服务器, 适合大中型企业作为数据库服务器使用。
8、 ; 该服务器采用塔式设计, 支持 4 路Intel Xeon MP处理器, 支持24GB DDR RECC内存的扩展 ; 集成Ultra 160 SCSI控制器, 最大可将容量扩充到 1.76TB ; 集成双千兆网卡, 采用冗余双热插拔电源供电 ; 4) 所述 PC3 通信与系统监控处理器 (5) : 权 利 要 求 书 CN 103743486 A 2 2/3 页 3 PC3 是一台高速计算机 ; 5) 所述显示系统 (7) : 显示系统是一台 LG 42LN5180 42 英寸 LED 液晶电视, 分辨率为 1920*1080。 3. 一种基于海量烟叶数据的自动定级方法, 采用根据权利要。
9、求 1 所述的基于海量烟叶 数据的自动定级系统进行操作, 其特征在于操作步骤如下 : 1) : 图像采集 : 使用摄像头和视频采集卡 (2), 采集待检测区域的烟叶图像 ; 2) : 特征获取 : 对烟叶图像进行分析和预处理, 保留视觉关心的图像部分, 去除噪声, 然后提取烟叶的相关细节特征, 保证数据的稀疏性和相关性 ; 3) : 模型构建 : 从烟叶特征数据库中, 获取不同种类的烟叶特征数据, 进行模型的构 建, 且为之后的决策提供模型 ; 4) : 烟叶定级 : 对烟叶图像和特征数据, 进行分析, 通过专家烟叶定级规则库来获得专 家知识, 以及获取相应的烟叶模型, 再通过推理及来进行具体。
10、的推演, 以得出相应烟叶的级 别 ; 5) : 数据存储 : 将烟叶图像和特征数据, 分别存储于相应的烟叶图像数据库和烟叶特 征数据库存储器中 ; 6) : 定级结果输出 : 将本次烟叶分级的结果通过音频输出到喇叭, 且输出到液晶显示 屏, 提供给用户获取结果。 4. 根据权利要求 3 所述的一种基于海量烟叶数据的自动定级方法, 其特征在于所述步 骤 2) 具体包括以下步骤 : 2)-1 : 图像预处理 : 为了消除图像噪声, 且保证边界不模糊, 根据局部区域内图像状态 的不同, 对其相邻的像素选择, 进行高斯滤波处理, 使用灰度直方图均衡化方法进行图像模 型化处理, 最后使用全局阈值的算法完。
11、成图像的二值化 ; 2)-2 : 特征提取 : 对原始图像获取烟叶的色调均值、 饱和度均值和亮度均值, 同时从二 值化后的图像中获取相关形状特征 - 周长、 面积、 原型度系数、 长度、 宽度、 长宽比, 用灰度 共生矩阵获得烟叶的纹理特征 - 能量、 角二阶矩、 对比度、 相关性、 一致性、 灰度平均值、 灰 度均方差。 5. 根据权利要求 3 所述的一种基于海量烟叶数据的自动定级方法, 其特征在于所述步 骤 3) 具体包括以下步骤 : 3)-1 : 特征降维 : 使用主成分分析的算法, 对烟叶的相关特征从高维数据投影到低维 空间, 降低了数据的复杂性, 保证了数据的有效性, 提高了算法的速。
12、率 ; 3)-2 : 模型选择 : 根据现有的特征的数量和分布, 智能选择模型的假设空间, 同时确定 模型学习的策略和算法, 模型假设空间为支持向量机 (SVM) 或神经网络或 K 近邻模型或决 策树 ; 3)-3 : 模型训练 : 通过烟叶训练数据和验证数据, 根据学习策略, 从假设空间中选择最 优模型, 用数值计算的方法求解最优模型的参数, 从而保证误差最小化。 6. 根据权利要求 3 所述的一种基于海量烟叶数据的自动定级方法, 其特征在于所述步 骤 4) 具体包括以下步骤 : 4)-1 : 烟叶知识库构建 : 归纳烟叶专家的领域知识和国家标准知识, 预处理和系统化, 使其可进行决策 ; 。
13、权 利 要 求 书 CN 103743486 A 3 3/3 页 4 4)-2 : 推理机制管理 : 使用 4)-1 构建的烟叶知识库来获得相应的专家知识, 再通过推 理及来进行具体的推演, 以得出烟叶分级决策建议。 7. 根据权利要求 3 所述的一种基于海量烟叶数据的自动定级方法, 其特征在于所述步 骤 5) 具体包括以下步骤 : 5)-1 : 数据存储 : 使用网络附加存储, 即采用网络 (TCP IP、 ATM、 FDDI) 技术, 通过网 络交换机连接存储系统和服务器主机, 建立专用于数据存储的存储私网, 可由所有的网络 用户共享, 很好的支持多用户的并发存储处理, 从而全面改进了以前。
14、低效的存储方式 ; 5)-2 : 数据检索 : 在海量烟叶的特征描述的基础上, 使用分布式相似度计算方法, 该方 法基于 Map/Reduce 的计算模型, 即首先对每一块数据进行独立而并行的处理, 然后这些独 立的处理块的结果会被重新组合成不同的排序的集合, 这些集合最后由统一的作业模块进 行处理, 最后完成了实时烟叶信息的检索。 权 利 要 求 书 CN 103743486 A 4 1/8 页 5 一种基于海量烟叶数据的自动定级系统和方法 技术领域 0001 本发明涉及的是一种基于海量烟叶数据的自动定级系统和方法, 具体的说是一种 利用计算机视觉、 图像分析、 机器学习、 大数据检索和人工。
15、智能的技术算法对烟叶图像进行 分析、 存储、 检索和自动定级的系统及相关方法。 背景技术 0002 长期以来, 不论是国内还是国外, 烟叶质量的检测和分级都是参照各地区颁布的 烟叶分级标准和标准的烟叶样本, 依靠人的视觉和触觉感官来进行判断分级的。 因此, 每到 收购烟叶之前, 全国各烟区都要成立学习班, 收集大量的、 标准的烟叶样本作为培训材料, 用来培训收购站的烟叶分级人员, 这样的分级方式需要消耗和费损大量的人力、 物力和财 力, 而目效率也很低下。更重要的方面是, 人类的感官判断带有强烈的主观性和模糊性, 影 响着对烟叶分级的细致性和变化性的判断, 使检验和分级的结果存在着较大的差异。。
16、随着 经济和社会的发展, 以及卷烟制品质量的发展, 我国己经开始全面推广 42 级新的烟叶分级 标准 (GB2635-92), 以此来逐步提高对烟叶质量的要求。尽管新的分级标准越来越细致, 但 是对烟叶等级的描述都是采用定性的标准, 并没有量化的标准来供参考, 这种主观随意性 强的感官判断和模糊主观评定的人工分级方式反而越来越难以满足烟草行业对烟叶质量 的要求。 因此, 研究和实现计算机系统对烟叶自动分级, 开发实用化系统在这样的大环境下 己经是势在必行的了。 0003 烤烟烟叶分级方法是目前评判烟叶质量的主要手段, 其分级判断的依据主要是烟 叶外观特征, 如颜色、 长度、 厚度、 油分、 成。
17、熟度, 残损等。作为计算机领域的一个重要分支, 计算机视觉的研究、 应用和发展正越来越得到重视。 计算机视觉能模仿人眼接受各类信息, 同时具有比人眼分辨率高、 客观和定量等优点。故应用计算机视觉来识别烟叶的外观特征 并依据烟叶的分级标准进行分级, 从而替代繁杂的体力劳动和提供客观评断烟叶等级就成 为目前烟叶分级研究中的主要趋势。因此, 将计算机技术应用于烤烟烟叶的分级具有重大 的意义。 0004 与一般的农产品相比, 烟叶的外观质量检测要复杂的多, 用仪器进行烟叶分级的 难度较大, 故有关用仪器对烟叶进行外观质量检测及分级的研究不多。计算机视觉及神经 网络技术在对农产品的鉴定与质量分选开始于2。
18、0世纪70年代末期, 从20世纪80年代后期 逐步走向成熟。 而数字图像处理技术正式应用于烟草分级与识别还是开始于1984年。 美国 的 Thomas C.E 在其论文 Techniques of Image Analysis Applied to the Measurement of Tobacco and Related Products 中提出将数字图像处理技术运用于烟叶的外观特征 的识别。此后, 数字图像处理技术在烟草领域的研究有了一定的进展 . 津巴布韦大学的 MacCommc J. K. M 设计了一个用于烟叶等级自动识别的图像处理单元原型。 CHO H.K 和 PAEK K.H 。
19、研究了如何利用机器视觉技术提取白肋烟的形状颜色等表面特征以对其进行等 级判定George Tattersfield等提取烟叶的形状、 颜色等特征, 对津巴布韦烤烟的生长部位 和颜色进行识别。 说 明 书 CN 103743486 A 5 2/8 页 6 0005 在国内, 基于图像的烟叶分级方面, 郑州大学的申金媛利用光谱和图像特征进行 烟叶分级的方法, 使用了烟叶图像信息和光谱信息的特征进行分组、 分色和分级 ; 华中农业 大学的马文杰博士开辟了一条新的研究路径, 与一般研究烟叶的反射图像特征不同, 他提 出从烤烟烟叶投射图像的特征出发, 来实现烟叶特征参数的提取 ; 这些方法但只是使用了 。
20、烟叶的图像信息, 而并没有在大数据的范围中实践和分析, 同时并没有使用专家学习系统 的思想来进行建模分析和学习。 0006 在系统构建方面, 1998 年以来, 北京工商大学的韩力群等开展了烤烟烟叶质量特 征提取的软硬件系统研制, 建立了烤烟烟叶的标准数据库管理系统, 并将人工神经网络技 术用于烟叶成熟度的自动分级, 使用了拟脑智能方法。河南农业大学的潘建斌把专家系统 技术引入了烟叶烘烤的过程。这些方法仅仅引入了人工智能的算法, 或者仅部分使用了专 家系统的技术在烘烤控制过程, 并没有利用海量烟叶数据进行模式分析。 0007 从上述的研究进展和研究成果看, 我们可以发现国内外己经有很多的学者投。
21、入到 烟叶质量的检测和分级技术领域的研究, 其理论成果是丰硕的。 但是到日前为止, 对提取烟 叶特征参数以及实现烟叶自动分级的系统软件的研究都是处于实验和探讨的阶段, 还没有 能全面检测和提取烟叶特征并能实现最终自动化分级的设备和技术发明, 并不能满足市场 对这一技术领域的实际要求。 同时, 大部分工作还是基于少量数据进行测试, 没有使用大数 据的思想和技术进行烟叶图像数据挖掘和评级。 0008 针对于次, 本发明将计算机视觉和机器学习的算法引入烟叶定级系统中, 对烟叶 图像进行预处理、 特征提取和数学建模 ; 通过对烟草图像的集中存储, 构建大规模烟叶图像 和特征数据库 ; 面对海量的烟叶特。
22、征数据, 设计出有效的算法以度量特征和图像之间的内 容相似度, 并且能够通过有效的方法和框架来快速的处理海量的数据, 能够快速自动获得 相应的烟叶数据 ; 引入专家系统算法, 运用烟叶领域的专门知识和经验, 建立庞大的专家烟 叶定级规则库, 通过推理来模拟人类专家, 达到与专家具有同等解决问题能力, 从而对烟叶 进行评级决策 ; 在决策的同时, 系统并有自学习功能, 能自动完善烟叶评级所需的知识。 0009 上海大学多媒体技术研发中心于 2013 年上半年开始与川渝中烟工业公司合作, 对基于海量烟叶数据的自动定级系统和方法相关技术展开深入研究 。 0010 目前烟叶分级系统研究大多处于试验阶段。
23、, 且大多致力于特征分析方面。根据调 研, 到目前为止, 把烟叶图像特征提取、 分类模型建立、 大数据系统搭建和专家系统等方面 有机地集成在一起, 本发明尚属首例。 发明内容 0011 鉴于以上所述现有技术存在的问题和不足, 本发明的目的在于提供一个基于海量 烟叶数据的自动定级系统和方法, 对于制定科学定量的烟叶分级标准、 培训烟叶分级人员、 裁决烟叶质量纠纷、 以及指导实际的烟叶分级工作和卷烟自动生产线上的应用开发, 都具 有重要的实用价值。 0012 为达到上述目的, 本发明采用下述技术构思 : 根据烟叶自动分级的需求, 引入海量数据检索技术, 综合利用计算机视觉、 数字图像处 理以及人工。
24、智能融合技术, 完成烟叶自动定级。系统运行前, 首先根据国家烟叶定级标准, 构造专家规则库。系统运行初期, 先进行烟叶训练图像的采集, 完成颜色、 形状和纹理特征 说 明 书 CN 103743486 A 6 3/8 页 7 的提取, 使用机器学习的算法构建初始化分类模型。 系统运行时, 用户将待检测的烟叶放入 图像采集区域, 图像采集系统实时获取烟草图像, 并存入烟叶图像库。 机器视觉系统获取烟 叶图像的相关特征, 存入烟叶特征库。 通过海量数据智能搜索系统, 获取与该图像相似的图 像特征集合。 专家系统根据规则库信息、 图像特征集合和分类模型, 通过推理给出相应的评 级决策。评级决策通过显。
25、示屏幕和语音系统, 提示用户评级结果。每次评级结束后, 学习系 统会自动完善专家烟叶定级规则库, 更新分类模型的相应参数, 优化分类模型。 0013 本发明采用以下技术方案实现 : 一种基于海量烟叶数据的自动定级系统, 如图 1 所示, 其硬件系统具体包括以下组成 部分 : 1) : 待分级的烟叶 : 放在代采集区的烟叶 ; 2) : 摄像头 : 用于采集烟叶图像 ; 3) : PC1图像采集与处理处理器 : 通过使用(2)摄像头和视频采集卡对真实场景进行采 集、 预处理和特征提取, 构建相关烟叶的分类模型 ; 4) : PC2 存储和搜索引擎处理器 : 负责系统数据查询、 存储和搜索相关烟草。
26、图像和特征 数据, 管理专家烟叶定级规则库 ; 5) : PC3 通信与系统监控处理器 : 是系统的通信和控制中心, 还完成定级信息音频输出 控制、 定级信息显示控制以及硬件设备状态监控等任务 ; 6) : 音频系统 : 分级信息音频输出 ; 7) : 显示系统 : 分级信息视频输出 ; 8) : 千兆交换机 ; 9) : 烟叶图像数据库集群 : 多个存储采集的烟叶图像数据库 ; 10) : 烟叶特征数据库集群 : 多个存储采集的烟叶特征数据库 ; 11) : PC4 分类模型数据库存储器 : 用于存储和训练各种不同烟叶的分类模型 ; 12) : PC5 专家烟叶定级规则库存储器 : 用于存储。
27、国家标准和专家相关定级经验, 并且 完成烟叶定级工作 ; 一种基于海量烟叶数据的自动定级方法, 如图 2 所示, 其具体操作步骤如下 : 1) : 使用摄像头, 采集待检测区域的烟叶图像 ; 2) : 对烟叶图像进行分析和预处理, 保留视觉关心的图像部分, 去除噪声, 然后提取烟 叶的相关细节特征, 保证数据的稀疏性和相关性 ; 3) : 从烟叶特征数据库中, 获取不同种类的烟叶特征数据, 进行模型的构建, 且为之后 的决策提供模型 ; 4) : 对烟叶图像和特征数据, 进行分析, 通过专家烟叶定级规则库来获得专家知识, 以 及获取相应的烟叶模型, 再通过推理及来进行具体的推演, 以得出相应烟。
28、叶的级别 ; 5) : 将烟叶图像和特征数据, 分别存储于相应的烟叶图像数据库和烟叶特征数据库存 储器中 ; 6) : 将本次烟叶分级的结果通过音频输出到喇叭, 且输出到液晶显示屏, 提供给用户获 取结果。 0014 更为详细地, 所述操作步骤 2) 具体包括以下步骤 : 2)-1 : 图像预处理 : 为了消除图像噪声, 且保证边界不模糊, 根据局部区域内图像状态 说 明 书 CN 103743486 A 7 4/8 页 8 的不同, 对其相邻的像素选择, 进行高斯滤波处理, 使用灰度直方图均衡化方法进行图像模 型化处理, 最后使用全局阈值的算法完成图像的二值化 ; 2)-2 : 特征提取 :。
29、 对原始图像获取烟叶的色调均值、 饱和度均值和亮度均值, 同时从二 值化后的图像中获取相关形状特征 - 周长、 面积、 原型度系数、 长度、 宽度、 长宽比, 用灰度 共生矩阵获得烟叶的纹理特征 - 能量、 角二阶矩、 对比度、 相关性、 一致性、 灰度平均值、 灰 度均方差。 0015 更为详细地, 所述操作步骤 3) 具体包括以下步骤 : 3)-1 : 特征降维 : 使用主成分分析的算法, 对烟叶的相关特征从高维数据投影到低维 空间, 降低了数据的复杂性, 保证了数据的有效性, 提高了算法的速率 ; 3)-2 : 模型选择 : 根据现有的特征的数量和分布, 智能选择模型的假设空间, 同时确。
30、定 模型学习的策略和算法, 模型假设空间为支持向量机 (SVM) 或神经网络或 K 近邻模型或决 策树 ; 3)-3 : 模型训练 : 通过烟叶训练数据和验证数据, 根据学习策略, 从假设空间中选择最 优模型, 用数值计算的方法求解最优模型的参数, 从而保证误差最小化。 0016 更为详细地, 所述操作步骤 4) 具体包括以下步骤 : 4)-1 : 烟叶知识库构建 : 归纳烟叶专家的领域知识和国家标准知识, 预处理和系统化, 使其可以进行决策 ; 4)-2 : 推理机制管理 : 使用知识库来获得专家知识, 再通过推理及来进行具体的推演, 以得出烟叶分级决策建议。 0017 更为详细地, 所述操。
31、作步骤 5) 具体包括以下步骤 : 5)-1 : 数据存储 : 使用网络附加存储, 即采用网络 (TCP IP、 ATM、 FDDI) 技术, 通过网 络交换机连接存储系统和服务器主机, 建立专用于数据存储的存储私网, 可由所有的网络 用户共享, 很好的支持多用户的并发存储处理, 从而全面改进了以前低效的存储方式 ; 5)-2 : 数据检索 : 在海量烟叶的特征描述的基础上, 使用分布式相似度计算方法, 该方 法基于 Map/Reduce 的计算模型, 即首先对每一块数据进行独立而并行的处理, 然后这些独 立的处理块的结果会被重新组合成不同的排序的集合, 这些集合最后由统一的作业模块进 行处理。
32、, 最后完成了实时烟叶信息的检索。 0018 本发明与现有技术相比较, 具有如下显而易见的突出实质性特点和显著优点 : 首 先, 本发明实际上提出了一种全新的设计开发理念将海量数据搜索的技术引入了自动 烟叶评级系统中, 构建相应的数据库和高效的检索引擎, 使定级的结果更准确, 随着计算机 技术的发展, 这种大数据理念将成为必然的趋势。 其次, 本发明引入人工智能的专家系统的 算法, 运用特定领域的烟叶知识构造专家知识库, 模拟人类专家才能解决的各类复杂烟叶 分级的问题, 达到与该领域专家具有同等解决问题能力的计算机智能。 附图说明 0019 图 1 为本发明一种基于海量烟叶数据的自动定级系统和。
33、方法的硬件结构组成概 念图。 0020 图 2 为本发明一种基于海量烟叶数据的自动定级系统和方法的操作流程图。 说 明 书 CN 103743486 A 8 5/8 页 9 具体实施方式 0021 本发明的优选实施例结合附图详述如下 : 实施例一 : 参见图 1, 本基于海量烟叶数据的自动定级系统, 其特征在于包括以下组成部分, 通过 千兆交换机 (8) 连接 : 摄像头和视频采集卡 (2) : 用于采集烟叶 (1) 图像 ; PC1 图像采集与处理器 (3) : 通过使用摄像头 (2) 和视频采集卡对真实场景进行采集、 预处理和特征提取, 构建相关烟叶的分类模型 ; PC2 存储和搜索引擎处。
34、理器 (4) : 负责系统数据查询、 存储和搜索相关烟草图像和特征 数据, 管理专家烟叶定级规则库 ; PC3 通信与系统监控处理器 (5) : 是系统的通信和控制中心, 还完成定级信息音频输出 控制、 定级信息显示控制以及硬件设备状态监控等任务 ; 音频系统 (6) : 分级信息音频输出 ; 显示系统 (7) : 分级信息视频输出 ; 烟叶图像数据库集群 (9) : 多个存储采集的烟叶图像数据库 ; 烟叶特征数据库集群 (10) : 多个存储采集的烟叶特征数据库 ; PC4 分类模型数据库存储器 (11) : 用于存储和训练各种不同烟叶的分类模型 ; PC5 专家烟叶定级规则库存储器 (12。
35、) : 用于存储国家标准和专家相关定级经验, 并且 完成烟叶定级工作。 0022 实施例二 : 本实施例与实施例一基本相同, 特别之处如下 : 1) 所述摄像头和视频采集卡 (2) : 采用的是 CBC 公司的 LCH-P49A 工业摄像头, 它具有 背光补偿, 自动白平衡, 自动增益控制等功能。其摄像头使用 1/4“CCD(3.22.4mm), 水平 清晰度 500 线。镜头的参数可调, 焦距范围为 4-9mm, 最大光圈口径比为 1:1.6, 水平视角范 围为 51.8 -23.8, 垂直视角可调范围为 38.3 -17.8, 该摄像头有许多可调节的参 数, 分辨率较高, 使用它捕捉的图像。
36、质量很好, 是一个比较符合设计初衷的选择 ; 针对摄像 头, 使用了 Microview V211 视频采集卡, 它是基于 PCI 总线, 采集 PAL 制、 NTSC 制标准黑白 / 彩色信号的两路高画质实时专业图像采集卡, 支持多路视频输入并实时采集显示, 单卡支 持两路 76828824 bit25 场 / 秒实时采集、 显示, 不占用 CPU 资源, 支持一机多卡 ; 2) 所述 PC1 图像采集与处理器 (3) : PC1 是配置较高的图形图像工作站, 使用的工作站 型号为 XASUN EX580s, 它提供 32 核计算能力超级图形工作站, 为超大规模数据计算、 图形 图像处理、 。
37、复杂 3D 模型实时生成、 4K 视频实时编辑等高端应用, 提供超级计算能力、 海量图 形图像处理、 超高分辨率的 3D 可视化, 高密集数据存储与高速读写性能, 同时具有绿色环 境要求的静音、 零辐射 ; 3) 所述 PC2 存储和搜索引擎处理器 (4)、 PC4 分类模型数据库存储器 (11)、 PC5 专家烟 叶定级规则库存储器 (12) : 采用企业数据库服务器 -IBM xSeries 255 8685-A1D, 它是 IBM 公司推出的一款性能超强的服务器, 适合大中型企业作为数据库服务器使用。该服务 器采用塔式设计, 支持 4 路 Intel Xeon MP 处理器, 支持 24。
38、GB DDR RECC 内存的扩展 ; 集成 Ultra 160 SCSI 控制器, 最大可将容量扩充到 1.76TB ; 集成双千兆网卡, 采用冗余双热插 说 明 书 CN 103743486 A 9 6/8 页 10 拔电源供电 ; 4) 所述 PC3 通信与系统监控处理器 (5) : PC3 是一台高速计算机 ; 5) 所述显示系统 (7) : 显示系统是一台 LG 42LN5180 42 英寸 LED 液晶电视, 分辨率为 1920*1080。 0023 实施例三 : 参见图 2, 本基于海量烟叶数据的自动定级方法, 采用上述系统进行操作, 其特征在于 如下 : 1) : 图像采集 :。
39、 使用摄像头和视频采集卡 (2), 采集待检测区域的烟叶图像 ; 2) : 特征获取 : 对烟叶图像进行分析和预处理, 保留视觉关心的图像部分, 去除噪声, 然后提取烟叶的相关细节特征, 保证数据的稀疏性和相关性 ; 3) : 模型构建 : 从烟叶特征数据库中, 获取不同种类的烟叶特征数据, 进行模型的构 建, 且为之后的决策提供模型 ; 4) : 烟叶定级 : 对烟叶图像和特征数据, 进行分析, 通过专家烟叶定级规则库来获得专 家知识, 以及获取相应的烟叶模型, 再通过推理及来进行具体的推演, 以得出相应烟叶的级 别 ; 5) : 数据存储 : 将烟叶图像和特征数据, 分别存储于相应的烟叶图。
40、像数据库和烟叶特 征数据库存储器中 ; 6) : 定级结果输出 : 将本次烟叶分级的结果通过音频输出到喇叭, 且输出到液晶显示 屏, 提供给用户获取结果。 0024 实施例四 : 本实施例与实施例三基本相同, 特别之处如下 : 所述步骤 2) 具体包括以下步骤 : 2)-1 : 图像预处理 : 为了消除图像噪声, 且保证边界不模糊, 根据局部区域内图像状态 的不同, 对其相邻的像素选择, 进行高斯滤波处理, 使用灰度直方图均衡化方法进行图像模 型化处理, 最后使用全局阈值的算法完成图像的二值化 ; 2)-2 : 特征提取 : 对原始图像获取烟叶的色调均值、 饱和度均值和亮度均值, 同时从二 值。
41、化后的图像中获取相关形状特征 - 周长、 面积、 原型度系数、 长度、 宽度、 长宽比, 用灰度 共生矩阵获得烟叶的纹理特征 - 能量、 角二阶矩、 对比度、 相关性、 一致性、 灰度平均值、 灰 度均方差。 0025 所述步骤 3) 具体包括以下步骤 : 3)-1 : 特征降维 : 使用主成分分析的算法, 对烟叶的相关特征从高维数据投影到低维 空间, 降低了数据的复杂性, 保证了数据的有效性, 提高了算法的速率 ; 3)-2 : 模型选择 : 根据现有的特征的数量和分布, 智能选择模型的假设空间, 同时确定 模型学习的策略和算法, 模型假设空间为支持向量机 (SVM) 或神经网络或 K 近邻。
42、模型或决 策树 ; 3)-3 : 模型训练 : 通过烟叶训练数据和验证数据, 根据学习策略, 从假设空间中选择最 优模型, 用数值计算的方法求解最优模型的参数, 从而保证误差最小化。 0026 所述步骤 4) 具体包括以下步骤 : 4)-1 : 烟叶知识库构建 : 归纳烟叶专家的领域知识和国家标准知识, 预处理和系统化, 说 明 书 CN 103743486 A 10 7/8 页 11 使其可进行决策 ; 4)-2 : 推理机制管理 : 使用 4)-1 构建的烟叶知识库来获得相应的专家知识, 再通过推 理及来进行具体的推演, 以得出烟叶分级决策建议。 0027 所述步骤 5) 具体包括以下步骤。
43、 : 5)-1 : 数据存储 : 使用网络附加存储, 即采用网络 (TCP IP、 ATM、 FDDI) 技术, 通过网 络交换机连接存储系统和服务器主机, 建立专用于数据存储的存储私网, 可由所有的网络 用户共享, 很好的支持多用户的并发存储处理, 从而全面改进了以前低效的存储方式 ; 5)-2 : 数据检索 : 在海量烟叶的特征描述的基础上, 使用分布式相似度计算方法, 该方 法基于 Map/Reduce 的计算模型, 即首先对每一块数据进行独立而并行的处理, 然后这些独 立的处理块的结果会被重新组合成不同的排序的集合, 这些集合最后由统一的作业模块进 行处理, 最后完成了实时烟叶信息的检。
44、索。 0028 实施例五 : 如图 1 所示, 基于海量烟叶数据的自动定级系统, 具体包括以下组成部分 : 首先使用摄像头和视频采集卡在采集区域对烟叶进行采集。将摄像头装置在一 个固定支架上, 摄像头镜头与烟叶的距离为 0.5 米, 烟叶需要平整的置放在该区域内, 这样能够保证获取满意的图像, 为之后的工作提供基础。我们采用的是 CBC 公司的 LCH-P49A 工业摄像头, 它具有背光补偿, 自动白平衡, 自动增益控制等功能。其摄像头使用 1/4“CCD(3.22.4mm), 水平清晰度 500 线。镜头的参数可调, 焦距范围为 4-9mm, 最大光圈 口径比为 1:1.6, 水平视角范围为。
45、 51.8 -23.8, 垂直视角可调范围为 38.3 -17.8。 该摄像头有许多可调节的参数, 分辨率较高, 使用它捕捉的图像质量很好, 是一个比较符合 设计初衷的选择。针对摄像头, 我们使用了 Microview V211 视频采集卡。它是基于 PCI 总 线, 采集 PAL 制、 NTSC 制标准黑白 / 彩色信号的两路高画质实时专业图像采集卡, 支持多路 视频输入并实时采集显示, 单卡支持两路76828824 bit25场/秒实时采集、 显示, 不 占用 CPU 资源, 支持一机多卡。 0029 因为要处理大量的图像处理和算法分析的工作, PC1 是配置较高的图形图像工作 站。我们使。
46、用的工作站型号为 XASUN EX580s, 它提供 32 核计算能力超级图形工作站, 为超 大规模数据计算、 图形图像处理、 复杂 3D 模型实时生成、 4K 视频实时编辑等高端应用, 提供 超级计算能力、 海量图形图像处理、 超高分辨率的 3D 可视化, 高密集数据存储与高速读写 性能, 同时具有绿色环境要求的静音、 零辐射。 PC1对烟叶图像进行分析和预处理, 保留视觉 关心的图像部分, 去除噪声, 然后提取烟叶的相关细节特征, 保证数据的稀疏性和相关性 ; 从烟叶特征数据库中, 获取不同种类的烟叶特征数据, 进行模型的构建, 且为之后的决策提 供模型。输出图像和特征发送至 PC2 存储。
47、和搜索引擎和 PC5 专家烟叶定级规则库 ; PC2 作为数据存储和搜索服务器, 我们使用了企业数据库服务器 -IBM xSeries 255 8685-A1D, 它是 IBM 公司推出的一款性能超强的服务器, 适合大中型企业作为数据库服务 器使用。该服务器采用塔式设计, 支持 4 路 Intel Xeon MP 处理器, 支持 24GB DDR RECC 内 存的扩展 ; 集成Ultra 160 SCSI控制器, 最大可将容量扩充到1.76TB ; 集成双千兆网卡, 采 用冗余双热插拔电源供电。PC2 存储和搜索引擎将 PC1 传来的烟叶图像存储到相应的烟叶 图像数据库集群中, 将 PC1 。
48、传来的烟叶特征信息存储到相应的烟叶特征数据库集群中 ; PC4 也是一台企业级数据库服务器, 它所存储的分类模型数据库是通过烟叶图像数据 说 明 书 CN 103743486 A 11 8/8 页 12 库和特征数据库中的数据集, 训练和修正相应不同等级的烟叶模型。 0030 PC4 模型构造的过程 : 通过统计特征点的特征向量集合, 在每一维上都 近似符合高斯分布。假设各维特征之间相互独立, 目标图像上的 N 个特征点的特征 向量集合可看作近似符合下式表示的高斯混合分布。d 为特征向量的维数。 将中 的 特 征 向 量 作 为 核 密 度 估 计 的 采 样 点, 通 过 下 式 期 望 值。
49、 最 大 化 可 估 计 参 数 : , 计 算 出 参 数 后, 可 以 通 过 下 式 的 来 判 断 烟 叶 级 别 PC5同样是一台企业级数据库服务器, PC5专家烟叶定级规则库通过分析PC1传输的图 像, 通过本身的专家库, 以及 PC4 分类模型数据库中的相应的模型, 通过 PC2 搜索获取相似 烟叶图像和特征, 推理获得烟叶的等级, 并将等级传输至 PC3 ; 所有计算机通过高速以太网连接, 在 PC3 的管理下进行相互通讯, PC3 也是特殊配置的 高速计算机, 它是系统的通信和控制中心, 还完成定级信息音频输出控制、 定级信息显示、 系统初始化、 同步时序控制以及设备状态监控等任务。 0031 显示系统是一台 LG 42LN5180 42 英寸 LED 液晶电视, 分辨率为 1920*1080。 说 明 书 CN 103743486 A 12 1/1 页 13 图 1 图 2 说 明 书 附 图 CN 103743486 A 13 。