ImageVerifierCode 换一换
格式:PDF , 页数:17 ,大小:561.76KB ,
资源ID:10415462      下载积分:30 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zhuanlichaxun.net/d-10415462.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(图像类别识别方法、装置、计算机设备及介质.pdf)为本站会员(王**)主动上传,专利查询网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知专利查询网(发送邮件至2870692013@qq.com或直接QQ联系客服),我们立即给予删除!

图像类别识别方法、装置、计算机设备及介质.pdf

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010357378.2 (22)申请日 2020.04.29 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平安金融中 心23楼 (72)发明人 石磊刘莉红刘玉宇 (74)专利代理机构 深圳市赛恩倍吉知识产权代 理有限公司 44334 代理人 刘丽华孙芬 (51)Int.Cl. G06K 9/62(2006.01) G06K 9/34(2006.01) G06K 9/46(2006.01) G06N 3

2、/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像类别识别方法、 装置、 计算机设备及介 质 (57)摘要 本发明涉及人工智能, 提供一种图像类别识 别方法、 装置、 计算机设备及存储介质, 所述方法 包括: 构建神经网络训练框架并初始化每一个类 别对应的预测阈值序列; 针对每一个类别, 遍历 预测阈值序列中的每一个预测阈值; 针对每一个 预测阈值, 输入训练样本图像集到神经网络训练 框架中进行训练得到图像类别识别模型; 输入测 试样本图像集到图像类别识别模型中进行测试 得到测试通过率; 根据测试通过率更新所述图像 类别识别模型; 利用更新后的图像类别识别模

3、型 识别目标图像的类别并输出目标图像的类别识 别结果。 本发明能够针对不同的类别动态的调整 预测阈值, 提高了图像类别识别准确率。 此外, 本 发明还涉及区块链技术, 所述类别识别结果存储 于区块链节点中。 权利要求书2页 说明书12页 附图2页 CN 111695594 A 2020.09.22 CN 111695594 A 1.一种图像类别识别方法, 其特征在于, 所述图像类别识别方法包括: 构建神经网络训练框架并初始化每一个类别对应的预测阈值序列; 针对每一个类别, 遍历所述预测阈值序列中的每一个预测阈值; 针对每一个预测阈值, 输入训练样本图像集到所述神经网络训练框架中进行训练得到 图

4、像类别识别模型; 输入测试样本图像集到所述图像类别识别模型中进行测试得到测试通过率; 根据所述测试通过率更新所述图像类别识别模型; 利用更新后的图像类别识别模型识别目标图像的类别并输出所述目标图像的类别识 别结果。 2.如权利要求1所述的图像类别识别方法, 其特征在于, 所述构建神经网络训练框架包 括: 确定原始CNN网络为训练框架的原型, 其中, 所述原始CNN网络包括第一连接层; 连接所述第一连接层的输出与多个sigmoid激活函数层, 其中, 所述sigmoid激活函数 层的个数与所述类别的个数相同; 连接每一个sigmoid激活函数层与一个损失函数层; 将所有损失函数层的输出连接到第二

5、连接层。 3.如权利要求1所述的图像类别识别方法, 其特征在于, 所述输入测试样本图像集到所 述图像类别识别模型中进行测试得到测试通过率包括: 输入每一个测试样本图像至所述图像类别识别模型中; 获取每个sigmoid激活函数层输出的二分类概率; 合并所有的二分类概率为一个概率向量, 所述概率向量的长度为所述类别的个数; 根据所述概率向量计算测试通过率。 4.如权利要求3所述的图像类别识别方法, 其特征在于, 所述根据所述概率向量计算测 试通过率包括: 判断所述概率向量中的每一个概率分值与真实类别向量中对应的概率分值是否相同; 当所述概率向量中的概率分值与真实类别向量中对应的概率分值相同时, 确

6、定所述分 值正确, 并计算正确的概率分值的个数及所述个数占所述概率向量的概率分值的总个数的 比例; 确定所述比例为所述测试通过率。 5.如权利要求1至4中任意一项所述的图像类别识别方法, 其特征在于, 所述根据所述 测试通过率更新所述图像类别识别模型包括: 获取每一个类别下的每一个预测阈值对应的测试通过率; 针对每一个类别, 确定最高的测试通过率对应的预测阈值为目标阈值; 根据每一个类别对应的目标阈值更新所述图像类别识别模型。 6.如权利要求1所述的图像类别识别方法, 其特征在于, 所述图像类别识别方法还包 括: 采集原始样本集, 所述原始样本集包括多张原始样本图像; 计算每张原始样本图像的图

7、像质量; 将图像质量小于预设质量阈值的原始样本图像进行剔除得到多张剩余样本图像; 权利要求书 1/2 页 2 CN 111695594 A 2 采用目标检测算法检测每张剩余样本图像中的目标区域; 分割出每张剩余样本图像中的所述目标区域得到多张目标图像; 对所述多张目标图像进行归一化处理; 将归一化处理后的目标图像划分为训练样本图像集和测试样本图像集。 7.如权利要求1所述的图像类别识别方法, 其特征在于, 所述利用更新后的图像类别识 别模型识别目标图像的类别并输出所述目标图像的类别识别结果包括: 输入所述目标图像至更新后的图像类别识别模型中进行识别; 接收所述更新后的图像类别识别模型输出的识别

8、向量; 确定所述识别向量中元素值大于对应的目标阈值的目标元素值; 根据所述目标元素值输出所述目标图像的类别识别结果, 所述类别识别结果存储于区 块链节点中。 8.一种图像类别识别装置, 其特征在于, 所述图像类别识别装置包括: 初始化模块, 用于构建神经网络训练框架并初始化每一个类别对应的预测阈值序列; 遍历模块, 用于针对每一个类别, 遍历所述预测阈值序列中的每一个预测阈值; 训练模块, 用于针对每一个预测阈值, 输入训练样本图像集到所述神经网络训练框架 中进行训练得到图像类别识别模型; 测试模块, 用于输入测试样本图像集到所述图像类别识别模型中进行测试得到测试通 过率; 更新模块, 用于根

9、据所述测试通过率更新所述图像类别识别模型; 识别模块, 用于利用更新后的图像类别识别模型识别目标图像的类别并输出所述目标 图像的类别识别结果。 9.一种计算机设备, 其特征在于, 所述计算机设备包括: 处理器, 所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任 意一项所述图像类别识别方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有计算机程序, 其特征 在于, 所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述图像类别识别 方法。 权利要求书 2/2 页 3 CN 111695594 A 3 图像类别识别方法、 装置、 计算机设备及介质 技术

10、领域 0001 本发明涉及人工智能技术领域, 具体涉及一种图像类别识别方法、 装置、 计算机设 备及介质。 背景技术 0002 近年来随着计算机视觉的发展, 食品分析也引入了图像处理技术, 通过对食物图 像的内容进行分析, 提取有意义的特征, 已经能够实现对食物种类的大致判断, 但仍存在一 个痛点, 即结果比较粗糙。 0003 主要原因在于, 在训练食物图像类别识别模型时, 对所有的类别的预测阈值都设 置为同一个值, 因而没有针对性, 导致对食物的分类分析不全面且分类结果准确度较低。 发明内容 0004 鉴于以上内容, 有必要提出一种图像类别识别方法、 装置、 计算机设备及介质, 旨 在于解决

11、现有的图像类别识别模型的所有类别设置为相同的预测阈值导致分类结果准确 度较低的技术问题。 0005 本发明的第一方面提供一种图像类别识别方法, 所述图像类别识别方法包括: 0006 构建神经网络训练框架并初始化每一个类别对应的预测阈值序列; 0007 针对每一个类别, 遍历所述预测阈值序列中的每一个预测阈值; 0008 针对每一个预测阈值, 输入训练样本图像集到所述神经网络训练框架中进行训练 得到图像类别识别模型; 0009 输入测试样本图像集到所述图像类别识别模型中进行测试得到测试通过率; 0010 根据所述测试通过率更新所述图像类别识别模型; 0011 利用更新后的图像类别识别模型识别目标

12、图像的类别并输出所述目标图像的类 别识别结果。 0012 根据本发明的一个可选实施例, 所述构建神经网络训练框架包括: 0013 确定原始CNN网络为训练框架的原型, 其中, 所述原始CNN网络包括第一连接层; 0014 连接所述第一连接层的输出与多个sigmoid激活函数层, 其中, 所述sigmoid激活 函数层的个数与所述类别的个数相同; 0015 连接每一个sigmoid激活函数层与一个损失函数层; 0016 将所有损失函数层的输出连接到第二连接层。 0017 根据本发明的一个可选实施例, 所述输入测试样本图像集到所述图像类别识别模 型中进行测试得到测试通过率包括: 0018 输入每一

13、个测试样本图像至所述图像类别识别模型中; 0019 获取每个sigmoid激活函数层输出的二分类概率; 0020 合并所有的二分类概率为一个概率向量, 所述概率向量的长度为所述类别的个 数; 说明书 1/12 页 4 CN 111695594 A 4 0021 根据所述概率向量计算测试通过率。 0022 根据本发明的一个可选实施例, 所述根据所述概率向量计算测试通过率包括: 0023 判断所述概率向量中的每一个概率分值与真实类别向量中对应的概率分值是否 相同; 0024 当所述概率向量中的概率分值与真实类别向量中对应的概率分值相同时, 确定所 述分值正确, 并计算正确的概率分值的个数及所述个数

14、占所述概率向量的概率分值的总个 数的比例; 0025 确定所述比例为所述测试通过率。 0026 根据本发明的一个可选实施例, 所述根据所述测试通过率更新所述图像类别识别 模型包括: 0027 获取每一个类别下的每一个预测阈值对应的测试通过率; 0028 针对每一个类别, 确定最高的测试通过率对应的预测阈值为目标阈值; 0029 根据每一个类别对应的目标阈值更新所述图像类别识别模型。 0030 根据本发明的一个可选实施例, 所述方法还包括: 0031 采集原始样本集, 所述原始样本集包括多张原始样本图像; 0032 计算每张原始样本图像的图像质量; 0033 将图像质量小于预设质量阈值的原始样本

15、图像进行剔除得到多张剩余样本图像; 0034 采用目标检测算法检测每张剩余样本图像中的目标区域; 0035 分割出每张剩余样本图像中的所述目标区域得到多张目标图像; 0036 对所述多张目标图像进行归一化处理; 0037 将归一化处理后的目标图像划分为训练样本图像集和测试样本图像集。 0038 根据本发明的一个可选实施例, 所述利用更新后的图像类别识别模型识别目标图 像的类别并输出所述目标图像的类别识别结果包括: 0039 输入所述目标图像至更新后的图像类别识别模型中进行识别; 0040 接收所述更新后的图像类别识别模型输出的识别向量; 0041 确定所述识别向量中元素值大于对应的目标阈值的目

16、标元素值; 0042 根据所述目标元素值输出所述目标图像的类别识别结果, 所述类别识别结果存储 于区块链节点中。 0043 本发明的第二方面提供一种图像类别识别装置, 所述图像类别识别装置包括: 0044 初始化模块, 用于构建神经网络训练框架并初始化每一个类别对应的预测阈值序 列; 0045 遍历模块, 用于针对每一个类别, 遍历所述预测阈值序列中的每一个预测阈值; 0046 训练模块, 用于针对每一个预测阈值, 输入训练样本图像集到所述神经网络训练 框架中进行训练得到图像类别识别模型; 0047 测试模块, 用于输入测试样本图像集到所述图像类别识别模型中进行测试得到测 试通过率; 0048

17、 更新模块, 用于根据所述测试通过率更新所述图像类别识别模型; 0049 识别模块, 用于利用更新后的图像类别识别模型识别目标图像的类别并输出所述 目标图像的类别识别结果。 说明书 2/12 页 5 CN 111695594 A 5 0050 本发明的第三方面提供一种计算机设备, 所述计算机设备包括处理器, 所述处理 器用于执行存储器中存储的计算机程序时实现所述图像类别识别方法。 0051 本发明的第四方面提供一种计算机可读存储介质, 所述计算机可读存储介质上存 储有计算机程序, 所述计算机程序被处理器执行时实现所述图像类别识别方法。 0052 综上所述, 本发明所述的图像类别识别方法、 装置

18、、 计算机设备及计算机可读存储 介质, 相比现有技术中的分类模型, 能够针对不同的类别动态的调整预测阈值, 使得训练出 的图像类别识别模型识别出的类别更细致, 识别结果准确率更高。 且本实施例不仅能够预 测出所述图像最可能的类别, 还能预测出所述图像可能的多个类别, 克服了传统分类模型 只能对图片进行简单分类的局限。 附图说明 0053 图1是本发明实施例一提供的图像类别识别方法的流程图。 0054 图2是本发明实施例二提供的图像类别识别装置的结构图。 0055 图3是本发明实施例三提供的计算机设备的结构示意图。 具体实施方式 0056 为了能够更清楚地理解本发明的上述目的、 特征和优点, 下

19、面结合附图和具体实 施例对本发明进行详细描述。 需要说明的是, 在不冲突的情况下, 本发明的实施例及实施例 中的特征可以相互组合。 0057 除非另有定义, 本文所使用的所有的技术和科学术语与属于本发明的技术领域的 技术人员通常理解的含义相同。 本文中在本发明的说明书中所使用的术语只是为了描述具 体的实施例的目的, 不是旨在于限制本发明。 0058 图1是本发明实施例一提供的图像类别识别方法的流程图。 所述图像类别识别方 法具体包括以下步骤, 根据不同的需求, 该流程图中步骤的顺序可以改变, 某些可以省略。 0059 S11, 构建神经网络训练框架并初始化每一个类别对应的预测阈值序列。 006

20、0 计算机设备中预先存储有多个类别标识, 并为每一个类别初始化有一个预测阈值 序列。 0061 示例性的, 所述预测阈值序列可以为0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9。 0062 在一个可选的实施例中, 所述构建神经网络训练框架包括: 0063 确定原始CNN网络为训练框架的原型, 其中, 所述原始CNN网络包括第一连接层; 0064 连接所述第一连接层的输出与多个sigmoid激活函数层, 其中, 所述sigmoid激活 函数层的个数与所述类别的个数相同; 0065 连接每一个sigmoid激活函数层与一个损失函数层; 0066 将所有损失函

21、数层的输出连接到第二连接层。 0067 在该可选的实施例中, 原始的卷积神经网络(Convolutional Neural Networks, CNN)在处理分类问题时, 最后一层使用的是一个softmax激活函数, 对于输入的样本x, softmax激活函数层输出样本x在所有类别上的概率, 并根据概率预测输出最可能的类别。 通过对原始的CNN网络进行改造, 不仅能够消除不同类间的互斥性, 还能将属于某一个类的 问题转换为多个是否有某个类的二分类问题, 分类结果更细致, 准确率更精确。 说明书 3/12 页 6 CN 111695594 A 6 0068 在一个可选的实施例中, 所述sigmo

22、id激活函数层采用sigmoid激活函数, sigmoid 激活函数为:这种激活函数允许多元的激活输出。 0069 所述损失函数层采用二分类的binary_crossentropy损失函数, binary_ crossentropy损失函数具体为tf.nn.sigmoid_cross_entropy_with_logits函数。 0070 S12, 针对每一个类别, 遍历所述预测阈值序列中的每一个预测阈值。 0071 对于每一个类别, 从预设预测阈值序列中依次获取一个预测阈值作为该类别的预 测阈值, 并保持其他类别对应的预测阈值不变, 在该类别上分别采用遍历到的预测阈值进 行图像类别识别模型的

23、训练。 0072 针对每一个类别在每一轮训练时, 该类别的预测阈值与其他类别对应的预测阈值 构成一个新的预测阈值向量。 0073 S13, 针对每一个预测阈值, 输入训练样本图像集到所述神经网络训练框架中进行 训练得到图像类别识别模型。 0074 示例性的, 假设有3个类别: 类别A、 类别B和类别C, 每个类别的预测阈值序列为 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9。 针对类别A训练图像类别识别模型时, 保持类 别B对应的预测阈值和类别C对应的预测阈值不变, 例如, 均为0.1, 然后遍历预测阈值序列 中的每一个预测阈值。 遍历到预测阈值0.1

24、, 就构成一个预测阈值向量0.1, 0.1, 0.1, 遍历 到预测阈值0.2, 就构成一个预测阈值向量0.2, 0.1, 0.1, 以此类推, 遍历到预测阈值0.9, 就构成一个预测阈值向量0.9, 0.1, 0.1。 基于每一个预测阈值向量训练出一个图像类别 识别模型。 0075 S14, 输入测试样本图像集到所述图像类别识别模型中进行测试得到测试通过率。 0076 在一个可选的实施例中, 所述输入测试样本图像集到所述图像类别识别模型中进 行测试得到测试通过率包括: 0077 输入每一个测试样本图像至所述图像类别识别模型中; 0078 获取每个sigmoid激活函数层输出的二分类概率; 0

25、079 合并所有的二分类概率为一个概率向量, 所述概率向量的长度为所述类别的个 数; 0080 根据所述概率向量计算测试通过率。 0081 在该可选的实施例中, 图像类别识别模型预测每个样本x的一系列输出, 这些输出 使用二元向量表示:其中N代表输出类别的个数, 每个若在样本x中 存在则为1, 每个若在样本x中不存在则为0。 0082为 了 将用 二 元 表 示 出 来 ,选 用 二 元 交 叉 熵 方 程 : 该值代表后向传播过 程中, 输出值与目标向量的接近程度。 0083 示例性的, 假设有三个测试样本: 测试样本1、 测试样本2及测试样本3, 针对类别A 训练出了9个图像类别识别模型,

26、 将测试样本1输入至这9个图像类别识别模型中, 得到9个 二分类概率, 将测试样本2输入至这9个图像类别识别模型中, 得到9个二分类概率, 将测试 说明书 4/12 页 7 CN 111695594 A 7 样本3输入至这9个图像类别识别模型中, 得到9个二分类概率, 将第1个图像类别识别模型 输出的二分类概率合并为一个概率向量, 将第2个图像类别识别模型输出的二分类概率合 并为一个概率向量, 以此类推, 将第9个图像类别识别模型输出的二分类概率合并为一个概 率向量。 0084 在一个可选的实施例中, 所述根据所述概率向量计算测试通过率包括: 0085 判断所述概率向量中的每一个概率分值与真实

27、类别向量中对应的概率分值是否 相同; 0086 当所述概率向量中的概率分值与真实类别向量中对应的概率分值相同时, 确定所 述分值正确, 并计算正确的概率分值的个数及所述个数占所述概率向量的概率分值的总个 数的比例; 0087 确定所述比例为所述测试通过率。 0088 示例性的, 假设第1个图像类别识别模型对应的概率向量为1, 1, 0, 0, 真实类别 向量为1, 0, 0, 0, 则所述概率向量中的第一个概率分值、 第三个概率分值及第四个概率分 值与真实类别向量中对应的概率分值相同, 因而第1个图像类别识别模型的测试通过率为 3/4*10075。 0089 又如, 假设第2个图像类别识别模型

28、对应的概率向量为1, 1, 1, 0, 真实类别向量 为1, 1, 0, 1, 则所述概率向量中的第一个概率分值、 第二个概率分值与真实类别向量中对 应的概率分值相同, 因而第2个图像类别识别模型的测试通过率为2/4*10050。 0090 S15, 根据所述测试通过率更新所述图像类别识别模型。 0091 在一个可选的实施例中, 所述根据所述测试通过率更新所述图像类别识别模型包 括: 0092 获取每一个类别下的每一个预测阈值对应的测试通过率; 0093 针对每一个类别, 确定最高的测试通过率对应的预测阈值为目标阈值; 0094 根据每一个类别对应的目标阈值更新所述图像类别识别模型。 0095

29、 示例性的, 假设类别A对应的9个测试通过率为: 80, 90, 92, 89, 98, 94, 90, 97, 92, 则最高测试通过率98对应的预测阈值0.5作为类别A的目标阈值。 0096 又如, 假设类别B对应的9个测试通过率为: 90, 92, 80, 88, 92, 93, 89, 99, 95, 则最高测试通过率99对应的预测阈值0.8作为类别B的目标阈值。 0097 由于训练样本图像集中正负样本图像的数量不均衡, 不可以使用默认的0.5作为 预测阈值, 因此需要为每一个类别设定一个合适的预测阈值, 当测试通过率预测阈值时, 判定含有该类别, 使得最终的F1 score值最大。

30、取F1 score最高的预测阈值作为该类别的 目标阈值。 0098 确定完毕该类别的目标阈值后, 固定该类别的目标阈值不变, 接着对其他类别依 次重复上述流程, 直至确定所有类别的目标阈值。 具体的, 类别A的目标阈值确定后, 针对类 别B, 依次遍历预测阈值序列0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 针对每个遍历到 的预测阈值, 训练出一个图像类别识别模型, 并输入每一个测试样本图像到这9个图像类别 识别模型中得到二分类概率; 接着, 针对每一个图像类别识别模型, 将所有测试样本图像的 二分类概率合并为一个概率向量, 与真实类别向量中对应的概

31、率分值进行比较, 从而确定 测试通过率, 将最高的测试通过率对应的预测阈值作为类别B的目标阈值。 说明书 5/12 页 8 CN 111695594 A 8 0099 在一个可选的实施例中, 所述方法还包括: 0100 采集原始样本集, 所述原始样本集包括多张原始样本图像; 0101 计算每张原始样本图像的图像质量; 0102 将图像质量小于预设质量阈值的原始样本图像进行剔除得到多张剩余样本图像; 0103 采用目标检测算法检测每张剩余样本图像中的目标区域; 0104 分割出每张剩余样本图像中的所述目标区域得到多张目标图像; 0105 对所述多张目标图像进行归一化处理; 0106 将归一化处理

32、后的目标图像划分为训练样本图像集和测试样本图像集。 0107 在该可选的实施例中, 可以计算每张原始样本图像的质量, 例如均值, 方差等, 将 均值小于预设均值阈值的原始样本图像剔除, 或者将方差小于预设方差阈值的原始样本图 像剔除。 0108 在实际情景中, 具有特征的区域在一张样本图像中占据的比例可能较小, 例如, 原 始样本图像中的仅位于整幅样本图像中的中间位置有目标, 原始样本图像中的其他位置可 能为空白, 将所述原始样本图像中的目标所在的区域分割出来, 有利于加速图像类别识别 模型在训练过程中的特征提取。 由于爬取到的多张原始样本图像质量层次不齐, 图像亮度 不一, 导致分割出的图像

33、无法反应目标的真实颜色, 为了保持整体的稳定性, 需要对多张目 标图像进行白平衡和均衡化处理, 归一化处理能够提高图像类别识别模型的识别效果。 0109 S16, 利用更新后的图像类别识别模型识别目标图像的类别并输出所述目标图像 的类别识别结果。 0110 在一个可选的实施例中, 所述利用更新后的图像类别识别模型识别目标图像的类 别并输出所述目标图像的类别识别结果包括: 0111 输入所述目标图像至更新后的图像类别识别模型中进行识别; 0112 接收所述更新后的图像类别识别模型输出的识别向量; 0113 确定所述识别向量中元素值大于对应的目标阈值的目标元素值; 0114 根据所述目标元素值输出

34、所述目标图像的类别识别结果。 0115 在该可选的实施例中, 假设更新后的图像类别识别模型输出的识别向量为p1, p2, p3, p4, p5, p6, p7, p8, pi为所述识别向量中的元素值, 每一个类别对应的目标阈值分别 为: t1, t2, t3, t4, t5, t6, t7, t8, 如果p1t1, 则确定p1为目标元素值, 如果p2预测阈值时, 判定含有该类别, 使得最终的F1 score值最大。 取F1 score最高的预测阈值作为该类别的 目标阈值。 0162 确定完毕该类别的目标阈值后, 固定该类别的目标阈值不变, 接着对其他类别依 次重复上述流程, 直至确定所有类别的

35、目标阈值。 具体的, 类别A的目标阈值确定后, 针对类 别B, 依次遍历预测阈值序列0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 针对每个遍历到 的预测阈值, 训练出一个图像类别识别模型, 并输入每一个测试样本图像到这9个图像类别 识别模型中得到二分类概率; 接着, 针对每一个图像类别识别模型, 将所有测试样本图像的 二分类概率合并为一个概率向量, 与真实类别向量中对应的概率分值进行比较, 从而确定 测试通过率, 将最高的测试通过率对应的预测阈值作为类别B的目标阈值。 0163 所述处理模块206, 用于划分训练样本图像集和测试样本图像集。 0164

36、 在一个可选的实施例中, 所述处理模块206划分训练样本图像集和测试样本图像 集具体包括: 0165 采集原始样本集, 所述原始样本集包括多张原始样本图像; 0166 计算每张原始样本图像的图像质量; 0167 将图像质量小于预设质量阈值的原始样本图像进行剔除得到多张剩余样本图像; 0168 采用目标检测算法检测每张剩余样本图像中的目标区域; 说明书 9/12 页 12 CN 111695594 A 12 0169 分割出每张剩余样本图像中的所述目标区域得到多张目标图像; 0170 对所述多张目标图像进行归一化处理; 0171 将归一化处理后的目标图像划分为训练样本图像集和测试样本图像集。 0

37、172 在该可选的实施例中, 可以计算每张原始样本图像的质量, 例如均值, 方差等, 将 均值小于预设均值阈值的原始样本图像剔除, 或者将方差小于预设方差阈值的原始样本图 像剔除。 0173 在实际情景中, 具有特征的区域在一张样本图像中占据的比例可能较小, 例如, 原 始样本图像中的仅位于整幅样本图像中的中间位置有目标, 原始样本图像中的其他位置可 能为空白, 将所述原始样本图像中的目标所在的区域分割出来, 有利于加速图像类别识别 模型在训练过程中的特征提取。 由于爬取到的多张原始样本图像质量层次不齐, 图像亮度 不一, 导致分割出的图像无法反应目标的真实颜色, 为了保持整体的稳定性, 需要

38、对多张目 标图像进行白平衡和均衡化处理, 归一化处理能够提高图像类别识别模型的识别效果。 0174 所述获取模块207, 用于获取目标图像。 0175 所述识别模块208, 用于利用更新后的图像类别识别模型识别目标图像的类别并 输出所述目标图像的类别识别结果。 0176 在一个可选的实施例中, 所述识别模块208利用更新后的图像类别识别模型识别 目标图像的类别并输出所述目标图像的类别识别结果包括: 0177 输入所述目标图像至更新后的图像类别识别模型中进行识别; 0178 接收所述更新后的图像类别识别模型输出的识别向量; 0179 确定所述识别向量中元素值大于对应的目标阈值的目标元素值; 01

39、80 根据所述目标元素值输出所述目标图像的类别识别结果。 0181 在该可选的实施例中, 假设更新后的图像类别识别模型输出的识别向量为p1, p2, p3, p4, p5, p6, p7, p8, pi为所述识别向量中的元素值, 每一个类别对应的目标阈值分别 为: t1, t2, t3, t4, t5, t6, t7, t8, 如果p1t1, 则确定p1为目标元素值, 如果p2t2, 则确定p2 不为目标元素值。 0182 假设确定出的目标元素值有: p1、 p3、 p4及p8, 则所述目标图像中包括第一类别、 第 三类别、 第四类别及第八类别。 0183 本实施例涉及人工智能技术领域, 提供

40、一种图像类别识别装置, 通过基于深度学 习的思想训练出图像类别识别模型, 来进行图像识别并给出图像的类别, 训练出的图像类 别识别模型相比现有技术中的分类模型, 能够针对不同的类别动态的调整预测阈值, 使得 训练出的图像类别识别模型识别出的类别更细致, 识别结果准确率更高。 且本实施例不仅 能够预测出所述图像最可能的类别, 还能预测出所述图像可能的多个类别, 克服了传统分 类模型只能对图片进行简单分类的局限。 0184 需要强调的是, 为进一步保证上述类别识别结果的私密和安全性, 上述类别识别 结果还可以存储于一区块链的节点中。 0185 本发明所指区块链是分布式数据存储、 点对点传输、 共识

41、机制、 加密算法等计算机 技术的新型应用模式。 区块链(Blockchain), 本质上是一个去中心化的数据库, 是一串使用 密码学方法相关联产生的数据块, 每一个数据块中包含了一批次网络交易的信息, 用于验 证其信息的有效性(防伪)和生成下一个区块。 区块链可以包括区块链底层平台、 平台产品 说明书 10/12 页 13 CN 111695594 A 13 服务层以及应用服务层等。 0186 参阅图3所示, 为本发明实施例三提供的计算机设备的结构示意图。 在本发明较佳 实施例中, 所述计算机设备3包括存储器31、 至少一个处理器32、 至少一条通信总线33及收 发器34。 0187 本领域技

42、术人员应该了解, 图3示出的计算机设备的结构并不构成本发明实施例 的限定, 既可以是总线型结构, 也可以是星形结构, 所述计算机设备3还可以包括比图示更 多或更少的其他硬件或者软件, 或者不同的部件布置。 0188 在一些实施例中, 所述计算机设备3是一种能够按照事先设定或存储的指令, 自动 进行数值计算和/或信息处理的计算机设备, 其硬件包括但不限于微处理器、 专用集成电 路、 可编程门阵列、 数字处理器及嵌入式设备等。 所述计算机设备3还可包括客户设备, 所述 客户设备包括但不限于任何一种可与客户通过键盘、 鼠标、 遥控器、 触摸板或声控设备等方 式进行人机交互的电子产品, 例如, 个人计

43、算机、 平板电脑、 智能手机、 数码相机等。 0189 需要说明的是, 所述计算机设备3仅为举例, 其他现有的或今后可能出现的电子产 品如可适应于本发明, 也应包含在本发明的保护范围以内, 并以引用方式包含于此。 0190 在一些实施例中, 所述存储器31中存储有程序代码, 且所述至少一个处理器32可 调用所述存储器31中存储的程序代码以执行相关的功能。 例如, 上述实施例中所述的各个 模块是存储在所述存储器31中的程序代码, 并由所述至少一个处理器32所执行, 从而实现 所述各个模块的功能。 所述存储器31包括只读存储器(Read-Only Memory, ROM)、 可编程只 读存储器(P

44、rogrammable Read-Only Memory, PROM)、 可擦除可编程只读存储器(Erasable Programmable Read-Only Memory, EPROM)、 一次可编程只读存储器(One-time Programmable Read-Only Memory, OTPROM)、 电子擦除式可复写只读存储器 (Electrically-Erasable Programmable Read-Only Memory, EEPROM)、 只读光盘(Compact Disc Read-Only Memory, CD-ROM)或其他光盘存储器、 磁盘存储器、 磁带存储器、

45、 或者能够 用于携带或存储数据的计算机可读的任何其他介质。 0191 在一些实施例中, 所述至少一个处理器32是所述计算机设备3的控制核心 (Control Unit), 利用各种接口和线路连接整个计算机设备3的各个部件, 通过运行或执行 存储在所述存储器31内的程序或者模块, 以及调用存储在所述存储器31内的数据, 以执行 计算机设备3的各种功能和处理数据。 例如, 所述至少一个处理器32执行所述存储器中存储 的程序代码时实现本发明实施例中所述的方法的全部或者部分步骤。 所述至少一个处理器 32可以由集成电路组成, 例如可以由单个封装的集成电路所组成, 也可以是由多个相同功 能或不同功能封装

46、的集成电路所组成, 包括一个或者多个中央处理器(Central Processing unit, CPU)、 微处理器、 数字处理芯片、 图形处理器及各种控制芯片的组合等。 0192 在一些实施例中, 所述至少一条通信总线33被设置为实现所述存储器31以及所述 至少一个处理器32等之间的连接通信。 0193 尽管未示出, 所述计算机设备3还可以包括给各个部件供电的电源(比如电池), 优 选的, 电源可以通过电源管理装置与所述至少一个处理器32逻辑相连, 从而通过电源管理 装置实现管理充电、 放电、 以及功耗管理等功能。 电源还可以包括一个或一个以上的直流或 交流电源、 再充电装置、 电源故障检

47、测电路、 电源转换器或者逆变器、 电源状态指示器等任 意组件。 所述计算机设备3还可以包括多种传感器、 蓝牙模块、 Wi-Fi模块等, 在此不再赘述。 说明书 11/12 页 14 CN 111695594 A 14 0194 上述以软件功能模块的形式实现的集成的单元, 可以存储在一个计算机可读取存 储介质中。 上述软件功能模块存储在一个存储介质中, 包括若干指令用以使得一台计算机 设备(可以是个人计算机, 计算机设备, 或者网络设备等)或处理器(processor)执行本发明 各个实施例所述方法的部分。 0195 在本发明所提供的几个实施例中, 应该理解到, 所揭露的装置和方法, 可以通过其

48、 它的方式实现。 例如, 以上所描述的装置实施例仅仅是示意性的, 例如, 所述模块的划分, 仅 仅为一种逻辑功能划分, 实际实现时可以有另外的划分方式。 0196 所述作为分离部件说明的模块可以是或者也可以不是物理上分开的, 作为模块显 示的部件可以是或者也可以不是物理单元, 即可以位于一个地方, 或者也可以分布到多个 网络单元上。 可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目 的。 0197 另外, 在本发明各个实施例中的各功能模块可以集成在一个处理单元中, 也可以 是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元中。 上述集成的单 元既可以采用硬件的形

49、式实现, 也可以采用硬件加软件功能模块的形式实现。 0198 对于本领域技术人员而言, 显然本发明不限于上述示范性实施例的细节, 而且在 不背离本发明的精神或基本特征的情况下, 能够以其他的具体形式实现本发明。 因此, 无论 从哪一点来看, 均应将实施例看作是示范性的, 而且是非限制性的, 本发明的范围由所附权 利要求而不是上述说明限定, 因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本发明内。 不应将权利要求中的任何附图标记视为限制所涉及的权利要求。 此 外, 显然 “包括” 一词不排除其他单元或, 单数不排除复数。 装置权利要求中陈述的多个单元 或装置也可以由一个单元或装置通过软件或者硬件来实现。 第一, 第二等词语用来表示名 称, 而并不表示任何特定的顺序。 0199 最后应说明的是, 以上实施例仅用以说明本发明的技术方案而非限制, 尽管参照 较佳实施例对本发明进行了详细说明, 本领域的普通技术人员应当理解, 可以对本发明的 技术方案进行修改或等同替换, 而不脱离本发明技术方案的精神和范围。 说明书 12/12 页 15 CN 111695594 A 15 图1 说明书附图 1/2 页 16 CN 111695594 A 16 图2 图3 说明书附图 2/2 页 17 CN 111695594 A 17

copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1