检测改进质量的伪造介质.pdf

上传人:b*** 文档编号:1274101 上传时间:2018-04-11 格式:PDF 页数:37 大小:1.24MB
返回 下载 相关 举报
摘要
申请专利号:

CN200680047368.7

申请日:

2006.12.14

公开号:

CN101366061A

公开日:

2009.02.11

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效|||公开

IPC分类号:

G07D7/20

主分类号:

G07D7/20

申请人:

NCR公司

发明人:

何 超; 佳里·罗斯

地址:

美国俄亥俄州

优先权:

2005.12.16 US 11/305,537; 2006.3.2 US 11/366,147

专利代理机构:

中原信达知识产权代理有限责任公司

代理人:

夏 凯;钟 强

PDF下载: PDF下载
内容摘要

描述了一种创建用于介质验证的分类器的方法。使用来自真的介质对象的所有训练图像集合的信息来形成分割映射,然后所述分割映射用于分割每个训练集合图像。特征从分段中提取,并用于形成分类器,所述分类器优选地是单类统计分类器。例如,当所述介质是不同币种和面额的纸币时,以这种方式可快速并简单地形成分类器,并且不需要假钞的样本。描述了使用这种分类器的介质验证器以及使用这种分类器验证纸币的方法。在优选实施例中,形成多个分割映射,所述分割映射具有不同数量的分段。如果较高质量的伪造介质对象进入介质对象的总体,则介质验证器通过切换到使用具有较高数量的分段的分割映射无需重新训练就能够立即做出反应。

权利要求书

1: 一种创建用于介质验证的分类器的方法,所述方法包括步骤: (i)访问介质对象的图像的训练集合; (ii)使用训练集合图像创建多个分割映射,每个分割映射包括与 所述训练集合中所有图像之间的相应图像元素的关系有关的信息,并 且每个分割映射具有不同数量的分段; (iii)对每个分割映射,通过使用所述分割映射分割每个训练集 合图像来计算分类参数集合,并从每个所述训练集合图像的每个分段 中提取一个或多个特征; (iv)使用分类参数集合中的第一选择的分类参数集合来形成所 述分类器;以及 (v)用其他分类参数集合中的一个来代替所述第一分类参数集 合。
2: 如权利要求1所述的方法,其中基于使用关于已知伪造品的信 息对分类器的检验来选择所述第一选择分类参数集合。
3: 如权利要求1所述的方法,其中基于与具有多个不同数量的分 段的分割映射的分类性能有关的信息来选择所述第一选择分类参数集 合。
4: 如权利要求1所述的方法,其中基于与介质对象总体的改变有 关的信息进行代替所述第一选择分类参数集合的步骤。
5: 如权利要求1所述的方法,其中所述分割映射是基于穿过所述 训练集合中的所有图像通过使用聚类算法以聚类位于图像平面中的像 素而创建的。
6: 如权利要求1所述的方法,还包括使用特征选择算法选择一种 或多种类型的特征以在提取特征的步骤(iii)中使用。
7: 如权利要求1所述的方法,其中所述分类器用于纸币验证,并 且所述方法还包括:基于与纸币的特定面额和币种有关的具体信息来 形成所述分类器。
8: 如权利要求1所述的方法,还包括:在形成所述分类器的步骤 (v)中必须的组合分类器。
9: 一种创建纸币分类器的设备,包括: (i)输入,配置以访问介质对象的图像的训练集合; (ii)处理器,配置以使用训练集合图像创建多个分割映射,每个 分割映射包括与所述训练集合中所有图像之间的相应图像元素的关系 有关的信息,并且每个分割映射具有不同数量的分段; (iii)分割器,配置以使用分割映射中的第一个分割映射来分割 每个所述训练集合图像; (iv)特征提取器,配置以从每个所述训练集合图像中的每个分 段中提取一个或多个特征; (v)分类形成装置,配置以使用所述特征信息形成所述分类器; (vi)选择器,配置以通过估计与在步骤(ii)中创建的每个所述 分割映射相应的分类性能来选择最佳分割映射以及一个或多个可选的 分割映射。
10: 一种介质验证器,包括: (i)输入,配置以接收将被验证的介质对象的至少一个图像; (ii)多个分割映射,每个分割映射具有不同数量的分段,并且每 个分割映射包括与介质对象的训练集合中所有图像之间的相应图像元 素的关系有关的信息; (iii)处理器,配置以使用分割映射中的第一个分割映射来分割 所述介质对象的图像; (iv)特征提取器,配置以从所述介质对象的图像的每个分段中 提取一个或多个特征; (v)分类器,配置以基于所提取的特征将所述介质对象分类为有 效或无效;以及 (vi)适配器,配置以用其他分割映射中的一个分割映射来代替 第一分割映射,并相应地修改所述分类器。
11: 如权利要求10所述的介质验证器,其中所述分割映射包括形 态学信息。
12: 如权利要求10所述的介质验证器,其中所述分割映射包括与 每个所述训练集合图像中相同位置的像素有关的信息。
13: 如权利要求10所述的介质验证器,其中所述分割映射包括像 素亮度简档。
14: 如权利要求10所述的介质验证器,其中所述分类器是单类分 类器。
15: 一种验证介质对象的方法,包括: (i)访问将被验证的介质对象的至少一个图像; (ii)访问多个分割映射,所述多个分割映射包括与所述训练集合 中所有图像之间的相应图像元素的关系有关的信息,并且每个分割映 射具有不同数量的分段; (iii)选择多个分割映射中的一个分割映射; (iv)使用选择的分割映射分割所述介质对象的图像; (v)从所述介质对象的图像的每个分段中提取特征; (vi)使用分类器基于提取的特征对所述介质对象进行分类。
16: 如权利要求15所述的方法,其中根据与介质对象的总体的改 变有关的信息来选择步骤(iii)中的所述分割映射。
17: 如权利要求16所述的方法,其中所述信息包括与伪造介质对 象的质量有关的信息。
18: 一种包括计算机程序代码装置的计算机程序,所述计算机程 序代码装置适用于执行创建用于介质验证的分类器的方法的所有步 骤,所述方法包括步骤: (i)访问介质对象的图像的训练集合; (ii)使用训练集合图像创建多个分割映射,每个分割映射包括与 所述训练集合中所有图像之间的相应图像元素的关系有关的信息,并 且每个分割映射具有不同数量的分段; (iii)对每个分割映射,通过使用所述分割映射分割每个训练集 合图像来计算分类参数集合,并从每个所述训练集合图像的每个分段 中提取一个或多个特征; (iv)使用分类参数集合中的第一选择分类参数集合来形成所述 分类器;以及 (v)用其他分类参数集合中的一个来代替所述第一分类参数集 合。
19: 如权利要求18所述的计算机程序,所述计算机程序包含在计 算机可读介质上。
20: 一种自助式设备,包括: (i)用于接受介质对象的装置; (ii)用于获得介质对象的数字图像的成像装置; (iii)介质验证器,包括 (i)输入,配置以接收将被验证的介质对象的至少一个图像; (ii)多个分割映射,每个分割映射具有不同数量的分段,并 且每个分割映射包括与介质对象的训练集合中所有图像之间的相应图 像元素的关系有关的信息; (iii)处理器,配置以使用分割映射中的第一个分割映射来分 割所述介质对象的图像; (iv)特征提取器,配置以从所述介质对象的图像的每个分段 中提取一个或多个特征; (v)分类器,配置以基于所提取的特征将所述介质对象分类 为有效或无效;以及 (vi)适配器,配置以用其他分割映射中的一个分割映射来代 替第一分割映射,并相应地修改所述分类器。

说明书


检测改进质量的伪造介质

    【相关申请的交叉引用】

    本申请是2006年3月2日提交的美国专利申请11/366,147号的部分继续申请,美国专利申请11/366,147号是2005年12月16日提交的美国专利申请11/305,537号的部分继续申请。2006年3月2日提交的申请11/366,147号和2005年12月16日提交的申请11/305,537号通过引用合并于此。

    【技术领域】

    本说明书涉及一种用于介质验证的方法和设备。具体地涉及能对改进质量的伪造介质(例如,护照、支票、纸币、债券、股票)或其他这种介质起作用的此类方法和设备。

    背景技术

    越来越需要以简单、可靠和节约成本的方式自动核查和验证不同币种和面额的纸币。例如,这在接收纸币的自助式设备(例如,自助式售货亭、售票机、被安排办理存款的自动柜员机、自助式货币兑换机等)中是必需的。其他类型的有价值介质(例如,护照、支票等)的自动验证也是必需的。

    以前,介质验证的人工方法涉及纸币、护照、支票等的图像检查、诸如水印和纹路对准标记的透视效果以及手感甚至气味。其他已知方法依赖需要半人工询问的半公开特征。例如,使用磁性装置、紫外线传感器、荧光、红外线检测器、电容、金属条、图像模式等。然而,就其本身来说,这些方法是人工或半人工的,并且不适合无法长时间人工干预的许多应用。例如,在自助式设备中。

    为创建自动介质验证器有重要问题有待克服。例如,存在具有不同安全特征甚至基质类型的许多不同类型的货币。在不同的面额还通常具有不同等级的安全特征。因此,需要提供一种用于那些不同币种和面额地、容易并便于执行货币验证的一般方法。

    简而言之,验钞机的任务是确定所给定的纸币是真的还是假的。以前的自动验证方法通常需要相对大量的已知假钞样本以训练分类器。另外,那些先前的分类器被训练以只检测已知的假钞。这是有问题的,原因在于,对于可能的假钞存在很少或者不存在可用信息。例如,这特别对于新引入的面额或新引入的币种是有问题的。

    在出版在模式识别第37期(Pattern Recognition 37)(2004)第1085-1096页、作者为Chao He,MarkGirolami和Gary Ross(其中二人是本申请的发明人)、题目为“Employing optimized combinations ofone-class classifiers for automated currency validation(为自动纸币验证采用单类分类器的最优组合)”的早期论文中,描述了自动货币验证方法(专利号为EP1484719,US20042447169)。这涉及使用网格结构将整个纸币的图像分割成区域。为每个区域构造单独的“单类(one-class)”分类器,并且组合区域特定分类器的小的子集以提供全面描述(下面更详细地解释术语“单类”)。通过采用遗传算法来实现为实现良好性能的区域特定分类器的分割和组合。该方法在遗传算法阶段中需要少量伪造样本,同样地,当无法获得伪造数据时,该方法不适用。

    还需要以能实时执行的计算开销小的方式来执行自动货币验证。

    另外的问题涉及自动货币验证系统在适当的位置并在给定的环境下相对成功地运行的情况。例如,所述环境包括具有给定数量范围和分布的真钞和假钞的总体(population)。如果所述环境发生突变,则这种自动货币验证系统通常难以适应。例如,假设新的较高质量的假钞突然开始进入纸币总体,警察的智慧、人工验证和其他信息源可能指示较高质量的假钞的出现。在这种情况下,如果银行或其他提供者发现,假钞在自动货币验证机正被接受,则通常做出商业决定停止使用那些机器。然而,这是昂贵的,因为需要人工验证来代替,并且消费者不方便。还需要耗费重要的时间和金钱来升级自动货币验证系统以处理较高质量的假钞。

    上面提到的许多问题还应用于其他类型的有价值介质(例如,护照、支票等)的验证。

    【发明内容】

    描述了一种创建用于介质验证的分类器的方法。只使用来自真的介质对象(media items)的训练图像集合中所有图像的信息来形成分割映射,然后,使用所述分割映射来分割每个训练集合图像。特征从分段中提取,并且使用所述特征形成分类器,所述分类器优选地是单类统计分类器。以这种方式可对不同币种和面额快速并简单地形成分类器,并且不需要伪造介质对象的样本。描述了使用这种分类器的介质验证器以及使用这种分类器验证纸币的方法。在优选实施例中,形成多个分割映射,所述分割映射具有不同数量的分段。如果较高质量的伪造介质对象进入介质对象的总体,则介质验证器通过切换到使用具有较高数量的分段的分割映射而无需重新训练就能够立即做出反应。

    可通过在存储介质上的机器可读形式的软件来执行所述方法。可按本领域的技术人员清楚的合适顺序和/或并行执行所述方法的步骤。

    这表示,软件可以是有价值的、可分开买卖的商品。这意味着包括运行或控制“哑元(dumb)”或标准软件的软件,以执行期望的功能,(因此,软件实质上定义寄存器的功能,因此即使在将其与其标硬件组合之前,也可被称为寄存器)。由于相似的理由,还包括“描述”或定义硬件的构造的软件,例如设计硅芯片或构造通用可编程芯片所使用的HDL(硬件描述语言)软件,以执行期望的功能。

    如技术人员明了的,优选的特征可适当组合,并可与本发明的多方面中的任何特征组合。

    【附图说明】

    将参考下面的附图通过示例方式来描述本发明的实施例,其中:

    图1是创建用于纸币验证的分类器的方法的流程图;

    图2是创建用于纸币验证的分类器的设备的示意图;

    图3是纸币验证器的示意图;

    图4是验证纸币的方法的流程图;

    图5是对改进质量的假钞的出现动态地做出反应的方法的流程图;

    图6是用于两个分段的分割映射的示意图;

    图7是对三种不同币种错误接受率/错误拒绝率关于分割映射中分段的数量的曲线图;

    图8是与图7类似的曲线图,其指示分段数量的选择;

    图9是对于图8的改进质量的假钞进入总体的情况下的曲线图;

    图10是对于图8的显示夸张的错误拒绝率的情况下的曲线图;

    图11是对于图9的但是使用具有较高数量的分段的分割映射的情况下的曲线图;

    图12是具有纸币验证器的自助式设备的示意图。

    【具体实施方式】

    下面只作为示例,描述本发明的实施例。这些示例表示申请人目前所知道的将本发明应用于实践的最好方式,而不是能实现本发明的仅有方式。尽管这里将本示例描述和示出为在纸币验证系统中实现,但是提供所描述的系统作为示例,而不是限制。本领域技术人员应当明白,本示例适合于多种不同类型的介质验证系统中的应用,所述介质验证系统包括护照验证系统、支票验证系统、债券验证系统和股票验证系统,但不限于此。

    使用术语“单类分类器”来表示使用关于只来自单个类的样本的信息而形成或构造的分类器,但其用于将新出现的样本分配给所述单个类或者不分配给所述单个类。这与传统二进制分类器不同,所述传统二进制分类器是通过使用关于两个类的样本的信息被创建,并被用于将新样本分配给所述两个类中的一个或另一个。单类分类器可被认为定义已知类周围的边界,从而脱离所述边界的样本被认为不属于所述已知类。

    图1是创建用于纸币验证的分类器的方法的概要流程图。

    首先,我们获得真钞的图像的训练集合(参看图1的方框10)。这些是获取的相同币种和面额的纸币的相同类型的图像。图像的类型涉及如何获得图像,这可以用本领域中已知的任何方式。例如,反射图像,透射图像,红、蓝或绿任何通道上的图像,热图像,红外图像,紫外图像,x光图像或其他图像类型。训练集合中的图像被对准,并且大小相同。如在现有技术中已知,如果必要,可执行预处理来对齐图像并缩放图像。

    接着,我们通过使用来自训练集合图像的信息创建分割映射(参看图1的方框12)。所述分割映射包括关于如何将图像划分成多个分段(segment)的信息。所述分段可以是不连续的,即给定分段可包括图像的不同区域中的多于一个的片(patch)。以任何合适的方式形成分割映射,并且下面详细给出一些方法的示例。例如,在基于图像的训练集合中使用的多个图像的每个像素的幅度的分布和与构成图像的其他像素的幅度的关系来形成所述分段。优选地,但非必须,分割映射还包括将使用的特定数量的分段。例如,图6是在图中具有标号为1和2的两个分段的分割映射60的示意图。分割映射对应具有分段1和分段2的纸币的表面区域(area),所述分段1包括那些标为1的区域,分段2包括那些标为2的区域。一个分割映射将包括纸币的整个表面区域的表示。在分段是基于像素信息时,分段的最大数量是纸币的图像中的像素的总数量。

    使用分割映射,我们分割训练集合中的每个图像(参看图1的方框14)。然后,我们从每个训练集合图像中的每个分段提取一个或多个特征(参看图1的方框15)。对于术语“特征”,我们表示分段的任何统计量或其他特性。例如,平均像素亮度(intensity)、中值像素亮度、像素亮度的模式、纹理、直方图、傅立叶变换描述子、小波变换描述子和/或分段中的任何其他统计量。

    然后,通过使用特征信息形成分类器(参看图1的方框16)。可使用如现有技术中已知的任何合适类型的分类器。在本发明的具体优选实施例中,分类器是单类分类器,不需要关于假钞的信息。然而,还可使用二进制分类器或如现有技术中已知的任何合适类型的其他类型的分类器。

    图1的方法使得用于特定币种和面额的纸币的验证的分类器能够简单、快速并有效地形成。为了创建用于其他币种或面额的分类器,用合适的训练集合图像来重复所述方法。

    使用不同数量分割的分割映射产生不同的结果。另外,随着分段的数量增加,每个纸币所需要的处理也增加。因此,在优选实施例中,我们在训练和检验期间执行跟踪(如果关于假钞的信息可用)以选择用于分割映射的分段的最佳数量。

    这表示在图1中。检验分类器(参看方框17)以访问根据错误接受率和/或错误拒绝率的分类器的性能。错误接受率是分类器指示假钞为真的频率的指示。错误拒绝率是分类器多久指示真钞为假的频率的指示。该检验使用已知伪造品或为检验目的而创建的“假体(dummy)”伪造品。

    然后,为分割映射中不同数量的分段重复图1的方法并选择分段的最佳数量(参看方框18)。例如,这通过形成与图7和图8相似的曲线来进行。如果没有可用的伪造品用于检验,则可将分段的数量设置为对大多数币种工作良好的数量。我们的实验结果显示,具有良好安全设计的币种只需要2到5个分段以实现好的错误接受和错误拒绝性能;而具有差的安全设计的币种可能需要大约15个分段。

    然后存储最佳分割映射和一个或多个其他可选的分割映射(参看图1的方框19)。对于这些分割映射中的每一个,可计算和存储相关的分类参数集合。

    图7是使用这里描述的纸币验证方法的错误接受率/错误拒绝率对比三种币种的分割映射中分段的数量的曲线图。用曲线a,b,c来表示三种币种的错误接受率。对每种币种,错误拒绝率相似并且用线70表示。

    可以看出,随着分割映射中分段数量的增加,错误接受伪造品的机会减小。然而,在拒绝真钞的风险中有较小增加。

    在优选实施例中,我们选择最少数量的分段,从而错误接受率几乎为零。例如,与图7相似的图8显示使用该标准选择的分段X的数量。

    然而,可能在币种的寿命期间存在某一时刻,假钞的质量提高。例如,该币种可能成为更有组织的伪造团伙(counterfeit ring)的目标。另外,更高级的复制技术或技巧可变得可用。在这种情况下,假钞可能被所述自动系统作为真的接受。如图9中的90所示,这导致错误接受率增加。如果自动货币验证系统只具有使用少量分段X的分割映射(参看图9和图10),则然后所有可能的是将使得错误拒绝率增加非常高(参看图10的100)。这表示假钞不会被接受,但代价是拒绝大比例的真钞(在极端情况下为100%,即临时不支持这种币种/面额,这在当前实际中是常见的。)。为了在不需要切断服务或重新训练分类器的情况下解决该问题,我们简单地用一种预定义的可选择的具有较高数量的分段的分割映射来代替原始分割映射。可用与预定义的可选择的分割映射有关的另一分类参数集合来代替与原始分割映射有关的第一分类参数集合。

    这在图11中被示出。分割映射中分段的数量现在是比X大的Y。可以看出,在Y处的错误拒绝率与错误接受率一样保持为低。

    通过以这种方式替换分类参数集合,不必进行重新训练。因此,可快速并简单地调整用于自动货币验证的系统,以响应于较高质量假钞的引入。在本文件中稍后将参照图5对此进行更详细地描述。

    现在给出关于分割技术的示例的更多细节。

    先前,在EP1484719和US20042447169中,(如在背景技术部分所提到的)我们使用涉及对图像平面使用网格结构的分割技术和遗传算法方法以形成分割映射。这必然使用关于假钞的信息,并且当执行遗传算法搜索时,招致计算成本增加。

    本发明使用形成分割映射的不同方法,所述方法不需要使用遗传算法或等效方法,以在大量可能的分割映射中搜索好的分割映射。这减小了计算成本,并提高了性能。另外,不需要关于假钞的信息。

    我们认为,在伪造工艺中,通常难以提供整个纸币的一致质量仿效,因此,纸币的特定区域比其他区域更难以成功复制。因此,我们认识到,不使用严格一致的网格分割,我们可通过使用更复杂的分割来提高纸币验证。我们执行指示上述情况的经验检验其实就是这种情况。基于诸如模式、颜色和纹理的形态学特性的分割在检测假钞中导致较好性能。然而,当将诸如使用边缘检测器的传统图像分割方法应用于训练集合中的每个图像时,难以使用所述传统图像分割方法。这是因为对每个训练集合项获得不同的结果,并难以对准不同训练集合图像中的相应特征。为了避免对准分段的问题,在一个优选实施例中,我们使用被称为“时空图像分解”。

    现在给出关于形成分割映射的方法的细节。在概要上,该方法可被认为指定如何将图像平面划分成多个分段,每个分段包括多个指定像素。如上所述,所述分段可以是非连续的。在本发明中,基于来自训练集合中所有图像的信息来编写本说明书。相反,使用严格网格结构的分割不需要来自训练集合中图像的信息。

    例如,每个分割映射包括与训练集合中所有图像之间的相应图像元素的关系有关的信息。

    认为训练集合中的图像在相同方位相互堆叠并对准。获取纸币图像平面中的给定像素,该像素被认为具有“像素亮度简档(profile)”,所述像素亮度简档包括关于每个训练集合图像中的特定像素位置的像素亮度的信息。使用任何合适的聚类(clustering)算法,将图像平面中的像素位置聚类成分段,在所述分段中的像素位置具有相似或相关的像素亮度简档。

    在优选示例中,我们使用这些像素亮度简档。然而,不是必须使用像素亮度简档。还可使用来自训练集合中所有图像的其他信息。例如,4个相邻像素的块的亮度简档或每个训练集合图像中相同位置的像素的像素亮度的平均值。

    现在详细描述我们的形成分割映射的方法的具体优选实施例。这是基于在下面的出版物中教导的方法:Lecture Notes in ComputerScience(计算机科学讲义),2352:747-758,2002中Avidan,S.的“EigenSegments:A spatio-temporal decomposition of an ensemble ofimages(特有分段:图像系综的时空分解)”。

    给定已经对准并被缩放到相同大小r×c的图像系综(ensemble){Ii}i=1,2,Λ,N,每个图像Ii可通过其像素以向量形式被表示为[α1i,α2i,Λ,αMi]T,其中,αji(j=1,2,Λ,M)是第i个图像中第j个像素的亮度,M=r·c是图像中像素的总数量。然后可通过堆叠(stacking)系综中所有图像的向量Ii(使用均值归零)产生设计矩阵因此,A=[I1,I2,Λ,IN]。A中的行向量[αj1,αj2,Λ,αjN]可被看做N个图像的特定像素(第j个)的亮度简档。如果两个像素来自图像的相同模式区域,则它们可能具有相似的亮度值,并因此具有强的时间相关性。注意,这里的术语“时间”不需要与时间轴精确对应,但是借用该术语“时间”来指示系综中穿过不同图像的轴。我们的算法尝试找到这些相关性,并将图像平面空间上分割成具有相似时间行为的像素的区域。我们通过定义亮度简档之间的矩阵来测量该相关性。简单方式是使用欧式距离,即两个像素j和k之间的时间相关性可被表示为d(j,k)=Σi=1N(aji-aki)2.]]>d(j,k)越小,两个像素之间的相关性越强。

    为了使用像素之间的时间相关性来在空间上分解图像平面,我们对像素亮度简档(设计矩阵A的行)执行聚类算法。这将产生时间上相关像素的簇。最直接的选择是采用K均值算法,但可以是任何其他聚类算法。结果,图像平面被分割成时间上相关像素的若干分段。然后,可使用此分段作为模板来分割训练集合中所有图像;并且可关于从训练集合中所有图像的那些分段中提取的特征来构造分类器。

    为了不利用假钞而实现训练,优选地是单类分类器。可使用现有技术中已知的任何合适类型的单类分类器。例如,基于神经网络的单类分类器和基于统计的单类分类器。

    用于单类分类的合适的统计方法通常是基于在从目标类中提取所考虑的观测值的无效假设下的对数似然比最大化,并且这些方法包括假设目标类为多变量高斯分布的D2检验(在Morrison,DF:MultivariateStatistical Methods(多变量统计方法)(第三版)中描述。McGrawHill出版公司,纽约,1990)。在任意非高斯分布的情况下,可通过使用例如高斯的半参数混合(在Bishop,CM:Neural Networks for PatternRecognition(用于模式识别的神经网络)中描述,牛津大学出版社,纽约,1995)或非参数帕曾(Parzen)窗(在Duda,RO,Hart,PE,Stork,DG:Pattern Classification(模式分类)(第二版)中描述,John Wiley和Sons,INC,纽约,2001)来估计目标类的密度,并可通过诸如自抽样(bootstrap)(在Wang,S,Woodward,WA,Gary,HL等人:A newtest for outlier detcetion from a multivariate mixture distribution(从多变量混合分布中异常值检测的新检验)中描述,Journal of Computationaland Graphical Statistics(计算和图形统计期刊),6(3):285-299,1997)的采样技术来获得无效假设下的对数似然比的分布。

    可对单类分类可采用的其他方法是支持向量数据域描述(SVDD)(在Tax,DMJ,Duin,RPW:Support vector domain description(支持向量域描述)中描述,Pattern Recognition Letters(模式识别快报),20(11-12):1191-1199,1999)、还有已知的“支持估计(supportestimation)”(在Hayton,P,Scholkopf,B,Tarrassenko,L,Anuzis,P:Support Vector Novelty Detection Applied to Jet Engine VibrationSpectra(应用于喷气式发动机振动谱的支持向量新检测)中描述,Advances in Neural Information Processing Systems(神经网络信息处理系统进阶),13,eds Leen,Todd K和Dietterich,Thomas G and Tresp,Volker,MIT Press,946-952,2001)和极值理论(EVT)(在Roberts,SJ:Novelty detection using extreme value statistics(使用极值统计的新检测)中描述.IEE Proceedings on Vision,Image & Signal Processing(关于视觉、图像和信号处理的IEE会议记录),146(3):124-129,1999)。在SVDD中,估计支持的数据分布,同时EVT估计极值的分布。对此特定应用,用到大量的真钞样本,因此,在这种情况下,可获得目标类分布的可靠估计。因此,在优选实施例中,我们选择可明确估计密度分布的单类分类方法,尽管这不是必要的。在优选实施例中,我们使用基于参数的D2检验的单类分类方法。

    例如,详述用于我们的单类分类器的统计量假设检验如下:

    假定N独立,均匀分布的p维向量样本(每个纸币的特征集合)x1,Λ,xN∈C具有关于参数θ的基础密度函数p(x|θ)。对新的点xN+1给出下面的假设检验,以使H0:xN+1∈C,而H1:xN+1∉C]]>,其中,C表示无效假设为真的区域,并通过p(x|θ)来定义C。假定备择假设下的分布是均匀的,那么无效和备择假设的正态对数似然比

    λ=supθ∈ΘL0(θ)supθ∈ΘL1(θ)=supθΠn=1N+1p(xn|θ)supθΠn=1N(xn|θ)---(1)]]>

    可被用作无效假设的检验统计量。在该优选实施例中,我们可使用对数似然比作为用于最新出现的纸币的验证的检验统计量。

    具有多变量高斯密度的特征向量:假设描述样本中的个别点的特征向量是多变量高斯,从以上的似然比(1)出现的检验评估样本中的每一点是否共享共同均值(在(Morrison,DF:Multivariate StatisticalMethods(多变量统计方法)(第三版)中描述。McGraw-Hill出版公司,纽约,1990))。假定N独立,均匀分布的p维向量样本x1,Λ,xN来自具有均值μ和协方差C的多变量正态分布,其样本估计是和样本的随机选择表示为x0,相关平方马氏(Mahalanobis)距离

    D2=(x0-μ^N)TC^N-1(x0-μ^N)---(2)]]>

    可被表示成被分布为具有p和N-p-1自由度的中心F分布

    F=(N-p-1)ND2p(N-1)2-NpD2---(3)]]>

    然后,如果

    F>Fα;p,N-p-1                                 (4)

    则公共总体均值向量x0和剩余xi的无效假设将被拒绝,其中,Fα;p,N-P-1是具有自由度(p,N-p-1)的F分布的上α·100%点。

    现在假设选择x0作为具有最大D2统计量的观测值向量。来自大小为N的随机样本的最大D2的分布复杂。然而,可通过包法隆尼(Bonferroni)不等式来获得该临界值之上的百分之100α的保守近似值。因此,如果

    F>FαN;p,N-p-1---(5)]]>

    则我们可断定x0是异常值。

    实际上,等式(4)和等式(5)都可用于异常值检测。

    当附加数据xN+1可用时,在设计没有形成原始采样的部分的新样本的检验中,我们可以使用下面的均值和协方差的增量估计,即均值

    μ^N+1=1N+1{Nμ^N+xN+1}---(6)]]>

    和协方差

    C^N+1=NN+1C^N+N(N+1)2(xN+1-μ^N)(xN+1-μ^N)T.---(7)]]>

    通过使用表达式(6)和(7)以及矩阵求逆定理,用于N个采样参考集合和第N+1个检验点的等式(2)变成

    D2=σN+1TC^N+1-1σN+1---(8)]]>

    其中,

    σN+1=(xN+1-μ^N+1)=NN+1(xN+1-μ^N)|---(9)]]>

    C^N+1-1=N+1N(C^N-1-C^N-1(xN+1-μ^N)(xN+1-μ^N)TC^N-1N+1+(xN+1-μ^N)TC^N-1(xN+1-μ^N))---(10)]]>

    通过来表示(xN+1-μ^N)TC^N-1(xN+1-μ^N)|,]]>则

    D2=NDN+1,N2N+1+DN+1,N2---(11)]]>

    所以,可依据普通估计的均值和协方差的估计和假设的正态分布来检验新点xN+1。尽管发现多变量高斯特征向量的假设对许多应用是合适的适用选择,但多变量高斯特征向量的假设实际上通常不成立。在下面的部分中,我们放弃这种假设,并考虑任意密度。

    具有任意密度的特征向量:通过使用现有技术中已知的任何合适的半参数(例如,高斯混合模型)或非参数(例如,帕曾窗方法)密度估计方法,可从自任意密度p(x)中提取的有限数据样本获得概率密度估计然后,在计算对数似然比(1)中可采用该密度。与多变量高斯分布的情况不同,在无效假设下,不存在检验统计量(λ)的分析分布。所以,为了获得这种分布,可采用数字自抽样方法来获得估计的密度下的另外的非分析无效分布,所以,可从获得的经验分布中建立各种临界值λcrit。可以看出,在极限值N→∞,似然比可通过以下来估计

    λ=supθ∈ΘL0(θ)supθ∈ΘL1(θ)→p^(xN+1;θ^N)---(12)]]>

    其中,表示在通过原始N个样本估计的模型下的xN+1的概率密度。

    在从参考数据集合产生N个样本的B集合自抽样并使用其估计密度分布的参数之后,可通过随机选择第N+1个样本并计算p^(xN+1;θ^Ni)≈λcriti]]>来获得B自抽样复制的检验统计量λcriti,i=1,K,B.]]>通过以升序的方式对排序,可限定临界值α,从而如果λ≤λα,则在期望的显著水平拒绝无效假设,其中,λα是的第j个最小值,并且α=j/(B+1)。

    优选地,为不同的分段数,重复形成分类器的方法,并使用已知真伪的纸币的图像进行检验。然后,选择给出最佳性能并且对应分类参数的集合的分段的数量。我们发现,尽管可使用任何合适数量的分段,但是对于多数币种,分段的最佳数量大约是从2到15。

    图2是创建用于纸币验证的分类器22的设备20的示意图。它包括:

    ·输入21,配置以访问纸币图像的训练集合;

    ·处理器23,配置以使用训练集合图像来创建多个分割映射,每个分割映射具有不同的分段数;

    ·分割器24,配置以使用分割映射中的选择的一个来分割每个训练集合图像;

    ·特征提取器25,配置以从每个训练集合图像中的每个分段中提取一个或多个特征;

    ·处理器23还可被配置以使用分割器24和特征提取器25的结果为每个分割映射计算分类参数集合。

    ·分类形成装置26,配置以使用分类参数集合的第一选择的集合;以及

    ·适配器27,配置以用其他分类参数集合中的一个来代替第一选择的分类参数集合,

    其中,配置处理器以基于来自训练集合中所有图像的信息来创建分割映射。例如,通过使用上述空时图像分解。

    可选择地,用于创建所述分类器的设备还包括选择器,所述选择器通过估计每个分割映射的分类性能,来选择最佳分割映射和/或相关分类参数集合,以及一个或多个可选分割映射和/或相关分类参数集合。

    图3是纸币验证器31的示意图。它包括:

    ·输入,配置以接收将被验证的纸币的至少一个图像30;

    ·多个分割映射32,每个分割映射具有不同数量的分段,由在训练阶段确定的一个最佳分割映射和一个或多个可选择的分割映射组成。

    ·处理器33,配置以使用第一分割映射来分割纸币的图像;

    ·特征提取器34,配置以从纸币图像的每个分段中提取一个或多个特征;

    ·分类器35,配置以基于所提取的特征来将纸币分类为有效或无效;以及

    ·适配器36,配置以用其他分割映射中的一个来代替第一分割映射,并用与所述其他分割映射相关的分类器来代替该分类器;其中,分割映射是基于与纸币的训练图像的集合中的每一个有关的信息来形成的。注意,图3的装置不是必须相互独立,这些装置可以是一体的。

    图4是验证纸币的方法的流程图。所述方法包括:

    ·访问将被验证的纸币的至少一个图像(方框40);

    ·访问分割映射(方框41);

    ·使用分割映射来分割纸币的图像(方框42);

    ·从纸币图像的每个分段中提取特征(方框43);

    ·使用分类器基于所提取的特征来将纸币分类为有效或无效(方框44);

    其中,分割映射是基于与纸币的训练图像集合中每一个有关的信息来形成的。可以以现有技术中已知的任何合适的顺序或者组合来执行所述方法的这些步骤。分割映射可暗含包括与训练集合中的每个图像有关的信息,这是因为可基于所述信息来形成分割映射。然而,在分割映射中暗含的信息可以是具有像素地址列表的简单文件,其将被包括在每个分段中。

    图5是动态调整纸币验证器的方法的流程图。接收与可能被系统接受的假钞的出现有关的信息(参看方框50)。在纸币验证器处或在然后将该信息传达给一个或多个纸币验证器的中心管理位置接收该信息。例如,中心管理节点通过通信网络或以任何其他合适的方式将指令发布到纸币验证器。

    所述信息或接收的指令触发可选的存储的分割映射的激活(参看方框51)。该分割映射与先前使用的分割映射具有不同的数量(通常较高数量的分段)。可将该可选的分割映射预先本地化地存储在自助式设备中,或存储在服务器中,如果必要,所述服务器然后通过网络远程集中分发到受影响的设备。一旦激活所述可选的分割映射,则如参照图4所描述的分发来代替先前的分割映射。即,使用所述可选的分割映射来分割图像52。从每个分段中提取特征(参看方框53),并基于所提取的特征来对纸币进行分类(参看方框54)。每个存储的分割映射还可与预先计算的、存储的分类参数集合相关。在该情况下,接收的信息(方框50)可触发将在如这里所描述的用于对介质对象分类的分类器中使用的可选择的分类参数集合激活。

    尽管现在使用可选的分割映射,但开发者可创建新的分割映射来抗击伪造品的攻击,所述新的分割映射比所述可选的分割映射使用较少数量的分段。因此,在发生任何重新训练、模板开发和合成材料的发布(distribution)的同时,所述可选的分割映射的使用使得自动货币验证处理能够进行。

    在上述方法中,只创建和存储一个可选的分割映射。然而,可创建和存储多个具有不同数量的分段的这种可选分割映射。然后,可基于试验和误差,或基于以前的经验和/或关于正经历的特定伪造品攻击的详细信息,来选择使用那个可选的分割映射。

    另外,这里描述的方法关注分段的数量增加的情况。然而,分段的数量还可减少。例如,假设正使用的可选的模板具有15个分段。这招致相对高的处理成本和负担。稍后,防止假钞的源从而可返回具有较少分段的分割模板。

    以前,分割是单独基于空间位置,我们通过基于诸如训练集合中像素的像素亮度简档的特征值进行分割来对此进行改进。以这种方式,每个训练集合图像对分割都有影响。然而,以前,当使用网格分割时,不是这种情况。

    图12是具有纸币验证器123的自助式设备121的示意图。它包括:

    ·用于接受纸币的装置120;

    ·用于获得纸币的数字图像的成像装置122;以及

    ·如上所述的纸币验证器123。

    与成像装置一样,用于接受纸币的装置是现有技术中已知的任何合适类型。可使用特征选择算法来选择一种或多种特征以在提取特征步骤中使用。另外,除这里讨论的特征信息之外,还可基于与纸币的特定面额或币种有关的特定信息来形成分类器。例如,与在颜色方面数据显著丰富的区域的信息、在给定币种和面额中的形状或空间频率。

    可对纸币的图像或其他表示执行这里描述的方法,所述图像/表示是任何合适的类型。例如,红色、蓝色和绿色通道上的图像或如上所述的其他图像。

    可只基于一种类型(比如红色通道)的图像来形成分割。可选择地,可基于所有类型(比如红色、蓝色和绿色通道)的图像来形成分割映射。还可形成多个分割映射,对每种图像或者对多种图像类型的组合形成一个分割映射。例如,可能存在三个分割映射,一个分割映射用于红色通道图像,一个分割映射用于蓝色通道图像,一个分割映射用于绿色通道图像。在这种情况下,在单独的纸币验证期间,可依据所选图像的类型来使用合适的分割映射/分类器。因此,可通过使用不同类型的图像和相应的分割映射/分类器来修改上述每种方法。

    对于技术人员来说是显然的:在不丧失效果的情况下,可扩展或改变这里所给出的任何范围或装置值。

    应该理解,只作为示例给出了优选实施例的以上描述,本领域的技术人员可进行各种修改。

检测改进质量的伪造介质.pdf_第1页
第1页 / 共37页
检测改进质量的伪造介质.pdf_第2页
第2页 / 共37页
检测改进质量的伪造介质.pdf_第3页
第3页 / 共37页
点击查看更多>>
资源描述

《检测改进质量的伪造介质.pdf》由会员分享,可在线阅读,更多相关《检测改进质量的伪造介质.pdf(37页珍藏版)》请在专利查询网上搜索。

描述了一种创建用于介质验证的分类器的方法。使用来自真的介质对象的所有训练图像集合的信息来形成分割映射,然后所述分割映射用于分割每个训练集合图像。特征从分段中提取,并用于形成分类器,所述分类器优选地是单类统计分类器。例如,当所述介质是不同币种和面额的纸币时,以这种方式可快速并简单地形成分类器,并且不需要假钞的样本。描述了使用这种分类器的介质验证器以及使用这种分类器验证纸币的方法。在优选实施例中,形成。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 核算装置


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1