供应商投标文件资质信息审核系统及方法技术领域
本发明属于信息处理技术领域,具体涉及一种供应商投标文件资质信息审核系
统,还涉及一种供应商投标文件资质信息审核方法。
背景技术
电力企业对供应商投标文件资质信息审核时,部分特定标段需要对供应商的强制
性产品认证信息(简称“CCC”认证信息)进行真实性核实。在传统的评标过程中,鉴于现有的
供应商资质业绩核实库尚未覆盖该部分信息,因此,评标依据完全依赖供应商提供的投标
文件和评审专家的主观判断,存在一定的主观性和风险。同时,由于电力企业的特性,评标
过程必须要求封闭的内网系统环境,严禁任何外部网站信息的流入。
基于上述两项需求,急需开发供应商投标文件资质信息审核系统。在正式开展评
标工作前期,由相关专业人员利用此供应商投标文件资质信息审核系统自动抓取发布在政
府公开网站上的供应商“CCC”认证信息,与从投标文件中抓取的供应商“CCC”证书信息进行
真实性比对;同时,系统支持人工审查比对结果,当确定比对结果无误后,将比对结果导出
系统,并人工导入封闭的评标系统数据库,为评标专家提供科学参考,在提高评标正确性的
同时,也显著提升了评标工作效率。
发明内容
本发明的目的在于克服现有技术中的不足,提供了一种供应商投标文件资质信息
审核系统及方法,自动抓取官网的认证证书信息来审核供应商“CCC”认证信息的真实性,降
低了评标主观风险,有利于选拔优质供应商,为供应商履约等后续环节奠定良好的基础。
为解决上述技术问题,本发明提供了一种供应商投标文件资质信息审核系统,其
特征是,包括导入报名清单模块、公开认证信息抓取模块、投标认证信息抓取模块、认证信
息核实模块和统计报表模块;其中,
导入报名清单模块,用于导入投标人报名清单,采集各投标人获得相应的待抓取标识;
公开认证信息抓取模块,用于自动访问政府公开认证信息查询网站并依据待抓取标识
从网页中抓取投标人的公开认证信息;
投标认证信息抓取模块,用于依据待抓取标识读取投标文件并从中抓取投标人的投标
认证信息;
认证信息核实模块,用于核实投标人的公开认证信息与投标认证信息是否一致;
统计报表模块,用于统计各投标人认证信息核实结果,并导出生成报表。
进一步的,公开认证信息抓取模块包括网络爬虫抓取模块和图形识别模块,网络
爬虫抓取模块用于通过网络爬虫自动访问政府公开认证信息查询网站并抓取网页中验证
码图片,基于待抓取标识和验证码识别结果查询出投标人的公开认证信息;图形识别模块,
用于识别验证码图片获取其中文字和运算符号输出至网络爬虫抓取模块。
相应的,本发明还提供了一种供应商投标文件资质信息审核方法,包括如下步骤:
步骤一,导入投标人报名清单,采集各投标人获得相应的待抓取标识;
步骤二,采用网络爬虫自动访问政府公开认证信息查询网站并依据待抓取标识从网页
中抓取投标人的公开认证信息;
步骤三,依据待抓取标识读取投标文件并从中抓取投标人的投标认证信息;
步骤四,核实投标人的公开认证信息与投标认证信息是否一致;
步骤五,统计各投标人认证信息核实结果,并导出生成报表。
进一步的,采用网络爬虫抓取投标人的公开认证信息的具体过程包括:
1)自动访问政府公开认证信息查询网站,捕获动态生成的验证码图片,验证码图片中
包括大写数字和运算符号组成的算式;
2)对验证码图片进行图形识别;
3)如果识别成功,则获取图片中的文字和运算符号,进入下一步;若识别失败则返回1)
进行重新获取验证码图片;
4)将大写数字转换为阿拉伯数字,基于阿拉伯数字和运算符号计算出算式结果,进入
下一步;如果算式结果异常,则返回1)进行重新获取验证码图片;
5)基于算式结果和待抓取标识,在政府公开认证信息查询网站进行检索,获得认证证
书信息。
与现有技术相比,本发明所达到的有益效果是:本发明采用自动抓取的官网认证
证书信息来审核供应商“CCC”认证信息的真实性,一方面,降低了评标主观风险,有利于选
拔优质供应商,为供应商履约等后续环节奠定良好的基础;另一方面,在评标前,利用供应
商投标文件资质信息审核系统的关键信息自动抓取、比对及审核等功能,得出系统比对结
果和判断依据,将人工核实过程的正确结果导出,作为评标的客观依据,进而显著降低了评
标专家的工作量,且在提高评标正确性的同时,提升了评标工作量;此外,网络爬虫技术和
验证码识别技术在外部合作网站的有效利用,为电力企业有效收集、分类信息提供了新思
路。
附图说明
图1是本发明审核系统的原理框图;
图2是认证认可业务信息统一查询平台的首页图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明
的技术方案,而不能以此来限制本发明的保护范围。
电力企业对供应商投标文件资质信息审核时,主要是对供应商的 “CCC”认证信息
进行真实性核实,即是将发布在政府公开认证信息查询网站上的供应商“CCC”认证信息(简
称公开认证信息),与供应商在投标文件中填写的 “CCC”证书信息(简称投标认证信息)进
行真实性比对,若两者认证信息相同,则表明供应商填写的投标认证信息是真实的。
本发明的供应商投标文件资质信息审核系统(简称审核系统),原理框图如图1所
示,包括导入报名清单模块、公开认证信息抓取模块、投标认证信息抓取模块、认证信息核
实模块和统计报表模块;其中,
导入报名清单模块,用于导入投标人报名清单,采集各投标人获得相应的待抓取标识;
公开认证信息抓取模块,用于自动访问政府公开认证信息查询网站并依据待抓取标识
从网页中抓取投标人的公开认证信息;
投标认证信息抓取模块,用于依据待抓取标识读取投标文件并从中抓取投标人的投标
认证信息;
认证信息核实模块,用于核实投标人的公开认证信息与投标认证信息是否一致;
统计报表模块,用于统计各投标人认证信息核实结果,并导出生成报表。
进一步的,公开认证信息抓取模块包括网络爬虫抓取模块和图形识别模块,网络
爬虫抓取模块采用网络爬虫自动访问政府公开认证信息查询网站并抓取网页中验证码图
片,基于待抓取标识和验证码识别结果查询出投标人的公开认证信息;图形识别模块,用于
识别验证码图片获取其中文字和算术符号输出至网络爬虫抓取模块。
本发明的供应商投标文件资质信息审核方法,其过程参考图1,包括如下步骤:
步骤一,导入投标人报名清单,采集各投标人获得相应的待抓取标识;
所有供应商投标文件存储在本地系统的数据库中,审核系统通过导入报名清单模块导
入对应批次招标工作的投标人报名清单,采集各投标人信息生成相应投标人待抓取标识,
此待抓取标识可以是投标人(供应商)的企业名称。
步骤二,通过网络爬虫自动访问政府公开认证信息查询网站并依据待抓取标识从
网页中抓取投标人的公开认证信息;
审核系统通过网络爬虫自动获取政府官方认证信息查询网站上各投标人的“CCC”认证
信息。此处政府官方认证信息查询网站是指公开各投标人的“CCC”认证信息的官方网站,现
有技术中此类认证信息可以直接查询“认证认可业务信息统一查询平台”官方网址以获取
“CCC”认证信息。现有技术中,“认证认可业务信息统一查询平台”官方网站为了提高网站的
安全性,往往采用验证码技术,只有正确识别出验证码图片才能继续搜索查询。“认证认可
业务信息统一查询平台”的访问网页如图2所示,需要正确填写“获证组织名称”和“验证
码”,此验证码是图片,图片中显示的是大写数字的算术题,在验证码的方框中需要填写的
是与算式结果相应的阿拉伯数字。
下面以通过网页爬虫自动访问“认证认可业务信息统一查询平台”并从网页中抓
取投标人的公开认证信息为例,来详细说明此抓取过程:
1)自动访问目标网站“认证认可业务信息统一查询平台”,获取首页信息,并捕获动态
生成的验证码图片;
2)对验证码图片进行图形识别,此图形识别实现方式是调用现有技术中OneNote图形
识别组件的图形识别功能进行处理;
3)如果识别成功,则获取图片中的文字和运算符号,进入下一步;若识别失败则返回1)
进行重新获取验证码图片;
4)图片中的文字是大写数字,将大写数字转换为阿拉伯数字,基于阿拉伯数字和运算
符号计算出算式结果(通常应为正整数),进入下一步;如果算式结果异常,则返回1)进行重
新获取验证码图片;
5)将算式结果填写到“验证码”输入框中,在“获证组织名称”输入框中填写供应商名称
(待抓取标识),进行检索;
6)读取页面上加载出来的供应商“CCC”认证证书列表,并点击查看,最终抓取查看页上
的详细供应商“CCC”认证证书信息。
步骤三,依据待抓取标识读取投标文件并从中抓取投标人的投标认证信息;
供应商投标文件存放在本地系统中,通过FSO(文件系统)读取含有认证信息的word文
件,从中抓取投标认证信息。
步骤四,核实投标人的公开认证信息与投标认证信息是否一致;
抓取完毕后,审核系统会进行自动核实认证信息的关键字段。已知“CCC”认证信息是关
键5项字段,对公开认证信息和投标认证信息中对应的每项字段核实是否一致,获得核实结
果;审核人也可以对核实结果进行最终确认,对于文字不一致但语义一致的情况进行纠正。
步骤五,统计各投标人认证信息核实结果,并导出生成报表。
根据投标人,批次,标段下两个来源证书信息核实结果生成核实情况统计报表。
本发明采用自动抓取的官网认证证书信息来审核供应商“CCC”认证信息的真实
性,一方面,降低了评标主观风险,有利于选拔优质供应商,为供应商履约等后续环节奠定
良好的基础;另一方面,在评标前,利用供应商投标文件资质信息审核系统的关键信息自动
抓取、比对及审核等功能,得出系统比对结果和判断依据,将人工核实过程的正确结果导
出,作为评标的客观依据,进而显著降低了评标专家的工作量,且在提高评标正确性的同
时,提升了评标工作量。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人
员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型
也应视为本发明的保护范围。