一种信息审核方法、装置及系统 【技术领域】
本发明涉及信息处理技术,尤其涉及一种信息审核方法、装置及系统。
背景技术
随着互联网的发展和使用人员的扩大,网站互动平台的呈现多元化,出现了各种不同的互动业务系统,如新闻评论、论坛、视频网站、博客等,由于各个业务系统的用途和上传内容不同,各个业务系统的审核机制也各不相同,因此,随着网络的多元化发展,审核人员对用户所提交信息的审核工作也日益复杂,审核人员在审核不同业务系统的信息时,需要在各个业务系统中切换,再根据各个业务系统的不同审核机制进行设置和分析,在业务系统的审核机制发生变化时,还需要相应调整设置和分析的方法。同时,由于每个业务系统都有自己的审核平台,对于审核和关键字匹配中的一些共性的东西还需要重复设置,不仅使工作效率底下,而且十分浪费资源。
综上,现有的对各个业务系统信息的审核机制,使得审核人员工作量大,操作复杂,难以提高工作效率,而且浪费资源。
【发明内容】
本发明实施例提供了一种信息审核方法、装置及系统,以减少审核人员的工作量,降低操作难度,提高工作效率,同时节省审核所占用的资源。
一种信息审核方法,包括如下步骤:
信息审核装置接收各个业务系统发送的文字信息,并根据设定的敏感关键字的敏感级别评定文字信息的敏感级别;
信息审核装置将文字信息及其对应的敏感级别返回各个业务系统,由各业务系统将文字信息及其敏感级别存储到数据库中;
信息审核装置从各个业务系统的数据库中采集设定敏感级别的文字信息;
信息审核装置将采集的设定敏感级别文字信息进行显示,并根据审核显示的文字信息的审核结果修改文字信息的属性,将带有属性的文字信息返回各个业务系统。
一种信息审核装置,包括:
信息过滤单元,用于接收各个业务系统发送的文字信息,并根据设定的敏感关键字的敏感级别评定文字信息的敏感级别,并将文字信息及其敏感级别返回各个业务系统的数据库中存储;
信息采集单元,用于采集各个业务系统存储的设定敏感级别的文字信息。
信息审核单元,用于将所述信息采集单元采集的文字信息进行显示,并根据审核显示的文字信息的审核结果修改文字信息的属性,将带有属性的文字信息返回各个业务系统。
一种信息审核系统,包括:
业务系统,用于接收用户提交的文字信息并发送;接收文字信息及其敏感级别并存储;根据文字信息的属性和业务系统的规则对文字信息进行处理;
信息审核装置,用于接收业务系统发送的信息,根据设定的敏感关键字的敏感级别评定信息中文字信息的敏感级别,再将文字信息及其对应的敏感级别返回所述业务系统;从各个业务系统的数据库中采集设定敏感级别的文字信息进行显示,并根据审核显示的文字信息的审核结果修改文字信息的属性,将带有属性的文字信息返回各个业务系统。
本发明实施例将不同业务系统中的信息发送到信息审核装置,集中进行审核,使得审核人员在一个平台中即可审核各个业务系统的内容,减少了在各个业务系统间的切换,减少了审核人员的工作量,降低了审核人员的操作难度,且各个业务系统使用一个信息审核装置,不需再为每个业务系统配置审核平台,节省了审核占用的资源。
【附图说明】
图1为本发明实施例中进行信息审核的流程图;
图2为本发明实施例中审核人员审核信息的流程图;
图3为本发明实施例中信息审核装置地结构图;
图4为本发明实施例中信息审核系统的结构图。
【具体实施方式】
本发明实施例提供了一种信息审核的方法,将各个业务系统提交的信息集中起来进行统一审核。在用户提交一条信息后,若是文字信息,则先对这条文字信息进行关键字匹配,即对于提交的文字信息,使用预先存储的关键字进行匹配,然后评定出这条文字信息的敏感级别,再根据敏感级别进行审核,若是图片、视频等其它信息,则不进行关键字匹配,直接进行审核。
如图1所示,信息审核装置对信息的审核主要包括如下步骤:
步骤S101、各个业务系统收到用户提交的信息后,判断该信息是否包含图片或视频等内容,如果包含图片、视频等内容,则将其标识为未评定敏感级别的信息,如果不包含图片、视频等信息,仅为文字信息,则直接将信息发送给统一信息审核装置,统一信息审核装置接收各个业务系统发送的文字信息后根据设定的敏感关键字的敏感级别评定文字信息的敏感级别,评定时可以采用统一进行关键字匹配的方式,对文字信息进行关键字匹配的过程是对用户提交的文字信息和预先存储的关键字进行匹配,看用户提交的文字信息中是否包含这些关键字,并根据信息中所包含的关键字评定敏感级别。匹配时,可以利用模糊匹配的规则,即只要某句话中包含“抢”、“劫”两个字,就算做其包含“抢劫”这一关键字。
设置关键字时,可以设置关键字的敏感级别,比如说将“海啸”、“地震”设为二级,将“抢劫”设为一级等,如果信息中包括二级的关键字,就将该信息的敏感级别设为二级,如果信息中包括一级的关键字,就将该信息的敏感级别设为一级,如果同时包含几个级别的关键字,就将该信息的级别设为这几个级别中较高的级别,比如一条信息中同时包含“海啸”和“抢劫”,那么由于抢劫级别较高,这条信息的敏感级别就是抢劫的敏感级别,为一级。
步骤S102、将进行关键字匹配后的信息及其敏感级别返回给各个业务系统的数据库中储存,返回信息时,已将信息中的敏感词做出标识,以便于各个业务系统识别出敏感词,做相应的处理。各个业务系统根据敏感级别的情况将信息发表,发表时可以设置一个参考级别,若敏感级别高于参考级别,则不进行发表或将敏感词用特殊符号代替后发表,如使用“*”代替敏感词,若敏感级别低于参考级别,则暂时进行发表,各个业务系统还会记录信息审核装置评定的敏感级别和用户提交信息的时间,以便提取时的查找。
步骤S103、信息审核装置采集各个业务系统数据库中的待审核信息,待审核信息为审核人员设定的敏感级别的信息和未评定敏感级别的信息,根据审核人员的设定,可以只采集某一个敏感级别的信息,也可以采集几个敏感级别的信息,还可以设定一个敏感级别限制,高于或等于这个敏感级别的信息就都会被采集。
在有些情况下,已审核的信息如果有必要重新审核,也会由审核人员指定采集并重新审核。
采集信息时,采用无侵入式的采集方式,即在配置业务系统时,装载业务系统的数据库驱动,采用该业务系统的存取规则读取其数据库中的数据,不破坏各个业务系统的结构和代码,可以方便的进行管理,节省平台成本。
为方便审核人员的审核,采集后的信息存储在信息审核装置的缓存中,并在缓存中进行混合排列,排列时,忽略各个业务系统的区分,只按照敏感级别和信息的提交时间来排列,可以优先考虑敏感级别,先按敏感级别排序后,再在相同敏感级别的信息中进行按提交时间的排序,或者也可以优先考虑提交的时间,先按照提交时间的时间段排序,再在同一时间段中按照敏感级别排序。
信息的采集一般设置成周期性采集,即每隔一段时间在各个业务系统中采集一次信息,刷新缓存中的排列和审核页面,采集的周期可以根据实际情况进行设置,信息审核装置在两次采集之间时若接收到审核人员发出的刷新指令,也会立刻进行一次采集,当然,也可以不设置采集周期,仅仅在信息审核装置接收到审核人员发出的刷新指令时,才进行信息的采集。
步骤S104、信息审核装置将缓存中的待审核信息显示出来,供审核人员审核并根据审核人员反馈的审核结果修改信息属性,如:审核通过或审核不通过,或者也可以为较敏感的信息进行打分,将带有属性的信息返回给各个业务系统,各个业务系统根据信息的属性对信息进行相应的处理。
由于在进行业务系统的初始加载时,需要根据业务系统的实际情况进行配置,即配置加载的业务系统的操作内容和各项内容的操作规则,加载后,信息审核装置在显示该系统的信息同时,还会显示可对这条信息进行的操作的选项和按钮,不同业务系统中的信息,可进行的操作不同,显示的选项和按钮也不同,如:有些业务系统的信息审核采用打分的规则,则将属于这些业务系统的信息显示给审核人员审核时,同时显示给审核人员打分的操作项,审核人员审核后就会对审核的信息进行打分;而有些业务系统的信息审核只是简单的通过和不通过,审核人员审核后只要选择通过或不通过即可。审核人员进行相应的操作后,信息审核装置会根据该业务系统的操作规则来对这条信息进行属性的更改,如在属性中加入该信息的分数或是否通过等,将信息及其属性返回业务平台后,由信息所属的业务平台根据自己的规则进行处理,由于是采用了该信息所属业务系统的操作规则来进行操作,所以审核人员在信息审核装置对信息的操作和在业务系统中操作效果是一样的,无需对业务平台进行配置和改动。
对于同样使用打分规则的业务系统,将信息和属性返回后不同的业务系统操作也可能不同,有的业务系统对信息的敏感程度要求不高,比如博客、论坛等,根据审核人员给这条信息的分数进行选择时,就可以将分数线设定的较低,若将分数线设定为50分,则超过50分的信息都可以发表;而新闻评论等板块可能对信息的敏感程度要求很高,根据审核人员给这条信息的分数进行选择时,就可以将分数线设定的较高,比如说将分数线设定为80分,则超过80根的信息才可以发表。这些都根据业务系统自己的设置完成,信息审核装置只要按照审核人员审核的结果标识属性即可,不需要根据业务系统的敏感程度要求调整打分的标准。
把待审核信息显示给审核人员时,可以将缓存中的待审核信息全部显示出来,也可以只显示一部分,在缓存中信息较多时,一般设置一个显示数量,如果设置为100,则显示排列在前面的100条信息。
对于需审核的文字信息,可以将其中包含的敏感词突出显示,以便于审核人员的审核,例如,可以将敏感词用其他颜色显示、加粗显示或使用其他颜色的背景等,这样可以便于审核人员定位敏感词的位置,提高审核效率。
对于包含图片和/或视频内容的信息,也可以先对文字部分进行关键字匹配并评定敏感级别,再将该信息标识为包含图片和/或视频内容的信息。包含图片和/或视频内容的信息即使不包含任何敏感词,也会被采集以供审核人员审核。
在审核时,对于视频信息,可以获取视频中按时间分割的图片,审核时只要审核视频中的图片即可,分割的时间根据实际需要来设定,但不宜过长也不宜过短,过长则可能会漏掉有害内容,过短则会增加审核人员的工作量。
如图2所示,对信息的审核包括如下步骤:
步骤S201审核人员登录信息审核装置,信息审核装置对审核人员身份进行鉴权。
可以为每一个审核人员分配用户名和密码,对审核人员的鉴权可包括两个步骤,先验证该用户名和密码是否正确,即验证其是否具备信息审核的权限,再验证该用户名的权限,即该用户可以审核哪些业务系统。
S202、鉴权通过后,提取该用户可审核应用系统的缓存数据,从缓存数据中获得各个业务系统的操作类型和操作内容,根据提取的缓存数据在信息审核装置界面中显示相应的操作,由于各业务系统不同,操作的类型有多种,操作的内容也各有特点,比如说打分制度、评级制度、单纯的是否通过等。
步骤S203、信息审核装置使用业务系统的规则在各个业务系统的数据库中采集待审核的信息,保存在缓存中,并按照信息的提交时间和敏感级别进行排列,根据不同审核人员的习惯,可按照不同顺序排列,可以先按照敏感级别排序,再在同种敏感级别中按提交时间排列,也可以先按时间段排列,再在同一时间段中按敏感级别进行排列,按敏感级别排列时,可以把敏感级别较高的排在前面,也可以把敏感级别较低的排在前面,这些都可以根据审核人员的习惯进行个性化的设置,以方便审核人员的审核。
采集待审核信息的时间间隔同样可由审核人员来设置,若设置为10分钟,则每过10分钟,信息审核装置都会自动从各个业务平台采集待审核信息并刷新信息审核装置的信息列表,当然,在两次采集间隙中,审核人员也可以命令信息审核装置进行信息采集。
步骤S204、审核人员提交审核结果后,根据审核人员审核信息的审核结果对信息进行相应的操作,即设置信息的属性。
审核人员只要根据对信息审核的结果进行相应的操作即可,信息审核装置接收到审核人员的操作指令后,就会按照相应的规则进行属性的设置。
步骤S205、审核人员提交对信息的属性设置后,信息审核装置将带有属性的信息返回其应用系统,由业务系统根据信息的属性按照起自己的规则对信息进行处置。
信息返回应用系统后,立即从信息审核装置的缓存中删除,以节约信息审核装置的缓存空间。
本发明实施例提供一种信息审核装置,实现将各个业务系统提交的信息集中起来进行统一审核。如图3所示,该信息审核装置包括:信息过滤单元301、信息采集单元302、信息审核单元303和数据缓存单元304。
信息过滤单元301,用于接收各个业务系统发送的文字信息,将接收到的文字信息和预先设置的关键字进行匹配并根据信息所包含关键字的敏感级别评定文字信息的敏感级别。进行关键字匹配时参照的关键字及关键字的敏感级别由审核人员预先制定,关键字匹配后,将信息及其敏感级别返回其所属业务系统,返回时,将信息中所包含的敏感词标识出来,以便于各个业务系统进行处理。
信息采集单元302,用于采集各个业务系统数据库中未经过关键字匹配的信息和设定敏感级别的信息并保存在数据缓存单元304中,进行采集的敏感级别由审核人员进行设定。
信息采集单元302中包括针对各个业务系统数据库的信息采集子单元,在采集业务系统数据库中的信息时,由针对这个业务系统的信息采集子单元来完成,由于针对这个业务系统的信息采集子单元中装载了这个业务系统数据库的驱动,因此可以按照这个业务系统数据库的存取方式来读取信息。这种无侵入式的采集方式,不改变各个业务系统的结构和代码,可方便的进行管理,节省平台成本。
信息审核单元303,用于从数据缓存单元304中获得各个应用系统的操作类型和操作内容,根据提取的缓存数据在信息审核装置界面中显示相应的操作,并显示数据缓存单元304中的信息,以供审核人员审核,审核后,根据审核人员审核的结果对信息的属性进行相应设置。
数据缓存单元304,用于存储各个业务系统的操作内容、规则等数据,以及暂时存储信息采集单元302采集的待审核信息并按照信息的敏感级别和提交时间将这些信息进行排列,一旦一条信息审核完毕返回其业务系统,数据缓存单元304不再存储该信息。
为了保证信息审核的安全,可以对审核人员进行鉴权,此时该信息审核装置还包括:
鉴权单元,用于对审核人员进行鉴权,可以为每个审核人员配置一个登录信息审核装置的用户名和密码,并对每个用户名设置相应的权限,如:某些用户名只能审核论坛、博客而不能审核新闻评论,有些用户名都可以审核。这些鉴权信息可以存储在数据缓存单元304中。
本发明实施例还提供一种信息审核的系统,如图4所示,系统中包括各个业务系统和信息审核装置,其中:
业务系统,用于接收用户提交的文字信息并发送给信息审核装置;接收信息审核装置返回的文字信息及其敏感级别并存储;根据信息审核装置返回的文字信息的属性和业务系统自己的规则对文字信息进行处理;
信息审核装置,用于接收业务系统发送的信息,根据设定的敏感关键字的敏感级别评定信息中文字信息的敏感级别,即将文字信息的内容和预先设定的关键字进行匹配,根据文字信息中所包含的关键字的敏感级别确定文字信息的敏感级别,再将文字信息及其对应的敏感级别返回业务系统;从各个业务系统的数据库中采集设定敏感级别的文字信息显示给审核人员,并接收审核人员审核后的审核结果,并根据审核人员审核后的审核结果修改文字信息的属性,将文字信息及其属性返回业务系统。
根据不同业务系统的规则和发表要求,业务系统在接收到信息审核装置返回的文字信息及其对应的敏感级别后还用于,将文字信息发表;或者
发表敏感级别低于设置的参考级别的文字信息,不发表敏感级别高于设置的参考级别的文字信息;或者
将敏感级别高于设置的参考级别的文字信息中的关键字用符号代替后发表。
为使包含图片和/或视频等内容的不能进行关键字匹配的其它信息也得到审核人员的审核,并且减少业务系统和信息审核装置的交互次数,此时:
业务系统还用于,在发送文字信息之前,接收用户提交的内容,并判断用户提交的内容是否为不包含图片和/或视频的文字信息,如果是,向信息审核装置发送文字信息,否则将用户提交的信息作为未评定敏感级别的其它信息存储到数据库中。
审核包含图片和/或视频等内容的其它信息时,
信息审核装置还用于,从各业务系统的数据库中采集未评定敏感级别的其它信息,并显示给审核人员进行审核;接收审核人员审核后提交的其它信息的审核结果,根据审核人员审核后提交的其它信息的审核结果修改其它信息的属性,并将带有属性的其它信息返回各个业务系统;
业务系统还用于,根据其它信息的属性和各业务系统的标准将其它信息进行处理。
由于对信息敏感程度的要求不同,个业务系统对于发表的规则也不相同,因此,业务系统还用于,在接收到信息审核装置返回的文字信息或其它信息及其属性后,按照业务系统的规则和信息审核装置返回的文字信息或其它信息及其属性确定对文字信息或其它信息的操作。
为了在采集信息时,不破坏业务系统的结构和代码,采用无侵入式采集,在信息审核装置中配置各个业务系统数据库的驱动,此时,信息审核装置还用于,在从各个业务系统数据库中采集文字信息或其它信息时,采用各业务系统数据库的存取规则读取。
信息审核装置在从各个业务系统数据库中采集文字信息或其它信息具体包括:按照设置的周期进行采集或根据接收到的审核人员的刷新指令采集。
信息审核装置还用于,在审核信息时,每条信息显示的操作内容和操作规则根据信息所属的业务系统设置。这样,审核人员对所审核的信息进行的操作采用的是信息所属业务系统中的操作规则,便于信息及审核结果返回业务系统后业务系统对信息和审核结果的识别和处理。
本发明实施例将不同业务系统中的信息发送到信息审核装置,集中进行关键字匹配、审核,使得审核人员在一个平台中即可审核各个业务系统的内容,减少了在各个业务系统间的切换,减少了审核人员的工作量,降低了审核人员的操作难度,且各个业务系统使用一个信息审核装置,不需再为每个业务系统配置审核平台,节省了审核占用的资源。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。