《知识库数据更新方法、系统及知识库.pdf》由会员分享,可在线阅读,更多相关《知识库数据更新方法、系统及知识库.pdf(10页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103177092 A(43)申请公布日 2013.06.26CN103177092A*CN103177092A*(21)申请号 201310075900.8(22)申请日 2013.03.08G06F 17/30(2006.01)(71)申请人深圳先进技术研究院地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号(72)发明人朱定局(74)专利代理机构广州华进联合专利商标代理有限公司 44224代理人吴平(54) 发明名称知识库数据更新方法、系统及知识库(57) 摘要一种知识库数据更新方法,获取用户对数据信息的反馈信息,读取数据信息对应的可信度及反馈次。
2、数,再根据数据信息对应的可信度、反馈次数及反馈信息更新可信度。因此,知识库中数据信息的可信度不是固定不变的,而是参照使用者即用户的反馈信息进行更新,从而使得知识库中的数据信息可随着人们认识水平的提高而得到优化。由于上述知识库数据更新方法及系统使知识库中数据信息的可信度更加准确,故对上述知识库进行数据访问时,可有效提高数据访问的准确率。此外,本发明还提供一种知识库数据更新方法及知识库。(51)Int.Cl.权利要求书2页 说明书5页 附图2页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书2页 说明书5页 附图2页(10)申请公布号 CN 103177092 ACN 10317。
3、7092 A1/2页21.一种知识库数据更新方法,用于对知识库中的数据信息进行更新,所述数据信息对应一个可信度及反馈次数,其特征在于,所述方法包括以下步骤:获取用户对所述数据信息的反馈信息;读取所述数据信息对应的可信度及反馈次数;根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度。2.根据权利要求1所述的知识库数据更新方法,其特征在于,所述根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度的方式为:B=(b*k+c)/(k+1)其中,b和k分别为读取到的所述数据信息对应的可信度及反馈次数,c为用户对所述数据信息的反馈信息,B为更新后的可信度。3.根据权利要求1所。
4、述的知识库数据更新方法,其特征在于,在所述根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度的步骤之后,所述方法还包括:根据所述可信度的大小,对所述数据信息进行重新排序。4.根据权利要求1或3所述的知识库数据更新方法,其特征在于,在所述根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度的步骤之后,所述方法还包括:将所述可信度与预设的阈值相比较,并将可信度小于所述阈值的数据信息删除。5.一种知识库更新系统,用于对知识库中的数据信息进行更新,所述数据信息对应一个可信度及反馈次数,其特征在于,所述系统包括:反馈接收模块,用于获取用户对所述数据信息的反馈信息;读取模块,。
5、用于读取所述数据信息对应的可信度及反馈次数;可信度更新模块,用于根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度。6.根据权利要求5所述的知识库数据更新系统,其特征在于,所述可信度更新模块更新所述可信度的方式为:B=(b*k+c)/(k+1)其中,b和k分别为读取到的所述数据信息对应的可信度及反馈次数,c为用户对所述数据信息的反馈信息,B为更新后的可信度。7.根据权利要求5所述的知识库数据更新系统,其特征在于,还包括重排序模块,重排序模块用于根据所述可信度的大小,对所述数据信息进行重新排序。8.根据权利要求5或7所述的知识库数据更新系统,其特征在于,还包括数据剔除模块,所述数。
6、据剔除模块用于将所述可信度与预设的阈值相比较,并将可信度小于所述阈值的数据信息删除。9.一种知识库,其特征在于,包括:如上述权利要求58任一项所述的知识库更新系统;请求处理模块,用于接收用户的处理请求,并获取与所述处理请求匹配且可信度最大的数据信息;数据输出模块,用于将获取的所述数据信息返回至用户。权 利 要 求 书CN 103177092 A2/2页310.根据权利要求9所述的知识库,其特征在于,所述请求处理模块包括:匹配单元,用于在知识库中查找与所述处理请求匹配的数据信息;选择单元,用于从所述匹配的数据信息进行筛选,选取其中可信度最大的数据信息。权 利 要 求 书CN 103177092 。
7、A1/5页4知识库数据更新方法、 系统及知识库技术领域0001 本发明涉及数据处理技术,特别是涉及一种知识库数据更新方法、系统及知识库。背景技术0002 知识库(Knowledge Base),又称为智能数据库或人工智能数据库。知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。0003 知识库中的数据信息都对应一个可信度,可。
8、信度用于表示数据信息的准确性。在调用知识库中的数据信息时,一般选取可信度最高的。传统的知识库都是由专家根据经验,预先输入相关的数据信息。因此,知识库中的数据信息的内容及存储结构在使用过程中是不变的。而由于人们认识水平有限,预先输入知识库中的数据信息不一定最准确,从而导致知识库中的数据信息真实的可信度会发生变化。然而,由于数据信息的内容及存储结构为固定的,在访问知识库中的数据信息时,依然按照数据信息原先对应的可信度进行搜索和筛选,从而使得数据访问的准确率不高。发明内容0004 基于此,有必要提供一种可有效提高数据访问的准确率的知识库数据更新方法、系统及知识库。0005 一种知识库数据更新方法,用。
9、于对知识库中的数据信息进行更新,所述数据信息对应一个可信度及反馈次数,所述方法包括以下步骤:0006 获取用户对所述数据信息的反馈信息;0007 读取所述数据信息对应的可信度及反馈次数;0008 根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度。0009 在其中一个实施例中,所述根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度的方式为:0010 B=(b*k+c)/(k+1)0011 其中,b和k分别为读取到的所述数据信息对应的可信度及反馈次数,c为用户对所述数据信息的反馈信息,B为更新后的可信度。0012 在其中一个实施例中,在所述根据所述数据信息对应的可。
10、信度、反馈次数及所述反馈信息更新所述可信度的步骤之后,所述方法还包括:0013 根据所述可信度的大小,对所述数据信息进行重新排序。0014 在其中一个实施例中,在所述根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度的步骤之后,所述方法还包括:0015 将所述可信度与预设的阈值相比较,并将可信度小于所述阈值的数据信息删除。说 明 书CN 103177092 A2/5页50016 一种知识库更新系统,用于对知识库中的数据信息进行更新,所述数据信息对应一个可信度及反馈次数,所述系统包括:0017 反馈接收模块,用于获取用户对所述数据信息的反馈信息;0018 读取模块,用于读取所述数。
11、据信息对应的可信度及反馈次数;0019 可信度更新模块,用于根据所述数据信息对应的可信度、反馈次数及所述反馈信息更新所述可信度。0020 在其中一个实施例中,所述可信度更新模块更新所述可信度的方式为:0021 B=(b*k+c)/(k+1)0022 其中,b和k分别为读取到的所述数据信息对应的可信度及反馈次数,c为用户对所述数据信息的反馈信息,B为更新后的可信度。0023 在其中一个实施例中,还包括重排序模块,重排序模块用于根据所述可信度的大小,对所述数据信息进行重新排序。0024 在其中一个实施例中,还包括数据剔除模块,所述数据剔除模块用于将所述可信度与预设的阈值相比较,并将可信度小于所述阈。
12、值的数据信息删除。0025 一种知识库,包括:0026 如上述优选实施例中任一项所述的知识库更新系统;0027 请求处理模块,用于接收用户的处理请求,并获取与所述处理请求匹配且可信度最大的数据信息;0028 数据输出模块,用于将获取的所述数据信息返回至用户。0029 在其中一个实施例中,所述请求处理模块包括:0030 匹配单元,用于在知识库中查找与所述处理请求匹配的数据信息;0031 选择单元,用于从所述匹配的数据信息进行筛选,选取其中可信度最大的数据信息。0032 上述知识库数据更新方法及系统,获取用户对数据信息的反馈信息,读取数据信息对应的可信度及反馈次数,再根据数据信息对应的可信度、反馈。
13、次数及反馈信息更新可信度。因此,知识库中数据信息的可信度不是固定不变的,而是参照使用者即用户的反馈信息进行更新,从而使得知识库中的数据信息可随着人们认识水平的提高而得到优化。由于上述知识库数据更新方法及系统使知识库中数据信息的可信度更加准确,故对上述知识库进行数据访问时,可有效提高数据访问的准确率。附图说明0033 图1为本发明一个实施例中知识库数据更新方法的流程示意图;0034 图2为本发明一个实施例中知识库数据更新系统的模块示意图;0035 图3为本发明另一个实施例中知识库数据更新系统的模块示意图;0036 图4为本发明一个实施例中知识库的模块示意图。具体实施方式0037 请参阅图1,在一。
14、个实施例中,一种知识库数据更新方法,包括以下步骤:0038 步骤S110,获取用户对数据信息的反馈信息。说 明 书CN 103177092 A3/5页60039 在一个实施例中,可在向用户提供数据信息时,提示用户输入对该数据信息的反馈信息。反馈信息为用户对该数据信息准确性(即可信度)的评价。例如,在用户界面上显示输入框,并提示用户输入0100%之间的数值。若获得用户的输入数值为60%,则表示该用户认为该数据信息的可信度为60%。此外,还可在用户界面上显示多个选项(如可信、不可信、不确定等,并为每个选项对应设置量化的表示可信度的数值),从而便可通过获取用户与特定选项的交互操作获取用户对该数据信息。
15、的反馈信息。0040 步骤S120,读取数据信息对应的可信度及反馈次数。0041 在一个实施例中,知识库中的数据信息均对应一个可信度,在构建知识库时,设计人员根据现有经验对每个数据信息的可信度赋予一个初始值。每个数据信息的可信度均为变量,可根据针对该数据信息的反馈信息进行更新。知识库中的数据信息还对应反馈次数,反馈次数即获取用户对该数据信息的反馈信息的次数,反馈次数的初始值均为0。反馈次数也为变量,每获取一次对该数据信息的反馈信息,则该数据信息对应的反馈次数在原有基础上加1。0042 因此,通过数据信息在知识库中进行查询,便可得到该数据信息的可信度及反馈次数。0043 步骤S130,根据数据信。
16、息对应的可信度、反馈次数及反馈信息更新可信度。0044 具体的,由于反馈信息是对数据信息可信度的评价,因此,在获取针对该数据信息的反馈信息后,需要对该数据信息对应的可信度进行重新设置,以使可信度保持有效。在一个实施例中,根据数据信息对应的可信度、反馈次数及反馈信息更新可信度的方式为:0045 B=(b*k+c)/(k+1)0046 其中,b和k分别为读取到的数据信息对应的可信度及反馈次数,c为用户对数据信息的反馈信息,B为更新后的可信度。0047 进一步的,在得到新的可信度B后,将数据信息对应的可信度更新为B,并将该数据信息对应的反馈次数更新为k+1。在下一次更新可信度时,读取的可信度及反馈次。
17、数便为更新后的可信度及反馈次数。在后续可信度更新时,以此类推。0048 需要指出的是,更新可信度的方式不限于上述一种。例如,在一个实施例中,根据数据信息对应的可信度、反馈次数及反馈信息更新可信度的方式为:0049 B=(b*k*c1+c*c2)/(k*c1+c2),其中,b、k、c、B的含义同上,c1、c2为权值。0050 在一个实施例中,在上述步骤S130之后,上述知识库数据更新方法还包括:根据可信度的大小,对数据信息进行重新排序。0051 具体的,在知识库中,将数据信息按照可信度由大到小依次存储,从而使知识库中的数据信息有序。当访问知识库中的数据信息时,可按照可信度由大到小的顺序依次查询数。
18、据信息,当首次查找到匹配的数据信息后,该数据信息便为所有匹配的数据信息中可信度最大的数据信息。因此,不需要将所有匹配的数据信息全部查找到后再进行筛选,从而有效提高数据访问的效率。0052 在一个实施例中,在上述步骤S130之后,上述知识库数据更新方法还包括:将可信度与预设的阈值相比较,并将可信度小于阈值的数据信息删除。0053 具体的,阈值预先设定,表示临界点。当数据信息的可信度低于阈值时,则表示该数据信息可能为错误。当数据信息的可信度发生更新时,将更新后的可信度与阈值相比较,说 明 书CN 103177092 A4/5页7若该数据信息对应的可信度低于阈值,则将该数据信息从知识库中删除。005。
19、4 将可信度低于阈值的数据信息从知识库中删除,可剔除错误的数据信息,从而使知识库中的数据信息始终保持有效。而且,将错误的数据信息删除,可减小知识库的冗余度,并进一步节省存储空间。0055 请参阅图2,本发明中,一种知识库更新系统100,包括反馈接收模块110、读取模块120和可信度更新模块130。其中:0056 反馈接收模块110用于获取用户对数据信息的反馈信息。0057 在一个实施例中,反馈接收模块110可在向用户提供数据信息时,提示用户输入对该数据信息的反馈信息。反馈信息为用户对该数据信息准确性(即可信度)的评价。例如,反馈接收模块110在用户界面上显示输入框,并提示用户输入0100%之间。
20、的数值。若获得用户的输入数值为60%,则表示该用户认为该数据信息的可信度为60%。此外,反馈接收模块110还可在用户界面上显示多个选项(如可信、不可信、不确定等,并为每个选项对应设置量化的表示可信度的数值),从而便可通过获取用户与特定选项的交互操作获取用户对该数据信息的反馈信息。0058 读取模块120用于读取数据信息对应的可信度及反馈次数。0059 在一个实施例中,知识库中的数据信息均对应一个可信度,在构建知识库时,设计人员根据现有经验对每个数据信息的可信度赋予一个初始值。每个数据信息的可信度均为变量,可根据针对该数据信息的反馈信息进行更新。知识库中的数据信息还对应反馈次数,反馈次数即获取用。
21、户对该数据信息的反馈信息的次数,反馈次数的初始值均为0。反馈次数也为变量,每获取一次对该数据信息的反馈信息,则该数据信息对应的反馈次数在原有基础上加1。0060 因此,读取模块120通过数据信息在知识库中进行查询,便可得到该数据信息的可信度及反馈次数。0061 可信度更新模块130用于根据数据信息对应的可信度、反馈次数及反馈信息更新可信度。0062 具体的,由于反馈信息是对数据信息可信度的评价,因此,在获取针对该数据信息的反馈信息后,可信度更新模块130需要对该数据信息对应的可信度进行重新设置,以使可信度保持有效。在一个实施例中,可信度更新模块130更新可信度的方式为:0063 B=(b*k+。
22、c)/(k+1)0064 其中,b和k分别为读取到的数据信息对应的可信度及反馈次数,c为用户对数据信息的反馈信息,B为更新后的可信度。0065 进一步的,在得到新的可信度B后,可信度更新模块130将数据信息对应的可信度更新为B,并将该数据信息对应的反馈次数更新为k+1。在下一次更新可信度时,读取的可信度及反馈次数便为更新后的可信度及反馈次数。在后续可信度更新时,以此类推。0066 需要指出的是,可信度更新模块130更新可信度的方式不限于上述一种。例如,在一个实施例中,可信度更新模块130更新可信度的方式为:0067 B=(b*k*c1+c*c2)/(k*c1+c2),其中,b、k、c、B的含义。
23、同上,c1、c2为权值。0068 请参阅图3,在另一个实施例中,知识库数据更新系统100还包括重排序模块140和数据剔除模块150。其中:说 明 书CN 103177092 A5/5页80069 重排序模块140用于根据可信度的大小,对数据信息进行重新排序。0070 具体的,在知识库中,重排序模块140将数据信息按照可信度由大到小依次存储,从而使知识库中的数据信息有序。当访问知识库中的数据信息时,可按照可信度由大到小的顺序依次查询数据信息,当首次查找到匹配的数据信息后,该数据信息便为所有匹配的数据信息中可信度最大的数据信息。因此,不需要将所有匹配的数据信息全部查找到后再进行筛选,从而有效提高数。
24、据访问的效率。0071 数据剔除模块150用于将可信度与预设的阈值相比较,并将可信度小于阈值的数据信息删除。0072 具体的,阈值预先设定,表示临界点。当数据信息的可信度低于阈值时,则表示该数据信息可能为错误。当数据信息的可信度发生更新时,数据剔除模块150将更新后的可信度与阈值相比较,若该数据信息对应的可信度低于阈值,则将该数据信息从知识库中删除。0073 数据剔除模块150可剔除错误的数据信息,从而使知识库中的数据信息始终保持有效。而且,将错误的数据信息删除,可减小知识库的冗余度,并进一步节省存储空间。0074 请参阅图4,本发明还提供一种知识库,知识库包括知识库更新系统100、请求处理模。
25、块200及数据输出模块300。其中:0075 请求处理模块200用于接收用户的处理请求,并获取与处理请求匹配且可信度最大的数据信息。0076 在一个实施例中,请求处理模块200包括匹配单元(图中未示出)及选择单元(图中未示出)。其中:匹配单元用于在知识库中查找与处理请求匹配的数据信息;选择单元用于从匹配的数据信息进行筛选,选取其中可信度最大的数据信息。0077 在另一个实施例中,知识库更新系统100包括重排序模块140,请求处理模块200可按照可信度由大到小的顺序依次查询数据信息,当首次查找到匹配的数据信息后,该数据信息便为所有匹配的数据信息中可信度最大的数据信息。因此,不需要将所有匹配的数据。
26、信息全部查找到后再进行筛选,从而有效提高数据访问的效率。0078 数据输出模块300用于将获取的数据信息返回至用户。0079 上述知识库数据更新方法及系统,获取用户对数据信息的反馈信息,读取数据信息对应的可信度及反馈次数,再根据数据信息对应的可信度、反馈次数及反馈信息更新可信度。因此,知识库中数据信息的可信度不是固定不变的,而是参照使用者即用户的反馈信息进行更新,从而使得知识库中的数据信息可随着人们认识水平的提高而得到优化。由于上述知识库数据更新方法及系统使知识库中数据信息的可信度更加准确,故对上述知识库进行数据访问时,可有效提高数据访问的准确率。0080 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。说 明 书CN 103177092 A1/2页9图1图2说 明 书 附 图CN 103177092 A2/2页10图3图4说 明 书 附 图CN 103177092 A10。