CN201310565741.X
2013.11.14
CN104636381A
2015.05.20
授权
有权
授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20131114|||公开
G06F17/30
联想(北京)有限公司
卢小东; 葛付江; 葛安生
100085北京市海淀区上地信息产业基地创业路6号联想专利中心
北京中博世达专利商标代理有限公司11274
申健
本发明实施例公开了一种信息的处理方法及装置,涉及信息技术领域,可以提高垃圾信息的判断准确率。所述方法包括:客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。本发明适用于判断信息是否为垃圾信息。
权利要求书1. 一种信息的处理方法,其特征在于,包括: 接收信息; 获取所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值; 根据所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述 信息是否为垃圾信息。 2. 根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信 息对应的垃圾程度值的步骤包括: 提取所述信息中包括的各个关键词; 根据所述信息中包括的各个关键词匹配所述信息对应的信息模型; 获取所述信息对应的匹配结果; 获取所述信息对应的匹配结果的垃圾程度值。 3. 根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信 息对应的垃圾程度值的步骤包括: 获取所述信息对应的发送者; 根据所述信息对应的发送者获取所述信息对应的垃圾程度值。 4. 根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信 息对应的接受程度值的步骤之前,还包括: 提取所述信息中包括的各个由来关键词; 根据所述信息中包括的各个由来关键词,获取所述信息的由来类型; 所述获取所述信息对应的接受程度值的步骤包括: 根据所述信息的由来类型,获取所述信息的由来类型对应的接受程度值。 5. 根据权利要求1所述的信息的处理方法,其特征在于,所述获取所述信 息对应的接受程度值的步骤之前,还包括: 提取所述信息中包括的各个喜好关键词; 根据所述信息中包括的各个喜好关键词,获取所述信息的喜好类型; 所述获取所述信息对应的接受程度值的步骤包括: 根据所述信息的喜好类型,获取所述信息的喜好类型对应的接受程度值。 6. 根据权利要求4或5所述的信息的处理方法,其特征在于,所述根据所述 信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述信息是否为垃 圾信息的步骤包括: 根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率值,其中,γ为所 述信息为垃圾信息的概率值,p为所述信息对应的垃圾程度值,m为所述信息的 由来类型对应的接受程度值,α为所述信息的由来类型对应的计算权重值,n为 所述信息的喜好类型对应的接受程度值,β为所述信息的喜好类型对应的计算权 重值; 若所述信息为垃圾信息的概率值大于或者等于预设值,则确定所述信息为 垃圾信息。 7. 根据权利要求6所述的信息的处理方法,其特征在于,所述根据所述信 息中包括的各个喜好关键词,获取所述信息的喜好类型的步骤包括: 根据所述信息中包括的各个喜好关键词,获取所述信息的各个喜好类型; 所述根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率值的步骤包 括: 根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算所述信息为垃圾信息的概率 值,其中,ni为所述信息的第i个喜好类型对应的接受程度值,βi为所述信息的 第i个喜好类型对应的计算权重值,q为所述信息的喜好类型个数。 8. 一种信息的处理装置,其特征在于,包括: 接收单元,用于接收信息; 获取单元,用于获取所述接收单元接收的所述信息对应的垃圾程度值,并 获取所述信息对应的接受程度值; 判断单元,用于根据所述获取单元获取的所述信息对应的垃圾程度值及所 述信息对应的接受程度值,判断所述信息是否为垃圾信息。 9. 根据权利要求8所述的信息的处理装置,其特征在于,所述获取单元包 括: 提取模块,用于提取所述信息中包括的各个关键词; 匹配模块,用于根据所述提取模块提取的所述信息中包括的各个关键词匹 配所述信息对应的信息模型; 获取模块,用于获取所述匹配模块匹配的所述信息对应的匹配结果; 所述获取模块,还用于获取所述匹配模块匹配的所述信息对应的匹配结果 的垃圾程度值。 10. 根据权利要求8所述的信息的处理装置,其特征在于, 所述获取单元,还用于获取所述接收单元接收的所述信息对应的发送者; 所述获取单元,还用于根据所述信息对应的发送者获取所述信息对应的垃 圾程度值。 11. 根据权利要求8所述的信息的处理装置,其特征在于,所述装置还包括: 提取单元,用于提取所述接收单元接收的所述信息中包括的各个由来关键 词; 所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个由 来关键词,获取所述信息的由来类型; 所述获取单元,还用于根据所述信息的由来类型,获取所述信息的由来类 型对应的接受程度值。 12. 根据权利要求8所述的信息的处理装置,其特征在于, 所述提取单元,还用于提取所述接收单元接收的所述信息中包括的各个喜 好关键词; 所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个喜 好关键词,获取所述信息的喜好类型; 所述获取单元,还用于根据所述信息的喜好类型,获取所述信息的喜好类 型对应的接受程度值。 13. 根据权利要求11或12所述的信息的处理装置,其特征在于,所述判断 单元包括: 计算模块,用于根据公式γ=p-m·α-n·β计算所述信息为垃圾信息的概率 值,其中,γ为所述信息为垃圾信息的概率值,p为所述信息对应的垃圾程度值, m为所述信息的由来类型对应的接受程度值,α为所述信息的由来类型对应的计 算权重值,n为所述信息的喜好类型对应的接受程度值,β为所述信息的喜好类 型对应的计算权重值; 确定模块,用于当所述计算模块计算的所述信息为垃圾信息的概率值大于 或者等于预设值时,确定所述信息为垃圾信息。 14. 根据权利要求13所述的信息的处理装置,其特征在于, 所述获取单元,还用于根据所述提取单元提取的所述信息中包括的各个喜 好关键词,获取所述信息的各个喜好类型; 所述计算模块,还用于根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算所述 信息为垃圾信息的概率值,其中,ni为所述信息的第i个喜好类型对应的接受程 度值,βi为所述信息的第i个喜好类型对应的计算权重值,q为所述信息的喜好 类型个数。
说明书信息的处理方法及装置 技术领域 本发明涉及信息技术领域,特别涉及一种信息的处理方法及装置。 背景技术 随着信息技术的不断发展,用户所接收的信息中包含的信息种类越来越多, 其中,接收的信息中包含的垃圾信息也越来越多,从而影响用户对需要查阅的 信息的获取。例如,垃圾信息可以为无针对性的广告信息、商家针对部分用户 发送的服务信息等。 目前为了过滤上述垃圾信息,终端设备通常是根据信息中的某些关键词判 断该信息是否为垃圾信息,若是垃圾信息,则进行过滤。然而目前根据信息中 的关键词判断该信息是否为垃圾信息的方式,仅针对信息中包括的内容关键词 进行判断,没有对信息的由来及用户查阅信息的特点进行分析,从而造成垃圾 信息的判断准确率较低。 发明内容 本发明实施例提供一种信息的处理方法及装置,可以提高垃圾信息的判断 准确率。 本发明实施例采用的技术方案为: 一种信息的处理方法,包括: 接收信息; 获取所述信息对应的垃圾程度值,并获取所述信息对应的接受程度值; 根据所述信息对应的垃圾程度值及所述信息对应的接受程度值,判断所述 信息是否为垃圾信息。 一种信息的处理装置,包括: 接收单元,用于接收信息; 获取单元,用于获取所述接收单元接收的所述信息对应的垃圾程度值,并 获取所述信息对应的接受程度值; 判断单元,用于根据所述获取单元获取的所述信息对应的垃圾程度值及所 述信息对应的接受程度值,判断所述信息是否为垃圾信息。 本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后 获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及 接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接 判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信 息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息, 进而可以提高垃圾信息的判断准确率。 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其它的附图。 图1为本发明实施例一提供的一种信息的处理方法流程图; 图2为本发明实施例一提供的一种信息的处理结构示意图; 图3为本发明实施例二提供的一种信息的处理方法流程图; 图4为本发明实施例二提供的一种信息的处理结构示意图。 具体实施方式 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。 为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作 详细说明。 实施例一 本发明实施例提供一种信息的处理方法,如图1所示,所述方法包括: 101、客户端接收信息。 其中,信息可以为短消息或者邮件等,本发明实施例不做限定。在本发明 实施例,客户端可以安装在PC(Personal Computer,个人计算机)、手机、平板电 脑等。 102、客户端获取信息对应的垃圾程度值,并获取信息对应的接受程度值。 对于本发明实施例,客户端通过信息对应的垃圾程度值,能够根据信息的 垃圾程度值判断该信息是垃圾信息的概率。其中,当信息对应的垃圾程度值越 高时,该信息是垃圾信息的概率越大。同时,客户端通过信息对应的接受程度 值,能够根据信息的接受程度值判断该信息不是垃圾信息的概率。具体地,当 信息对应的接受程度值越高时,该信息不是垃圾信息的概率越大。 对于本发明实施例,步骤102之前还可以包括,客户端提取信息中包括的各 个关键词,并根据信息中包括的各个关键词判断信息是否有可能为垃圾信息。 若信息有可能为垃圾信息,则将信息暂时拦截。在本发明实施例中,客户端通 过预先判断信息是否有可能为垃圾信息,并对有可能为垃圾信息的信息进行进 一步更准确地判断,从而可以仅对有可能为垃圾信息的信息进行判断处理,进 而可以降低信息的处理复杂度。 具体地,客户端可以首先从接收到的信息中提取信息中包括的各个关键词, 然后获取信息中包括的各个关键词为垃圾信息的关键词对应的各个概率值,最 后获取各个概率值中最大的概率值作为信息为垃圾信息的概率值,并将该概率 值与预设概率值进行比较,若该概率值大于或者等于预设概率值,则确定该信 息有可能为垃圾信息。其中,预设概率值可以由服务器预先进行配置。例如, 若预设概率值为0.3,客户端从接收到的信息中提取到三个关键词,这三个关键 词为垃圾信息的关键词对应的概率值分别为0.2、0.3、0.35,则获取最大概率 值0.35作为信息为垃圾信息的概率值,并与预设概率值0.3进行比较,该最大概 率值大于预设概率值,因此确定该信息有可能为垃圾信息。 其中,垃圾信息的关键词对应的概率值可以由服务器预先根据用户对垃圾 信息的反馈进行获取。 103、客户端根据信息对应的垃圾程度值及信息对应的接受程度值,判断信 息是否为垃圾信息。 对于本发明实施例,客户端通过获取信息对应的垃圾程度值及信息对应的 接受程度值,能够根据信息中包括的内容及用户的需求对信息是否为垃圾信息 进行判断,从而可以提高垃圾信息的判断准确率。 可选地,步骤103之后还可以包括,若信息为垃圾信息,则客户端过滤该垃 圾信息。在本发明实施例中,客户端对垃圾信息进行过滤之后,可以向服务器 进行反馈,以使得服务器能够实时地获取用户对包括各个关键词的信息的处理 情况。 进一步地,作为图1所示方法的具体实现,本发明实施例提供了一种信息的 处理装置,如图2所示,所述装置的实体可以为客户端,例如PC(Personal Computer,个人计算机)、手机、平板电脑等,所述装置包括:接收单元21、获 取单元22、判断单元23。 接收单元21,用于接收信息。 获取单元22,用于获取接收单元21接收的信息对应的垃圾程度值,并获取 信息对应的接受程度值。 判断单元23,用于根据获取单元22获取的信息对应的垃圾程度值及信息对 应的接受程度值,判断信息是否为垃圾信息。 需要说明的是,本发明实施例中提供的信息的处理装置中各功能单元所对 应的其他相应描述,可以参考图1中的对应描述,在此不再赘述。 本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后 获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及 接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接 判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信 息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息, 进而可以提高垃圾信息的判断准确率。 实施例二 本发明实施例提供一种信息的处理方法,如图3所示,所述方法包括: 301、客户端接收信息。 其中,信息可以为短消息或者邮件等,本发明实施例不做限定。在本发明 实施例,客户端可以安装在PC、手机、平板电脑等。 302、客户端提取信息中包括的各个关键词。 其中,各个关键词可以保存在数据库中。在本发明实施例中,客户端可以 通过将数据库中保存的关键词与接收到的信息中的词语进行词义相似度计算, 若该词义相似度大于或者等于预设词义相似度,则将该词语作为从该信息中提 取的关键词。其中,预设词义相似度可以由客户端预先进行配置。 例如,数据库中保存有关键词:汇款、银行账号、房地产、限时特价等, 客户端接收到的信息为:请速往我的银行账号汇款两万元人民币。客户端通过 将该信息中的词语与数据库中保存的关键词进行词义相似度计算,获取到接收 到的信息中的词语银行账号和汇款,与数据库中保存的关键词银行账号和汇款 的词义相似度大于或者等于预设词义相似度,则客户端从接收到的信息中提取 的关键词分别为银行账号和汇款。 对于本发明实施例,步骤302之后还可以包括,客户端提取信息中包括的各 个关键词,并根据信息中包括的各个关键词判断信息是否有可能为垃圾信息。 若信息有可能为垃圾信息,则将信息暂时拦截。在本发明实施例中,客户端通 过预先判断信息是否有可能为垃圾信息,并对有可能为垃圾信息的信息进行进 一步更准确地判断,从而可以仅对有可能为垃圾信息的信息进行判断处理,进 而可以降低信息的处理复杂度。 具体地,客户端可以首先从接收到的信息中提取关键词,然后获取这些关 键词为垃圾信息的关键词对应的各个概率值,最后选取各个概率值中的最大概 率值作为该信息为垃圾信息的概率值,并将该概率值与预设概率值进行比较, 若该概率值大于或者等于预设概率值,则确定该信息有可能为垃圾信息。其中, 预设概率值可以由服务器预先进行配置。例如,若预设概率值为0.2,客户端从 接收到的信息中提取到两个关键词,这两个关键词为垃圾信息的关键词对应的 概率值分别为0.15和0.3,则获取最大概率值0.3作为该信息为垃圾信息的概率 值,并与预设概率值0.2进行比较,该最大概率值大于预设概率值,则确定该信 息有可能为垃圾信息。 303、客户端根据信息中包括的各个关键词匹配信息对应的信息模型。 其中,信息模型中可以包括多个类别,每个类别中可以对应多个关键词。 在本发明实施例中,信息模型可以由服务器预先进行配置并保存在数据库中。 例如,某个与房地产相关的信息模型可以包括类别:地点、户型、房屋种类, 地点类别对应的关键词可以为:北京、上海、广州等,户型类别对应的关键词 可以为:平层户型、跃层户型、复式户型等,房屋种类对应的关键词可以为: 产权房、商品房、经济适用房、集资房等。 对于本发明实施例,步骤303具体可以为,客户端首先根据提取的各个关键 词,获取关键词对应的类别,然后将这些类别分别与数据库中保存的各个信息 模型中的类别进行匹配,若某个信息模型中的各个类别包括该信息中提取的关 键词对应的全部类别,则客户端获取该信息模型作为该信息对应的信息模型。 例如,数据库中保存的信息模型有:包括人名、银行名称、银行卡号的信 息模型;包括地点、房屋种类、户型的信息模型;包括时间、购物网站、折扣、 积分的信息模型等。客户端接收的信息为:倾情奉献北京五环内跃层户型,欲 购从速。客户端从该信息中提取的关键词为:北京和跃层户型,这些关键词对 应的类别分别为地点和户型,将这些类别与数据库中保存的各个信息模型中包 括的类别进行匹配,在包括地点、房屋种类、户型的信息模型中,包括信息中 提取的关键词对应的全部类别,则客户端获取该信息模型作为该信息的信息模 型。 304、客户端获取信息对应的匹配结果。 对于本发明实施例,客户端通过根据提取的各个关键词填补信息对应的信 息模型,能够获取对应的匹配结果。例如,若客户端提取的各个关键词分别为: 国庆期间、淘宝网、五折优惠,客户端获取的信息模型为:包括时间、购物网 站、折扣、积分的信息模型,则客户端获取的匹配结果为:时间信息为国庆期 间、购物网站信息为淘宝网、折扣信息为五折优惠、积分信息为无。 305、客户端获取信息对应的匹配结果的垃圾程度值。 其中,信息对应的匹配结果的垃圾程度值可以由服务器预先进行计算,并 保存在数据库中。 对于本发明实施例,客户端还可以通过获取信息对应的发送者,并根据信 息对应的发送者获取信息对应的垃圾程度值。在本发明实施例中,客户端通过 获取发送者对应的垃圾程度值,从而可以进一步提高垃圾信息的判断准确率。 其中,信息对应的发送者可以是信息对应的发送号码,也可以是信息对应 的发送邮件地址等,本发明实施例不做限定。发送者对应的垃圾程度值可以为, 该发送者发送的全部信息中垃圾信息所占的比例。 对于本发明实施例,各个发送者对应的垃圾程度值可以由服务器预先根据 用户反馈进行获取,并保存在服务器中。例如,在某个发送者发送的1000条信 息中,用户反馈为垃圾信息的信息有900条,则该发送者发送对应的垃圾程度值 为0.9;在另一个发送者发送的2000条信息中,用户反馈为垃圾信息的信息有500 条,则该发送者对应的垃圾程度值为0.25。 306、客户端提取信息中包括的各个由来关键词。 其中,信息中包括的各个由来关键词可以由服务器预先进行配置,并保存 在数据库中。例如,由来关键词可以为:取暖、水电费、物业、意外保险、失 业保险、晴天、降温等。 307、客户端根据信息中包括的各个由来关键词,获取信息的由来类型。 其中,各个由来关键词分别对应的由来类型可以由服务器预先进行配置, 并保存在数据库中。例如,由来关键词取暖、水电费、物业对应的由来类型可 以为物业公司,由来关键词意外保险、失业保险对应的由来类型可以为保险公 司,由来关键词晴天、降温对应的由来类型可以为天气预报。 308、客户端根据信息的由来类型,获取信息的由来类型对应的接受程度值。 其中,各个不同的由来类型分别对应不同的接受程度值。各个由来类型对 应的接受程度值可以由服务器预先根据用户反馈进行获取,并保存在服务器中。 对于本发明实施例,若客户端提取的各个由来关键词对应多个由来类型, 则客户端获取各个由来类型对应的接受程度值中最大的接受程度值,作为信息 的由来类型对应的接受程度值。 309、客户端提取信息中包括的各个喜好关键词。 其中,信息中包括的各个喜好关键词可以由服务器预先进行配置,并保存 在数据库中。例如,由来关键词可以为:衣服鞋帽、家具、会员积分、双人游、 户外、购房、二手房、观景别墅等。 310、客户端根据信息中包括的各个喜好关键词,获取信息的喜好类型。 其中,各个喜好关键词分别对应的喜好类型可以由服务器预先进行配置, 并保存在数据库中。例如,喜好关键词衣服鞋帽、家具、会员积分对应的喜好 类型可以为购物,喜好关键词双人游、户外对应的喜好类型可以为旅游,喜好 关键词购房、二手房、观景别墅对应的由来类型可以为房地产。 311、客户端根据信息的喜好类型,获取信息的喜好类型对应的接受程度值。 其中,各个不同的喜好类型分别对应不同的接受程度值。各个喜好类型对 应的接受程度值可以由服务器预先根据用户反馈进行获取,并保存在服务器中。 312、客户端根据公式γ=p-m·α-n·β计算信息为垃圾信息的概率值。 其中,γ为信息为垃圾信息的概率值,p为信息对应的垃圾程度值,m为信 息的由来类型对应的接受程度值,α为信息的由来类型对应的计算权重值,n为 信息的喜好类型对应的接受程度值,β为信息的喜好类型对应的计算权重值。 对于本发明实施例,各个由来类型对应的计算权重值及各个喜好类型对应 的计算权重值可以由服务器预先根据用户反馈进行配置,并保存在数据库中。 在本发明实施例中,客户端通过预先分别设置信息由来类性对应的计算权重值 及喜好类性对应的计算权重值,从而可以根据用户需求对各个类性的重要程度 进行区分,实现不同用户的个性化设置;同时,通过对该信息对应的垃圾程度 值、该信息的由来及用户查阅信息的特点进行综合考虑,从而可以提高垃圾信 息的判断准确率。 313、若信息为垃圾信息的概率值大于或者等于预设值,则客户端确定信息 为垃圾信息。 对于本发明实施例,步骤313之后还可以包括,若信息为垃圾信息,则客户 端过滤该垃圾信息。在本发明实施例中,客户端对垃圾信息进行过滤之后,可 以向服务器进行反馈,以使得服务器能够实时地获取用户对包括各个关键词的 信息的处理情况。 可选地,步骤310还可以为,客户端根据信息中包括的各个喜好关键词,获 取信息的各个喜好类型。在本发明实施例中,对应的步骤313可以为,客户端根 据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算信息为垃圾信息的概率值。其中,ni为信息的第i个喜好类型对应的接受程度值,βi为信息的第i个喜好类型对应的 计算权重值,q为信息的喜好类型个数。 对于本发明实施例,客户端可以通过获取喜好关键词对应的多个喜好类型, 并综合考虑多个喜好类型的接受程度值,从而可以进一步提高垃圾信息的判断 准确率。 进一步地,作为图3所示方法的具体实现,本发明实施例提供了一种信息的 处理装置,如图4所示,所述装置的实体可以为客户端,例如PC(Personal Computer,个人计算机)、手机、平板电脑等,所述装置包括:接收单元41、获 取单元42、判断单元43。 接收单元41,用于接收信息。 获取单元42,用于获取接收单元41接收的信息对应的垃圾程度值,并获取 信息对应的接受程度值。 判断单元43,用于根据获取单元42获取的信息对应的垃圾程度值及信息对 应的接受程度值,判断信息是否为垃圾信息。 获取单元42包括:提取模块4201、匹配模块4202、获取模块4203。 提取模块4201,用于提取信息中包括的各个关键词。 匹配模块4202,用于根据提取模块4201提取的信息中包括的各个关键词匹 配信息对应的信息模型。 获取模块4203,用于获取匹配模块4202匹配的信息对应的匹配结果。 获取模块4203,还用于获取匹配模块4202匹配的信息对应的匹配结果的垃 圾程度值。 获取单元42,还用于获取接收单元41接收的信息对应的发送者。 获取单元42,还用于根据信息对应的发送者获取信息对应的垃圾程度值。 可选地,所述装置还可以包括:提取单元44。 提取单元44,用于提取接收单元41接收的信息中包括的各个由来关键词。 获取单元42,还用于根据提取单元44提取的信息中包括的各个由来关键词, 获取信息的由来类型。 获取单元42,还用于根据信息的由来类型,获取信息的由来类型对应的接 受程度值。 提取单元41,还用于提取接收单元41接收的信息中包括的各个喜好关键词。 获取单元42,还用于根据提取单元41提取的信息中包括的各个喜好关键词, 获取信息的喜好类型。 获取单元42,还用于根据信息的喜好类型,获取信息的喜好类型对应的接 受程度值。 判断单元43包括:计算模块4301、确定模块4302。 计算模块4301,用于根据公式γ=p-m·α-n·β计算信息为垃圾信息的概率 值。 其中,γ为信息为垃圾信息的概率值,p为信息对应的垃圾程度值,m为信 息的由来类型对应的接受程度值,α为信息的由来类型对应的计算权重值,n为 信息的喜好类型对应的接受程度值,β为信息的喜好类型对应的计算权重值。 确定模块4302,用于当计算模块4301计算的信息为垃圾信息的概率值大于 或者等于预设值时,确定信息为垃圾信息。 获取单元42,还用于根据提取单元41提取的信息中包括的各个喜好关键词, 获取信息的各个喜好类型。 计算模块4301,还用于根据公式γ=p-m·α-n1·β1-…ni·βi…-nq·βq计算信息 为垃圾信息的概率值。 其中,ni为信息的第i个喜好类型对应的接受程度值,βi为信息的第i个喜好 类型对应的计算权重值,q为信息的喜好类型个数。 需要说明的是,本发明实施例中提供的信息的处理装置中各功能单元所对 应的其他相应描述,可以参考图3中的对应描述,在此不再赘述。 本发明实施例提供的信息的处理方法及装置,客户端首先接收信息,然后 获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及 接受程度值,判断信息是否为垃圾信息。与目前根据信息中的某些关键词直接 判断该信息是否为垃圾信息相比,本发明实施例能够根据信息中的关键词对信 息的由来及用户查阅信息的特点进行分析,从而可以判断信息是否为垃圾信息, 进而可以提高垃圾信息的判断准确率。 本发明实施例提供的信息的处理装置可以实现上述提供的方法实施例,具 体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的 信息的处理方法及装置可以适用于判断信息是否为垃圾信息,但不仅限于此。 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算 机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。 其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random Access Memory,RAM)等。 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围 应该以权利要求的保护范围为准。
《信息的处理方法及装置.pdf》由会员分享,可在线阅读,更多相关《信息的处理方法及装置.pdf(15页珍藏版)》请在专利查询网上搜索。
本发明实施例公开了一种信息的处理方法及装置,涉及信息技术领域,可以提高垃圾信息的判断准确率。所述方法包括:客户端首先接收信息,然后获取信息对应的垃圾程度值及接受程度值,最后根据信息对应的垃圾程度值及接受程度值,判断信息是否为垃圾信息。本发明适用于判断信息是否为垃圾信息。。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1