《一种基于用户行为信息的检索结果实时更新方法及其系统.pdf》由会员分享,可在线阅读,更多相关《一种基于用户行为信息的检索结果实时更新方法及其系统.pdf(20页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102930041 A (43)申请公布日 2013.02.13 CN 102930041 A *CN102930041A* (21)申请号 201210453464.9 (22)申请日 2012.11.12 G06F 17/30(2006.01) (71)申请人 江苏外博资讯有限公司 地址 226010 江苏省南通市南通经济技术开 发区通盛大道 188 号 B 座 511 (72)发明人 李道远 程鑫 高俊 顾鑫 (74)专利代理机构 上海麦其知识产权代理事务 所 ( 普通合伙 ) 31257 代理人 董红曼 (54) 发明名称 一种基于用户行为信息的检索结果实时更。
2、新 方法及其系统 (57) 摘要 本发明公开了一种基于用户行为信息的检索 结果实时更新方法及系统, 包括 : 获取包含至少 一项条目的检索结果 ; 获取用户行为信息 ; 基于 用户行为信息选择处理模式, 并根据条目相似度, 对检索结果中的条目进行处理 ; 得到并显示更新 后的检索结果。本发明基于用户行为信息实时改 进检索结果, 排序靠前的条目始终为用户需要且 未被访问的条目, 提高了用户查看检索结果的效 率, 改善了用户检索体验。 (51)Int.Cl. 权利要求书 2 页 说明书 11 页 附图 6 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 。
3、11 页 附图 6 页 1/2 页 2 1. 一种基于用户行为信息的检索结果实时更新方法, 其特征在于, 包括以下步骤 : 步骤一 : 获取包含至少一项条目的检索结果 ; 步骤二 : 获取用户行为信息 ; 步骤三 : 基于所述用户行为信息选择处理模式, 并根据条目相似度, 对所述检索结果中 的条目进行处理 ; 步骤四 : 得到并显示更新后的检索结果。 2. 如权利要求 1 所述的检索结果实时更新方法, 其特征在于, 所述步骤一中所述包含 至少一项条目的检索结果是通过以下步骤获得 : 步骤 A1 : 获取关键词, 对所述关键词进行预处理 ; 步骤 A2 : 判断所述预处理后的关键词是否符合要求 。
4、; 若符合要求的, 则根据所述关键 词进行检索生成检索结果 ; 若不符合要求的, 则重新执行所述步骤 A1、 A2, 直至生成检索结 果。 3. 如权利要求 1 所述的检索结果实时更新方法, 其特征在于, 所述步骤一中, 根据权值 将所述条目由高到低排序。 4. 如权利要求 3 所述的检索结果实时更新方法, 其特征在于, 所述步骤一中, 根据所述 条目被引用次数将权值相同的所述条目由高到低排序。 5. 如权利要求 1 所述的检索结果实时更新方法, 其特征在于, 所述用户行为信息包括 用户历史访问条目、 用户忽略条目、 用户访问不同条目的时间间隔、 用户历史访问条目的内 容长度、 用户历史访问条。
5、目的阅读时间长度、 用户访问条目时的生理体征信息。 6. 如权利要求 1 所述的检索结果实时更新方法, 其特征在于, 进一步包括步骤五 : 重复 执行所述步骤二至步骤四, 直到停止获取所述用户行为信息时终止。 7. 如权利要求 1 所述的检索结果实时更新方法, 其特征在于, 所述步骤三的处理模式 包括 : 隐藏历史访问条目模式、 相似历史访问条目排序模式、 或相似忽略条目排序模式中任 意一项或多项。 8. 如权利要求 7 所述的检索结果实时更新方法, 其特征在于, 所述隐藏历史访问条目 包括 : 步骤 B1 : 基于所述用户行为信息选中用户已访问的条目 ; 步骤 B2 : 将所述用户历史访问条。
6、目从所述检索结果中移出 ; 步骤 B3 : 将所述已访问的条目存入历史访问条目集合中。 9. 如权利要求 7 所述的检索结果实时更新方法, 其特征在于, 所述相似历史访问条目 排序包括 : 步骤 C1 : 基于所述用户行为信息选中用户已访问的条目 ; 步骤 C2 : 将所述历史访问条目存入所述历史访问条目集合中 ; 步骤 C3 : 对所述历史访问条目集合中的条目进行相似度对比, 获取所述条目之间的相 似内容 ; 步骤 C4 : 根据所述相似内容对所述检索结果中的各条目进行相似度对比, 生成所述各 条目与所述相似内容的相似度值 ; 步骤 C5 : 依据所述相似度值由高至低对所述检索结果中的各条目。
7、进行排序。 权 利 要 求 书 CN 102930041 A 2 2/2 页 3 10. 如权利要求 7 所述的检索结果实时更新方法, 其特征在于, 所述相似忽略条目排序 包括 : 步骤 D1 : 基于所述用户行为信息选中用户在访问中忽略的条目 ; 步骤 D2 : 将所述用户的忽略条目存入历史忽略条目集合中 ; 步骤 D3 : 将所述检索结果中的各条目与所述历史忽略条目集合中的各条目进行相似 度对比, 获取所述检索结果中各条目的相似性权值 ; 步骤 D4 : 依据所述相似性权值由低至高对所述检索结果中的各条目进行排序。 11. 如权利要求 9 所述的检索结果实时更新方法, 其特征在于, 进一步。
8、包括 : 计算所述 历史访问条目集合中条目与所述相似内容的相似度值, 将所述历史访问条目集合中的各条 目按照所述相似度值由高到低排序。 12. 一种基于用户行为信息的检索结果实时更新系统, 其特征在于, 包括 : 用户行为信息获取装置 (3), 其获取用户行为信息 ; 相似度对比装置 (5), 其包含计算相似度的功能模块 ; 条目处理装置 (4), 其与所述用户行为信息获取装置 (3) 以及相似度对比装置 (5) 连 接, 用于根据所述用户行为信息获取装置 (3) 获取的所述用户行为信息选择模式, 并根据 所述相似度对比装置 (5) 对于所述条目的相似度对比结果, 处理所述检索结果中的条目 ;。
9、 显示装置 (6), 其与所述条目处理装置 (4) 连接, 接收并显示由所述条目处理装置 (4) 发送的条目。 13. 如权利要求 12 所述的检索结果实时更新系统, 其特征在于, 进一步包括 : 数据库 (1), 其存储海量信息 ; 检索装置 (2), 其与所述数据库 (1) 及所述条目处理装置 (4) 连接, 用于根据关键词检 索所述海量信息生成所述检索结果。 14.如权利要求13所述的检索结果实时更新系统, 其特征在于, 所述检索装置(2)生成 所述检索结果中各条目与所述关键词的匹配度的权值。 15. 如权利要求 12 所述的检索结果实时更新系统, 其特征在于, 所述用户行为信息获 取装。
10、置 (3) 包括鼠标、 键盘、 图像获取设备、 计算机系统内置的计时设备、 红外感应设备、 全 球定位系统、 触觉感应设备。 权 利 要 求 书 CN 102930041 A 3 1/11 页 4 一种基于用户行为信息的检索结果实时更新方法及其系统 技术领域 0001 本发明涉及信息搜索技术领域, 尤其涉及一种基于用户行为信息的检索结果实时 更新方法及其系统。 背景技术 0002 随着计算机及信息技术的快速发展, 由计算机自动或辅助用户生成的信息越来越 多, 如何在海量信息中检索特定信息由此变得十分重要。 为了解决此类问题, 各种计算机信 息检索技术应运而生, 包括计算机文件检索系统、 网络搜。
11、索引擎、 在线数据库联机检索系统 等。计算机用户利用这些系统通过键入关键词而查找所需信息, 此类系统在很大程度上解 决了用户检索信息的难题, 但是缺乏精确检索的能力以及良好的用户体验。近年来机器学 习技术发展迅速, 它可利用人工智能相关技术模仿自然人行为和思考方式, 对用户行为进 行推断使计算机能达到交流目的。然而, 此类技术尚未被广泛用于改进信息检索系统的用 户体验。 现有技术中尚未见基于用户体验及反馈等用户行为信息的对检索结果进行重组及 动态实时更新的技术。 发明内容 0003 本发明提出了一种基于用户行为信息的检索结果实时更新方法, 包括 : 0004 步骤一 : 获取包含至少一项条目的。
12、检索结果 ; 0005 步骤二 : 获取用户行为信息 ; 0006 步骤三 : 基于所述用户行为信息选择处理模式, 并根据条目相似度, 对所述检索结 果中的条目进行处理 ; 0007 步骤四 : 得到并显示更新后的检索结果。 0008 “各条目的相似度对比” 是各条目之间、 各条目的内容之间进行相似度的比较。相 似度比较的算法包括计算两个集合的 Jaccard 指数的算法等。相似度用于表示各条目或者 各条目的内容之间的相似程度。若相似度值越高, 则代表该两个条目或者条目的内容中存 在相同或相近似的信息越多。 0009 其中, 所述步骤一中所述包含至少一项条目的检索结果的生成步骤包括 : 001。
13、0 步骤 A1 : 获取关键词, 对所述关键词进行预处理 ; 0011 步骤 A2 : 判断所述预处理后的关键词是否符合要求 ; 若符合要求的, 则根据所述 关键词进行检索生成检索结果 ; 若不符合要求的, 则重新执行所述步骤 A1、 A2, 直至生成检 索结果。 0012 其中, 所述步骤一中, 根据权值将所述条目由高到低排序。 0013 其中, 所述步骤一中, 根据所述条目被引用次数将权值相同的条目由高到低排序。 0014 本发明中, 所述用户行为信息是指对于所述检索结果中包含的各项条目, 用户会 产生不同的兴趣或关注, 例如, 可能会访问或点击某个 / 些条目的, 可能会选择性访问某个 。
14、/ 些条目, 可能会跳过某个 / 些条目, 对各条目的关注时间长短不一, 等等, 因不同需求或反 说 明 书 CN 102930041 A 4 2/11 页 5 应, 用户作出的不同行为, 从而形成相应的用户行为信息。 0015 所述用户行为信息包括用户历史访问条目、 用户忽略条目、 用户访问不同条目的 时间间隔、 用户历史访问条目的内容长度、 用户历史访问条目的阅读时间长度、 用户访问条 目时的生理体征信息。还包括用户在访问条目时可能的其他反应信息。 0016 用户历史访问条目, 是指用户在浏览检索结果的过程中, 点选进入某一条目进行 进一步访问, 则该条目为用户历史访问条目。 0017 用。
15、户忽略条目, 是指用户在跳跃性浏览检索结果的过程中, 在访问某一条目之前 仍然存在某些条目未被访问, 则这些条目为用户忽略条目。 0018 用户访问不同条目的时间间隔, 是指用户点选不同条目进行进一步访问的时间间 隔。 0019 用户历史访问条目的内容长度, 是指用户进一步访问的这个条目的内容的信息 量, 包括该条目内的字数、 视频播放的时间等信息。 0020 用户历史访问条目的阅读时间长度, 是指用户点选后进一步访问一个条目直到访 问完毕返回检索结果页面所花费的时间。 0021 用户访问条目时的生理体征信息, 是指用户行为信息获取装置捕捉到的用户在阅 读条目时的各种生理或者肢体特征参数及其变。
16、化信息。例如, 用户在阅读条目时产生的面 部表情、 眼球运动、 肢体特征、 心率变化、 呼吸变化、 或可适用的其他生理体征信息。 0022 本发明进一步包括步骤五 : 即, 重复执行所述步骤二至步骤四, 直到停止获取所述 用户行为信息时终止。 0023 本发明中, 所述步骤三, 基于所述用户行为信息选择的所述检索结果包含的各项 条目的处理模式包括 : 隐藏历史访问条目、 相似历史访问条目排序、 或相似忽略条目排序。 进一步地, 本发明可以运用上述三种模式之任意一项进行处理, 或运用其中的任意多项组 合进行处理, 例如, 将已访问的条目加以隐藏, 使其不显示在更新后的检索结果中。 例如, 将 相。
17、似的已忽略的条目按降序排列, 不再显示在更新后的检索结果中。 例如, 将相似的历史访 问条目按升序排列显示在更新后的检索结果中。 0024 其中, 所述隐藏历史访问条目包括以下步骤 : 0025 步骤 R1 : 基于所述用户行为信息选中用户已访问的条目 ; 0026 步骤 B2 : 将所述用户已访问的条目从所述检索结果中移出 ; 0027 步骤 B3 : 将所述已访问的条目存入历史访问条目集合中。 0028 本发明中, 历史访问条目集合是指由已访问的条目组成。历史访问条目集合存储 于所述条目处理装置中。 0029 其中, 所述相似历史访问条目排序包括以下步骤 : 0030 步骤 C1 : 基于。
18、所述用户行为信息选中用户已访问的条目 ; 0031 步骤 C2 : 将所述历史访问条目存入所述历史访问条目集合中 ; 0032 步骤 C3 : 对所述历史访问条目集合中的条目进行相似度对比, 获取所述条目之间 的相似内容 ; 0033 步骤 C4 : 根据所述相似内容对所述检索结果中的各条目进行相似度对比, 生成所 述各条目与所述相似内容的相似度值 ; 0034 步骤 C5 : 依据所述相似度值由高至低对所述检索结果中的各条目进行排序。 说 明 书 CN 102930041 A 5 3/11 页 6 0035 所述条目之间的相似内容是指历史访问条目之间相似度最高的信息。例如, 历史 访问条目的。
19、摘要内容中均出现某一词汇 ABC, 根据相似度对比装置计算后认定该词汇 ABC 作为历史访问条目中相似度最高的内容, 则该词汇 ABC 作为各个历史访问条目之间的相似 内容。 0036 根据所述相似内容对所述检索结果中的各条目进行相似度对比, 计算检索结果中 的各条目与该相似内容的相似程度。 相似度值越高, 即相似程度越高, 表明所述检索结果中 的条目与用户历史访问条目越相似。进一步地, 条目处理装置根据该相似度值对所述检索 结果中的条目进行排序, 使用户感兴趣的条目的排序靠前。 0037 其中, 所述相似忽略条目排序包括以下步骤 : 0038 步骤 D1 : 基于所述用户行为信息选中用户在访。
20、问中忽略的条目 ; 0039 步骤 D2 : 将所述用户的忽略条目存入历史忽略条目集合中 ; 0040 步骤 D3 : 将所述检索结果中的各条目与所述历史忽略条目集合中的各条目进行 相似度对比, 获取所述检索结果中各条目的相似性权值 ; 0041 步骤 D4 : 依据所述相似性权值由低至高对所述检索结果中的各条目进行排序。 0042 本发明中, 历史忽略条目集合是指由已忽略的条目组成。历史忽略条目集合存储 于所述条目处理装置中。 0043 其中, 进一步包括 : 计算所述历史访问条目集合中的条目与所述相似内容的相似 度值, 将所述历史访问条目集合中的各条目按照所述相似度值由高到低排序。 004。
21、4 本发明还提出了一种基于用户行为信息的检索结果实时更新系统, 包括 : 0045 用户行为信息获取装置, 其获取用户行为信息 ; 0046 相似度对比装置, 其包含计算相似度的功能模块 ; 0047 条目处理装置, 其与所述用户行为信息获取装置以及相似度对比装置连接, 用于 根据所述用户行为信息获取装置获取的所述用户行为信息选择模式, 并根据所述相似度对 比装置对于所述条目的相似度对比结果, 处理所述检索结果中的条目 ; 0048 显示装置, 其与所述条目处理装置连接, 接收并显示由所述条目处理装置发送的 条目。 0049 本发明检索结果实时更新系统中, 进一步包括 : 0050 数据库, 。
22、其存储有海量信息 ; 0051 检索装置, 其与所述数据库及所述条目处理装置连接, 用于根据关键词检索所述 海量信息生成所述检索结果。 0052 进一步地, 所述检索装置生成所述检索结果中各条目与所述关键词的匹配度的权 值。 0053 其中, 用户行为信息获取装置包括鼠标、 键盘、 图像获取设备、 计算机系统内置的 计时设备、 红外感应设备、 全球定位系统、 触觉感应设备。 0054 本发明根据用户在与检索系统交互过程中产生的间接信息而动态更新和重组搜 索结果的机制, 改进计算机检索系统的用户体验。本发明基于用户行为信息实时改进检索 结果, 排序靠前的条目始终为用户需要且未被访问的条目, 使用。
23、户更迅速地检索查询到其 所需信息, 提高了用户查看检索结果的效率, 从而实现为用户提供快速精确的检索服务的 目的。本发明在与用户交互的过程中逐步迭代改进每一次检索过程的结果, 保证用户每次 说 明 书 CN 102930041 A 6 4/11 页 7 首先看到的都是未阅读过的结果条目, 排列在检索结果前列的结果条目都是与用户想要的 最终结果最相似的, 且当用户回查历史访问条目时, 排序最靠前的条目就是用户最想回查 的条目, 改善了用户检索体验。 0055 本发明不需要直接询问用户问题, 而是通过间接读取用户与系统的交互行为信息 推测用户的偏好情况。例如, 当用户使用本发明系统检索信息时, 系。
24、统会返回相关结果条 目并显示每个结果条目的概述性内容, 用户会根据这些概述性内容选择查看结果条目的完 整内容。例如, 当用户依据内容概要信息查阅了一些检索结果的条目 ( 设检索结果为 RS, ResultSet) 后, 本系统自动从这些条目中提取它们的相似信息 ( 记为 CI, 即相似内容 ), 并 利用此相似信息 CI 在检索结果中再次检索 ( 亦可连接数据库重新检索 ), 动态更新检索结 果 RS 内容以及 RS 中条目的排名。 0056 再如, 系统检测用户已访问的条目和未访问的条目统计信息, 推测出用户不感兴 趣的方面, 动态降低检索结果中此类类目的排名。例如 : 假设用户访问了 RS。
25、 中的条目 R1, R2, R4 以及 R5, 则系统推断出该用户对条目 R3 以及与之相似的结果不感兴趣, 进一步将 RS 中与 R3 相似的的条目动态降低排名, 以减少该类条目对用户的干扰。 0057 本发明自动隐藏用户历史访问条目, 例如, 当用户访问了某条结果条目后再次返 回到检索结果页面时, 本发明系统将用户已访问过的条目自动隐藏。这样用户每次返回 到检索结果页面时看到的都是未访问过的结果条目, 从而减少了重复冗余信息对用户的干 扰。 即, 本发明将已访问的条目从检索结果的条目中转移至已访问的条目中, 保持用户在查 看检索结果时避免重复访问到已访问的条目, 使用户能始终查看未经访问的。
26、条目, 从而减 少了重复冗余信息对用户的干扰。 0058 本发明对隐藏的历史访问条目自动排序, 例如, 在历史访问条目自动隐藏后, 本发 明提供接口以便用户查看历史访问。 并且, 在每一次展开历史访问条目的内容时, 根据用户 的交互信息对历史访问条目进行排序, 以便用户能快速地从历史访问信息中找到自己关注 的条目。 例如, 本发明对用户已访问的条目中进行相似度对比, 选取其中相似度最高的相似 内容作为用户最感兴趣的内容。 通过根据该相似内容对检索结果中的条目进行相似度由高 到低的排序, 使检索结果中包含用户最感兴趣的内容的条目的排序靠前, 便于用户更快查 看到感兴趣的条目, 提高了用户查看条目。
27、的效率, 改善了用户的检索体验。 0059 本发明对用户在选择性或跳跃性访问时被忽略的条目归为历史忽略条目集合, 将 检索结果中的各条目与历史忽略条目集合中的每个被忽略条目进行相似度对比, 按照获得 的相似性权值由低至高对检索结果中的各条目进行排序, 使用户不感兴趣的内容的排序靠 后, 提高了用户查看条目的效率, 改善了用户的检索体验。 附图说明 0060 图 1 表示本发明基于用户行为信息的检索结果实时更新方法的流程图。 0061 图 2 表示本发明基于用户行为信息的检索结果实时更新方法的详细流程图。 0062 图 3 表示本发明基于用户行为信息的检索结果实时更新系统的结构图。 0063 图。
28、 4 表示本发明实施例中条目转移至历史访问条目集合的示意图。 0064 图 5 表示本发明相似历史访问条目排序模式的详细流程图。 0065 图 6 表示本发明实施例中基于用户行为信息的条目处理的示意图。 说 明 书 CN 102930041 A 7 5/11 页 8 0066 图 7 表示本发明隐藏历史访问条目模式的流程图。 0067 图 8 表示本发明相似历史访问条目排序模式的流程图。 0068 图 9 表示本发明相似忽略条目排序模式的流程图。 具体实施方式 0069 结合以下具体实施例和附图, 对本发明作进一步详细说明。 实施本发明的过程、 条 件、 实验方法等, 除以下专门提及的内容之外。
29、, 均为本领域的普遍知识和公知常识, 本发明 没有特别限制内容。 0070 如图 1 至图 9, 1- 数据库, 2- 检索装置, 3- 用户行为信息获取装置, 4- 条目处理装 置, 5- 相似度对比装置, 6- 显示装置。 0071 如图 1 与图 2 所示, 本发明基于用户行为信息的检索结果实时更新方法, 包括 : 0072 步骤一 : 获取包含至少一项条目的检索结果, 该检索结果通过显示装置 6 显示并 展示给用户。 0073 用户输入关键词。由检索装置 2 获得用户输入的关键词并对该关键词进行预处 理。关键词的预处理是指对关键词的修剪、 拆分、 合成等, 分析并提取出关键词中的核心部。
30、 分用于数据库 1 的检索。 0074 关键词预处理完毕之后, 进一步对该关键词是否符合检索要求进行判断。检索要 求通常包括关键词的长度要求、 关键词涉及的敏感信息审查要求等。 0075 当关键词不符合检索要求的, 则提示用户重新输入关键词直到关键词符合检索要 求或用户退出检索为止。 0076 若关键词符合检索要求, 则检索装置 2 利用该关键词在数据库 1 存储的海量信息 中进行检索直至生成相应的检索结果, 将该检索结果传输至条目处理装置 4, 条目处理装置 4获取该检索结果并保存, 该检索结果中包含一项或多项条目。 条目处理装置4将待显示的 条目传输至显示装置 6, 由显示装置 6 展示该。
31、检索结果及其所包含的各项条目。 0077 检索装置 2 在利用关键词生成检索结果时, 同时获得检索结果中各条目的相关信 息, 其中包括各条目的权值与被引用次数。使用关键词进行检索时, 检索装置 2 获得该条 目与关键词的权值。本发明中, 权值是指关键词与各条目的匹配程度。权值越高, 则说明 该条目与关键词的匹配程度越高。权值的计算方法可采用现有的算法及开源工具完成, 如 Lucene。例如, 含有与关键词相同内容的条目的权值是高于不含有与关键词相关内容的条 目的权值。 条目的被引用次数是指该条目被点击或引用或查阅的次数, 由数据库1保存。 检 索装置 2 获取条目时, 同时获取该条目的一些参数。
32、, 包括该条目的被引用次数。 0078 本发明中, 优选地, 条目处理装置 4 对获取的检索结果中的各项条目根据其权值 ( 权值是指关键词与各条目的匹配度 ) 进行排序, 例如, 按权值由高至低对各条目进行排 序。 0079 进一步优选地, 当检索结果中包含的多个条目具有相同的权值时, 即出现与关键 词匹配度相同的多个条目的情况, 则条目处理装置 4 根据各条目被引用的次数将这些权值 相同的条目再次排序, 例如, 根据被引用次数由高至低将各条目进一步排序。 0080 步骤二 : 获取用户行为信息。 0081 用户查看显示装置 6 展示的上述步骤一得到的检索结果。用户根据实际情况的不 说 明 书。
33、 CN 102930041 A 8 6/11 页 9 同, 通过鼠标、 键盘、 触摸屏等常用设备进行操作, 点击、 选取该检索结果中的各个相关条目 进行进一步访问。用户行为信息获取装置 3 通过监控用户操作, 判断用户访问某个 / 些条 目或忽略某个 / 些条目, 从而获得用户行为信息, 该用户行为信息反映用户对各条目不同 程度的关注或忽略。 0082 用户行为信息包括 : 用户历史访问条目、 用户忽略条目、 用户访问不同条目的时间 间隔、 用户历史访问条目的内容长度、 用户历史访问条目的阅读时间长度、 用户访问条目时 的生理体征信息。还包括用户在访问条目时可能的其他反应信息。例如, 用户行为。
34、信息获 取装置 3 监控到用户点选了某一条目作进一步访问, 则用户行为信息获取装置 3 判定该条 目为用户历史访问条目。 0083 例如, 用户在访问检索结果的条目时, 可能跳跃性地访问其中某些条目, 而忽略了 其他条目。 当用户点选某一条目时, 若该条目之前存在未被访问的条目, 用户行为信息获取 装置 3 判定这些未被访问的条目为用户忽略条目。 0084 例如, 用户行为信息获取装置 3 可通过检测用户访问不同条目时所花的时间和精 力推测用户实际感兴趣的内容。 进一步地, 为了提高本发明系统推断评估用户喜好的精度, 以该用户访问阅读该条目内容的时间长度除以该条目的内容长度所获得的一个度量值,。
35、 作 为对用户访问某条结果项所花的时间和精力的评估。例如, 当用户行为信息获取装置 3 检 测到用户在某个结果条目上花费的精力异常的高时, 更新系统推断该用户对该条目以及与 该条目类似的信息感兴趣, 并在后面的步骤中提升此类信息的排名, 以便该用户尽快获取 相关相似信息 ; 反之, 当用户行为信息获取装置 3 检测到用户在某个结果条目上花费的精 力异常的低时, 更新系统推断该用户对该条目以及与该条目类似的信息不感兴趣, 并在后 面的步骤中降低此类信息的排名, 以降低该用户尽快获取此类信息的几率。 0085 例如, 用户行为信息获取装置 3, 通过记录某一单独用户的历史阅读速度统计信息 来大致判。
36、断该用户阅读某个条目的预计时间, 以区分用户在阅读过程中受到其它干扰而导 致阅读时间变长的现象。 0086 优选地, 为了更准确推断用户喜好, 用户行为信息获取装置 3 还可以进一步通过 获取在阅读条目时的用户面部表情信息进行判断。 优选地, 本发明设置图像获取设备, 捕获 用户在阅读某个 / 些条目时的实时面部表情。进一步地, 设置面部表情分析模块, 分析用 户的实时表情, 建立每个条目的表情参数, 通过结合用户的其他行为参数, 捕捉用户行为信 息, 以确定用户喜好度。 例如, 在用户同意情况下可以直接通过浏览器插件的方式调用用户 计算机的图像捕捉设备。 0087 进一步地, 还可以获取用户。
37、在阅读条目时发生的眼球运动变化、 肢体特征变化、 心 率变化、 呼吸变化、 或可适用的其他生理体征信息。 0088 步骤三 : 基于用户行为信息选择处理模式, 并根据条目相似度, 对检索结果中的条 目进行处理。 0089 本发明中, 基于用户行为信息对检索结果包含的各项条目的处理模式包括 : 隐藏 历史访问条目、 相似历史访问条目排序、 相似忽略条目排序等模式。 本发明可以采用上述三 种模式中的任意一种, 还可用任意两种或任意两种以上的模式组合。 0090 图 7 显示的是本发明隐藏历史访问条目模式的流程图。在执行隐藏历史访问条目 模式后, 当用户访问某一条目后再次返回到检索结果页面时, 用户。
38、已访问过的条目被自动 说 明 书 CN 102930041 A 9 7/11 页 10 隐藏, 在检索结果列表的页面上则不再显示该用户刚刚访问过的条目, 即, 在返回检索结果 列表的页面之后用户看到的全部条目一定是该用户未访问过的。其中, 用户已访问的条目 从检索结果的内容中转移至历史访问条目集合中。 历史访问条目集合存储于条目处理装置 4 中。 0091 进一步地, 历史访问条目自动隐藏之后, 若用户需要查看所隐藏历史访问的记录, 本发明提供展示历史阅读条目重新的功能, 用户可查阅所有历史访问信息。 进一步地, 为方 便用户从历史访问信息中快速找出关注条目, 本发明在展开历史访问条目时可以根。
39、据用户 行为信息对历史访问条目进行排序, 例如, 通过相似度对比装置 5 对历史访问条目集合中 的各历史访问条目的摘要等信息进行相似度对比, 提取出各条目摘要中最常出现的内容作 为相似内容, 例如, 以出现最多的内容作为相似内容。 再依据各条目与相似内容的相似度进 行由高到低的排序, 使历史访问条目集合中包含用户最感兴趣的内容的条目的排序靠前。 进一步地, 本发明也可以条目被访问的时间由近到远对各条目进行排序。 0092 图 8 显示的是本发明相似历史访问条目排序模式的流程图。相似历史访问条目排 序模式是指根据历史访问条目集合, 对检索结果中的条目排序。 0093 条目处理装置 4 自动保存用。
40、户在当前会话中已访问的条目归入历史访问条目集 合中 ( 记为 VisitedItemSet)。例如, 如图 4 所示, 当用户行为信息获取装置 3 检测到用户 访问了检索结果 ( 记为 ResultSet) 中的某一条目 A 或者条目子集 A 时, 这一条目 A 或条目 子集 A 会自动被转移到历史访问条目集合 VisitedItemSet 中。VisitedItemSet 是用户在 访问检索结果的过程中所形成的条目集合, 自动保存在条目处理装置 4 中。 0094 由相似度对比装置 5 计算 VisitedItemSet 中各历史访问条目的相似性 ( 记为 Similarity)。各条目相似。
41、性的比较可以依据各条目的摘要或内容或关键词等内容计算出 相似性最强的相似内容。相似度对比装置 5 根据此相似内容再次对检索结果中的各条目 进行相似度对比, 得出检索结果中各条目与该相似内容的相似度值, 根据该相似度值更新 ResultSet 中各条目的排序。 0095 更新 ResultSet 中各条目排序可以依据用户需要不同而设置, 例如, 可以依相似 度值由高到低排序, 或依相似度值由低到高排序, 也可以依据其他设置条件进行排序。 0096 优选地, 本发明中更新后的检索结果(更新后的ResultSet)中按照条目相似性的 相似度值由高到低排序。 0097 优选地, 历史访问条目集合 ( 。
42、已访问条目集合 ) 中的各历史访问条目根据与相似 内容的相似度值由高至低进行排序, 使用户能快速地从历史信息中找到自己最关注的条 目。更新后重新排序的 ResultSet 中的各条目不马上展示给用户, 而是等到用户回到检索 结果页面时由显示装置 6 向用户展示。 0098 如图 5, 本发明较佳实施例具体采用以下的方式实现 : 0099 说 明 书 CN 102930041 A 10 8/11 页 11 0100 其中, 上述过程中使用了一个外部算法过程 : 更新一个条目与相似性集合的相 似度的 updateSimilarity 算法, 此算法可为通用的相似度算法, 比如计算两个集合的 Jac。
43、card 指数的算法 : 0101 图 9 显示的是本发明相似忽略条目排序模式的流程图。相似忽略条目排序模式, 是根据被忽略条目对检索结果的条目进行进一步排序。 0102 条目处理装置 4 可以通过如下方式判断用户对某一条目不感兴趣 : 当用户跳跃性 / 选择性访问检索结果列表中的各项条目时, 若被访问的条目之前存在未被访问的条目, 则 认为被跳过的未被访问的条目以及与之类似的条目属于被忽略的条目。例如, 如图 6 所示, 说 明 书 CN 102930041 A 11 9/11 页 12 检索结果中包含 R1 至 R5 五个条目, 用户访问了检索结果中的条目 R1, R2, R4 以及 R5。
44、, 则 条目 R3 为被忽略条目。条目处理装置 4 推断出该用户对条目 R3 以及与之相似的检索结 果的条目不感兴趣, 进一步地, 将检索结果条目 RS 中的与 R3 相似的条目进行动态降低排 名, 以减少该类条目 (R3 相似的条目 ) 对用户的干扰。本实施例中, 条目处理装置 4 自动 保存用户在当前会话中被忽略的条目归入历史忽略条目集合中 ( 记为 IgnoredItemSet)。 历史忽略条目集合存储在条目处理装置 4 中。当用户忽略了检索结果 ResultSet 中的某 一条目或者条目子集时, 这一条目或子集会自动被加入 IgnoredItemSet 中。相似度对比 装置 5 计算检。
45、索结果 ResultSet 中每个条目与 IgnoredItemSet 中各个条目的相似性权值 SimilarityWeight 并根据此相似性权值 SimilarityWeight 更新 ResultSet 中各条目的排 序。例如, 更新后的检索结果的条目按照 SimilarityWeight 由低到高排序。 0103 相似性权值由相似度对比装置 5 将检索结果中的一个条目与历史忽略条目集合 的已忽略条目进行相似度对比, 得出该条目与所有已忽略条目的相似度值。将该条目的相 似度值进行加权和运算, 得出该条目的相似性权值。相似度对比装置 5 遍历检索结果中所 有条目后, 计算得出所有条目的相似。
46、性权值。 相似性权值的具体公式为 : SimilarityWeight Similarity_1*Weight(Similarity_1)+Similarity_2*Weight(Similarity_2)+ +Similarity_n*Weight(Similarity_n), 其中, Weight 为系统定义的相似度加权因子函数, 通过使用该函数可确定不同相似度的加权因子, 且相似度越高加权因子越高, 例如, 本实施 例中的 Weight 函数定义为 : 0104 Weight(Similarity) ; 0105 RETURN Similarity 0106 该 函 数 使 得 相 似 。
47、度 拥 有 与 之 相 同 的 加 权 因 子, 相 似 度 越 高 加 权 因 子 越 高。 此 时 权 值 公 式 即 推 导 为 相 似 度 的 平 方 和,即 SimilarityWeight Similarity_12+Similarity_22+Similarity_n2。举例说明如下, 设某条目 ( 记为 I1) 与 IgnoredItemSet( 假设包含三个条目 ) 中条目的相似度分别为 1, 0.1 以及 0.2, 那么 这三个相似度的加权因子分别为 1, 0.1 和 0.2, 则 I 与 IgnoredItemSet 的相似度权值等于 12+0.12+0.221.05 ;。
48、 又设某条目(记为I2)与IgnoredItemSet(假设包含三个条目) 中条目的相似度分别为0.5, 0.6以及0.1, 那么这三个相似度的加权因子分别为0.5, 0.6和 0.1, 则 I2 与 IgnoredItemSet 的相似度权值等于 0.52+0.62+0.22 0.65。由于 1.05 大于0.65, 所以I1比I2与IgnoredItemSet中条目更相似, 在下一步的更新过程中I1就排 列在 I2 之后。 0107 显示装置 6 并不马上将更新过的检索结果展示给用户, 而是等到用户回到检索结 果页面时进行展示。本发明较佳实施例中, 本发明的相似度对比装置 5 实现过程与上。
49、述相 似历史访问条目排序模式的实现过程类似, 区别在于当条目处理装置 4 检测到用户对于某 一条目不感兴趣之后, 则更新历史忽略条目集合, 并降低检索结果中与该忽略条目的相似 条目的排名。 0108 条目处理装置 4 可结合上述隐藏历史访问条目、 相似历史访问条目排序、 相似忽 略条目排序等模式中的多个模式对检索结果进行处理。例如, 条目处理装置 4 执行隐藏历 史访问条目模式之后, 执行相似历史访问条目排序模式, 根据保存其中的历史访问条目集 合, 利用相似度对比装置5计算相似度值, 条目处理装置4根据该相似度值对检索结果的条 说 明 书 CN 102930041 A 12 10/11 页 13 目进行排序, 将用户感兴趣的条目的排序提前。执行完上述步骤后, 条目处理装置 4 继续执 行相似忽略条目排序模式。条目处理装。