一种面向移动终端的三维标签云可视化方法 技术领域 本发明涉及一种属于网络技术领域的标签云可视化方法, 尤其涉及一种面向移动 终端的三维标签云可视化方法。
背景技术 标签是一个用来标记互联网在线资源的关键字或术语, 这种元数据用来描述在线 资源, 并且方便在线资源被再次浏览或者检索。一个在线资源可以有一个或多个与之相连 的标签。作者可以比较随意地和非正式地选取标签, 通常标签不属于一些正式的或者确定 的分类方案 ( 比如由界、 门、 纲、 目、 科、 属、 种等单元组成的生物学的分类系统 )。
标签通常用于动态、 灵活、 自动生成的互联网在线资源, 如计算机文件, 网页, 数码 图像, 以及互联网的书签。由于这个原因, “标签” 已成为 Web 2.0 运动的重要组成部分。
标签云是标签的一种可视化描述方式, 用于汇总用户生成的标签, 并根据其出现 频率等因素以不同的字体大小和颜色显示, 以方便用户浏览。在 Web 2.0 应用中, 标签云被
认为是一种可以有效的帮助用户浏览和检索网站信息的手段而被广泛使用。
经文献检索发现, Roy Tanck 在 2009 年 5 月 25 日发布的 WP-Cumulus 1.21 中支 持三维标签云, 使得静态标签云中容易被忽略的低频标签也有机会滚动到最前方, 有了被 注意到的可能。
然而, 当标签数量太多的时候标签云就会显得杂乱 ; 或者某个特定在线资源只能 通过某个特定标签访问, 而这个标签字体又很小, 用户很难在标签云里找到。 在将标签云技 术应用到移动终端的时候, 受到移动终端显示屏幕尺寸有限, 键盘操作不便的限制, 上述的 问题因而变得更加严重。 发明内容
本发明的目的在于克服现有技术的缺陷, 采用数据挖掘和可视化显示的方法, 提 供一种面向移动终端的三维标签云可视化方法, 改善移动终端基于标签浏览的用户体验。
为实现上述目的, 本发明采用一种面向移动终端的三维标签云可视化方法, 包括 以下几个步骤 :
A、 计算标签之间的关联度, 以及标签和在线资源之间的关联度 ;
B、 使用三维方法显示关联度最高的前 K 个标签, 标签的字体大小和颜色与标签的 关联度成正比 ;
C、 根据移动终端按键的不同, 支持标签和在线资源之间切换浏览, 并内嵌标签和 在线资源的搜索框 ;
为了更好地描述本发明, 定义以下符号 :
N 表示标签的总数目
M 表示在线资源的总数目
T = {t1, t2, ..., tN} 表示系统中所有的 N 个标签R = {r1, r2, ..., rM} 表示系统中所有的 M 个在线资源
TT = {t1t1, t1t2, ..., tNtN} 表示标签和标签之间的关联度, 其中 titj 表示标签 ti 和标签 tj 之间的关联度, TR = {t1r1, t1r2, ..., tNrM} 表示标签和在线资源之间的关联度, 其中 tirj 表示标签 ti 和在线资源 rj 之间的关联度
C = {c11, c12, ..., cNM} 表示标签用于标注在线资源的频率, cij 表示标签 ti 用于标注在线资源 rj 的频率
Ri 表示标签 ti 所标记的在线资源集
Rj 表示标签 tj 所标记的在线资源集
|Ri ∩ Rj| 表示 Ri 和 Rj 的交集的大小
|Ri ∪ Rj| 表示 Ri 和 Rj 的并集的大小
表示标签 ti 的总使用频率,Xi 表示在线资源 ri 的总使用频率。
本发明针对移动终端的屏幕尺寸有限的特点, 当标签数量太多的时候, 此方法根 据标签之间的关联度以及标签和在线资源之间的关联度, 只显示最相关的前 K 个标签或在 线资源 ; 如果某个特定在线资源只能通过某个特定标签访问, 而这个标签字体又很小, 可以 通过内嵌的搜索框来查询标签或在线资源, 把基于标签的浏览和搜索结合起来, 显著改善 移动终端基于标签浏览的用户体验。 附图说明
图 1 为本发明实施例的流程示意图 ;
图 2 为本发明实施例举例说明的初始标签云示意图 ;
图 3 为本发明实施例举例说明的标签 “川菜” 的相关标签云示意图 ;
图 4 为本发明实施例举例说明的美食店 “喜多屋国际海鲜料理 ( 正大店 )” 的相关 标签云示意图 ;
图 5 为本发明实施例举例说明的通过移动终端的 4 方向导航键选中标签 “川菜” 的 示意图 ;
图 6 为本发明实施例举例说明的连续点击标签 “川菜” 和 “馋嘴牛蛙” 显示最相关 的 K 家美食店的示意图 ; 图 7 为本发明实施例举例说明的点击美食店 “俏江南 881 会所” 显示其详细资料 的示意图 ;
图 8 为本发明实施例举例说明的点击移动设备的某个键 ( 例如 # 键 ), 出现的标签 搜索框和美食店搜索框的示意图。
具体实施方式
如图 1、 2、 3、 4、 5、 6、 7、 8 所示, 本发明的具体实施例是一种面向移动终端的三维标 签云可视化方法, 包含以下 3 个步骤 :
A、 计算标签之间的关联度, 以及标签和在线资源之间的关联度 ;
B、 使用三维方法显示关联度最高的前 K 个标签, 标签的字体大小和颜色与标签的关联度成正比 ;
C、 根据按键的不同, 支持标签和在线资源之间切换, 并内嵌搜索框支持标签和在 线资源的搜索。
举例说明如下 :
例如有一个在线美食点评的网站, 在线资源是指美食店, 例如 “大渔铁板烧 ( 龙之 梦店 )” , 标签是指点评人对美食店的标记, 例如 “铁板烧” , “情侣约会” 和 “自助餐” 等。
为了更好地描述本发明, 我们用一个在线美食点评的网站的例子来具体化以下符号 :
N 表示标签的总数目, 例如这个在线美食点 评的网站一共有 2000 个标签
M 表示在线资源的总数目,
例如这个在线美食点评的网站一共有 10000 家美食店
T = {t1, t2, ..., tN} 表示系统中所有的 N 个标签
R = {r1, r2, ..., rM} 表示系统中所有的 M 个在线资源
TT = {t1t1, t1t2, ..., tNtN} 表示标签和标签之间的关联度, 其中 titj 表示标签 ti 和标签 tj 之间的关联度。例如标签 “铁板烧” 和标签 “自助餐” 的关联度。 TR = {t1r1, t1r2, ..., tNrM} 表示标签和在线资源之间的关联度, 其中 tirj 表示标签 ti 和在线资源 rj 之间的关联度。例如标签 “铁板烧” 和美食店 “大渔铁板烧 ( 龙之梦店 )” 的关联度
C = {c11, c12, ..., cNM} 表示标签用于标注在线资源的频率, cij 表示标签 ti 用于标 注在线资源 rj 的频率。例如美食店 “大渔铁板烧 ( 龙之梦店 )” 的标签 “铁板烧” 被使用了 200 次, 标签 “情侣约会” 被使用了 100 次, 标签 “自助餐” 被使用了 50 次。
Ri 表示标签 ti 所标记的在线资源集合的大小。例如标签 “铁板烧” 一共标记过 300 家美食店。
Rj 表示标签 tj 所标记的在线资源集合的大小。例如标签 “自助餐” 一共标记过 400 家美食店
|Ri ∩ Rj| 表示 Ri 和 Rj 的交集的大小。例如同时包含标签 “铁板烧” 和 “自助餐” 的美食店一共 100 家。
|Ri ∪ Rj| 表示 Ri 和 Rj 的并集的大小。例如包含标签 “铁板烧” 或 “自助餐” 的美 食店一共 600 家。
Si 表示标签 ti 的总使用频率,例如标签 “铁板烧”的总使用频率为4000 次。
Xi 表示在线资源 ri 的总使用频率,例如美食店 “大渔铁板烧 ( 龙之梦店 )” 的总使用频率为 350 次 ( 其中标签 “铁板烧” 被使用了 200 次, 标签 “情侣约会” 被使 用了 100 次, 标签 “自助餐” 被使用了 50 次 )。
所述的步骤 A, 具体如下 :
A1、 标签 ti 和标签 tj 之间的关联度 titj 的计算方法例如标签 “铁板烧” 和标签 “自助餐” 的关联度为 100/600 = 0.17 A2、 标签 ti 和在线资源 rj 之间的关联度 tirj 的计算方法例如标签 “铁 板 烧”和 美 食 店 “大 渔 铁 板 烧 ( 龙 之 梦 店 )”的 关 联 度 为 (200/350)*log(10000/300) = 0.87
标签 “自 助 餐” 和 美 食 店 “大 渔 铁 板 烧 ( 龙 之 梦 店 )” 的 关 联 度 为 (50/350)*log(10000/400) = 0.20
A3、 多个标签和在线资源 rj 之间的关联度的计算方法例如 2 个标签 (“铁板烧” 和 “自助餐” ) 和美食店 “大渔铁板烧 ( 龙之梦店 )” 的 关联度为 0.87+0.20 = 1.07
所述的步骤 B, 当计算得到标签之间, 以及标签和在线资源之间的关联度之后, 具体如下 B1、 标签的字体大小的计算方法
当用户刚开始浏览标签时, 标签 ti 的字体大小和标签的总使用频率 Si 成正比, 即 越热门的标签其字体越大, 只显示前 K 个 Si 最大的标签。例如, 如图 2 所示, 最热门的 3 个 标签是 “商务宴请” 、 “朋友聚餐” 和 “自助餐” , 其 Si 分别为 10000, 9000 和 7000 次, 因此其 初始字体最大。注意在三维标签云中, 随着标签的转动, 其字体会相应变化, 使得静态标签 云中容易被忽略的低频标签也有机会滚动到最前方, 有了被注意到的可能, 但变化后的字 体大小仍然与其初始字体大小成正比。
当用户点击一个标签 ti, 浏览与之关联的标签时, 标签 tj 的字体大小取决于 tj 和 上一个标签 ti 的关联度 titj。关联越紧密的标签其字体越大, 只显示前 K 个 titj 最大的标 签。例如, 如图 3 所示, 用户点击一个标签 “川菜” 后, 显示关联度 titj 最大的三个标签 “水 煮鲶鱼” , “馋嘴牛蛙” , “酸梅汤” , 其关联度 titj 分别为 0.75, 0.70, 0.60。当用户点击一个 在线资源 rj, 浏览与之关联的标签时, 标签 ti 的字体大小取决于频率 cij。频率越高的标签 其字体越大, 只显示前 K 个 cij 最大的标签。如图 4 所示, 与美食店 “喜多屋国际海鲜料理 ( 正大店 )” 相关的标签分别为 “自助餐” 、 “朋友聚餐” 、 “可用信用卡” 、 “情侣约会” 、 “朋友聚 会” 、 “商务宴请” 、 “可停车” 、 “休闲” 、 “约会” 和 “日本” , 其频率 cij 分别为 6000, 2500, 2000, 1000, 800, 600, 400, 300, 200, 200, 因此 “自助餐” 、 “朋友聚餐” 、 “可用信用卡” 的初始字体最 大。
B2、 标签颜色的计算方法
与以上 B1 类似, 字体越大的标签其颜色也越醒目, 例如但不局限于, 字体最大的 标签用红色表示, 字体最小的用黑色表示。
所述的步骤 C, 当计算得到权值最大的 K 个标签的字体大小和颜色之后, 具体如下
C1、 在当前标签云中, 如果点击某个移动设备的键 ( 例如 * 键 ), 通过移动终端的
4 方向导航键选中标签 tj, 点击选择键则显示与此标签 tj 最相关的 ( 按关联度 titj 排列 )K 个标签。例如, 如图 5 所示, 点击标签 “川菜” , 则显示如图 3 所示的与标签 “川菜” 最相关的 K 个标签, 分别为 “水煮鲶鱼” , “馋嘴牛蛙” , “酸梅汤” 等。
C2、 在当前标签云中, 如果点击某个移动设备的键 ( 例如 ** 键 ), 通过移动终端的 4 方向导航键选中标签 点击选择键则显示与此前多个标签 最相关的 ( 按关联度 排列 )K 个在线资源。例如, 如果连续点击标签 “川菜” 和 “馋嘴牛蛙” , 则显示如图 6 所示的最相关的 K 家美食店 “红辣椒杨浦店” 、 “麻辣诱惑梅龙镇广场店” 、 “忆蜀乐” 、 “俏江 南 881 会所” 、 “揽香川菜馆金鹰店” 、 “渝信川菜招商局店” 、 “辛香汇淮海中路店” 、 “俏江南虹 桥” 和 “小巴辣子川湘菜餐厅创智天地店” , 其关联度 分别为 0.90、 0.80、 0.70、 0.65、 0.60、 0.55、 0.50、 0.45、 0.45。
C3、 在当前标签云中, 如果没有点击某个移动设备的键 ( 例如 * 键 ), 通过移动终 端的 4 方向导航键选中标签 tj, 点击选择键则显示与此标签 tj 最相关的 ( 按关联度 tirj 排 列 )K 个的在线资源。
C4、 当前显示的是在线资源, 如果点击某个移动设备的键 ( 例如 * 键 ), 通过移动终 端的 4 方向导航键选中在线资源 rj, 点击选择键则显示与此在线资源最相关的 ( 按频率 cij 排列 )K 个标签。例如, 点击在线资源 “喜多屋国际海鲜料理 ( 正大店 )” , 则显示如图 4 所 示的相关标签分别为 “自助餐” 、 “朋友聚餐” 、 “可用信用卡” 、 “情侣约会” 、 “朋友聚会” 、 “商务 宴请” 、 “可停车” 、 “休闲” 、 “约会” 和 “日本” , 其频率 cij 分别为 6000, 2500, 2000, 1000, 800, 600, 400, 300, 200, 200。
C5、 当前显示的是在线资源, 如果没有点击某个移动设备的键 ( 例如 * 键 ), 通过 移动终端的 4 方向导航键选中在线资源 rj, 点击选择键则显示与此在线资源 rj 对应的详细 资料。例如, 当用户点击在线资源 “俏江南 881 会所” , 则显示如图 7 所示的 “俏江南 881 会 所” 的详细资料。
C6、 在任何时候, 如果点击移动设备的某个键 ( 例如 # 键 ), 则显示搜索框, 键入想 要搜索的标签或者在线资源名字, 就会出现最匹配的 K 个标签或者在线资源。例如, 在上述 C1 步骤中, 如果点击移动设备的某个键 ( 例如 # 键 ), 则会出现搜索框, 如图 8 所示, 用户可 以搜索标签或者美食店, 如果搜索标签 “川菜” , 则得到图 3 所示的标签云 ; 如果搜索美食店 “川菜 馋嘴牛蛙” , 则得到图 6 所示的美食店列表。