议题显示系统和议题显示方法.pdf

上传人:r7 文档编号:1304706 上传时间:2018-04-14 格式:PDF 页数:18 大小:1.03MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510807429.6

申请日:

2015.11.19

公开号:

CN106682049A

公开日:

2017.05.17

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20151119|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

财团法人资讯工业策进会

发明人:

郭台达; 陈棅易

地址:

中国台湾

优先权:

2015.11.09 TW 104136867

专利代理机构:

北京康信知识产权代理有限责任公司 11240

代理人:

李静;马强

PDF下载: PDF下载
内容摘要

本发明提供一种议题显示系统和议题显示方法,议题显示系统包括输入单元、显示单元及运算处理单元。输入单元接收使用者设定对应议题的初始关键词。显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的多个标签,并根据标签共同出现的关联性获得网页主题内容的当期关键词组。当期关键词组包括至少一当期关键词。接着,运算处理单元分析当期关键词之间以社群声量为基础计算的关联强度,并将初始关键词的重复度与依社群声量计算所得的关联强度进行比较,以决定是否产生至少一衍生议题。当决定产生至少一衍生议题时,使显示单元显示议题和至少一衍生议题。

权利要求书

1.一种议题显示系统,其特征在于,所述议题显示系统包括:
一输入单元,所述输入单元接收使用者设定的对应一议题的一
初始关键词;
一显示单元,所述显示单元基于时间特性显示所述议题在一时
间区间内的至少一衍生议题;以及
一运算处理单元,所述运算处理单元耦接所述输入单元与所述
显示单元,获得所述时间区间内的多个网页主题内容的多个标签,
并根据所述标签共同出现的关联性获得所述网页主题内容的一当期
关键词组,其中,所述当期关键词组包括至少一当期关键词,接着
所述运算处理单元分析所述当期关键词之间以社群声量为基础计算
的关联强度,并将所述初始关键词的重复度与根据社群声量计算所
得的关联强度进行比较,以决定是否产生所述至少一衍生议题,并
且当决定产生所述至少一衍生议题时,所述运算处理单元使所述显
示单元显示所述议题和所述至少一衍生议题。
2.根据权利要求1所述的议题显示系统,其中,所述初始关键词能通
过所述输入单元接收使用者设定的一主题网页文章并通过所述运算
处理单元分析所述主题网页文章的内容而获得。
3.根据权利要求1所述的议题显示系统,其中,所述运算处理单元首
先根据所述当期关键词组读取的所述网页主题内容,通过标题、内
容比对或文章连结追溯方式将所述网页主题内容分群,再根据分群
后每一群的网页主题内容来分析所述至少一当期关键词之间的社群
声量,并将所述当期关键词组所包括的至少一当期关键词与所述初
始关键词计算重叠率,以及将至少一当期关键词的社群声量与所述
初始关键词的社群声量进行比较。
4.根据权利要求1所述的议题显示系统,其中,所述运算处理单元在
分析所述至少一当期关键词之间的关联强度时,分别根据所述当期
关键词在所述时间区间内所述网页主题内容中出现的次数以及所述
当期关键词在同一所述网页主题内容出现的次数,再加入所述网页
主题内容对应的社群声量值来进行计算。
5.根据权利要求1所述的议题显示系统,其中,所述运算处理单元根
据所述标签共同出现的关联性获得所述网页主题内容的至少一当期
关键词,在判断所述网页主题内容的各个标签在所述网页主题内容
中出现的次数超过一出现次数的阈值时,所述运算处理单元将所述
标签决定为至少一当期关键词。
6.根据权利要求1所述的议题显示系统,其中,所述运算处理单元利
用K-core演算法建立每一所述网页主题内容的所述标签。
7.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单
元根据所述至少一当期关键词与所述初始关键词的重叠率,以判断
所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议
题。
8.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单
元根据社群声量高的所述至少一当期关键词是否改变,以判断所述
时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。
9.根据权利要求1所述的议题显示系统,其中,当所述当期关键词组
中所有所述当期关键词的社群声量加总高于所述初始关键词的社群
声量加总时,所述运算处理单元判断所述时间区间内的所述网页主
题内容已产生所述至少一衍生议题且主要讨论议题已转变。
10.一种议题显示方法,其特征在于,执行于一议题显示系统,所述议
题显示系统包括一输入单元、一显示单元以及一运算处理单元,所
述议题显示方法包括:
使用者利用所述输入单元设定对应一议题的一初始关键词;
所述运算处理单元获得一时间区间内的多个网页主题内容的
多个标签,并根据所述标签共同出现的关联性获得所述网页主题内
容的一当期关键词组,其中,所述当期关键词组包括至少一当期关
键词,接着所述运算处理单元分析所述关键词之间以社群声量为基
础计算的关联强度,并将所述初始关键词的重复度与根据社群声量
计算所得的关联强度进行比较,以决定是否产生至少一衍生议题,
并且当决定产生所述至少一衍生议题时,所述运算处理单元使所述
显示单元显示所述议题和所述至少一衍生议题;以及
所述运算处理单元利用所述显示单元基于时间特性显示所述
议题和所述至少一衍生议题。
11.根据权利要求10所述的议题显示方法,其中,在设定所述初始关键
词的步骤中,所述初始关键词能通过所述输入单元接收使用者设定
的一主题网页文章并通过所述运算处理单元分析所述主题网页文章
的内容而获得。
12.根据权利要求10所述的议题显示方法,其中,所述运算处理单元首
先根据所述当期关键词组读取的所述网页主题内容,通过标题、内
容比对或文章连结追溯方式将所述网页主题内容分群,再根据分群
后每一群的网页主题内容来分析所述至少一当期关键词之间的社群
声量,并将所述当期关键词组所包括的至少一当期关键词与所述初
始关键词计算重叠率,以及将至少一当期关键词的社群声量与所述
初始关键词的社群声量进行比较。
13.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元在分析所述至少一当期关键词之间的关联
强度时,分别根据所述当期关键词在所述时间区间内所述网页主题
内容中出现的次数以及所述当期关键词在同一所述网页主题内容出
现的次数,再加入所述网页主题内容对应的社群声量值来进行计算。
14.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元根据所述标签共同出现的关联性获得所述
网页主题内容的至少一当期关键词,在判断所述网页主题内容的各
个标签在所述网页主题内容中出现的次数超过一出现次数的阈值
时,所述运算处理单元将所述标签决定为至少一当期关键词。
15.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元利用K-core演算法建立每一所述网页主题
内容的所述标签。
16.根据权利要求10或13所述的议题显示方法,所述议题显示方法还
包括:
所述运算处理单元根据所述至少一当期关键词与所述初始关
键词的重叠率,以判断所述时间区间内的所述网页主题内容是否已
产生所述至少一衍生议题。
17.根据权利要求10或13所述的议题显示方法,所述议题显示方法还
包括:
所述运算处理单元根据具有高社群声量的所述至少一当期关
键词是否改变,以判断所述时间区间内的所述网页主题内容是否已
产生所述至少一衍生议题。
18.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
当所述当期关键词组中所有所述当期关键词的社群声量加总
高于所述初始关键词的社群声量加总时,所述运算处理单元判断所
述时间区间内的所述网页主题内容已产生所述至少一衍生议题且主
要讨论议题已转变。

说明书

议题显示系统和议题显示方法

技术领域

本发明涉及一种议题显示系统和议题显示方法,且特别是一种能够自
动判断与产生出衍生议题的议题显示系统和议题显示方法。

背景技术

基于网络的普及,人们经常使用网络获得信息。当一件事件或社会现
象正在发生时,网络上会出现相当多具有相关内容的网页,例如:当一件
食品安全事件发生时,在新闻媒体或社群媒体上会大量出现食品安全的相
关内容。不但如此,人们也基于网络上所发布的信息在网络上进行讨论,
如此则形成网络舆论。

现有的网络舆论分析系统为搜索引擎式的,其以关键词组进行搜索,
并根据搜索结果将有关键词组的各篇新闻文章列出,或者显示文字与文字
关联图。然而,在网络社群舆情议题的观察期间,有时会出现讨论议题方
向出现改变。然而,难以以关键词组来分析出议题与后续的衍生的议题及
其变化。衍生议题的切分需利用人工方式,造成舆论分析的费时与低效率,
且不具即时性。并且,以原设定关键词搜索网络文章,可能遗漏衍生议题
文章,有涵盖性不足的缺点。

发明内容

本发明实施例提供了一种议题显示系统和议题显示方法,避免了以人
工逐一辨识并汇整相关议题,有助于舆情分析结果的即时性与全面性的舆
情观察。

本发明实施例提供了一种议题显示系统,包括输入单元、显示单元以
及运算处理单元。输入单元接收使用者设定对应一议题的一初始关键词。
显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处
理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的
多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的当
期关键词组,其中,当期关键词组包括至少一当期关键词,接着运算处理
单元分析当期关键词之间以社群声量为基础计算的关联强度,并将初始关
键词的重复度与根据社群声量计算所得的关联强度进行比较,以决定是否
产生至少一衍生议题,并且当决定产生至少一衍生议题时,运算处理单元
使显示单元显示议题和至少一衍生议题。

本发明实施例提供了一种议题显示方法,执行于一议题显示系统,议
题显示系统包括输入单元、显示单元以及运算处理单元。所述方法包括:
使用者利用输入单元设定对应一议题的初始关键词;运算处理单元获得一
时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的
关联性获得所述网页主题内容的当期关键词组,其中,当期关键词组包括
至少一当期关键词,接着运算处理单元分析关键词之间以社群声量为基础
计算的关联强度,并将初始关键词的重复度与根据社群声量计算所得的关
联强度进行比较,以决定是否产生至少一衍生议题,并且当决定产生至少
一衍生议题时,运算处理单元使显示单元显示议题和至少一衍生议题;以
及运算处理单元利用显示单元基于时间特性显示议题和至少一衍生议题。

综上所述,本发明实施例提供一种议题显示系统和议题显示方法,由
议题的初始关键词获得多个网页主题内容,并进一步获得网页主题内容的
当期关键词组。接着,获得初始关键词与当期关键词组的社群声量,并计
算初始关键词与当期关键词组之间的关联强度,由此判断是否产生衍生议
题。据此,可以基于时间特性显示议题的演进。

为使能更进一步了解本发明的特征和技术内容,请参阅以下有关本发
明的详细说明与附图,但是这些说明和附图仅用于说明本发明,而非对本
发明的权利范围作任何的限制。

附图说明

图1是本发明实施例提供的议题显示系统的示意图。

图2是本发明实施例提供的议题显示分析的概念的流程图。

图3A是本发明实施例提供的议题显示系统显示一网页主题内容的示
意图。

图3B是本发明实施例提供的设定追踪的议题的互动界面的示意图。

图4是本发明实施例提供的字词关系图的示意图。

图5A是本发明实施例提供的在时间区间T1的当期关键词的关联强
度的示意图。

图5B是本发明实施例提供的在时间区间T2的关联强度的示意图。

图5C是本发明实施例提供的在时间区间T3的关联强度的示意图。

图6是本发明实施例提供的图形化显示议题以及衍生议题的示意图。

图7是本发明实施例提供的议题显示方法的流程图。

【符号说明】

1:议题显示系统

11:输入单元

12:运算处理单元

13:显示单元

2:使用者

3:网络

S101、S102、S103、S104、S105、S106、S107、S108、S109、S110、
S210、S220、S230、S240:步骤流程

30:主题网页文章

31、34:网页按钮

32:议题

33:初始关键词

35:点赞

36:分享

37:评价

401、402、403、404、405、406、407、408、409、410、411、412、
413、414:字词

T1、T2、T3:时间区间

501、502、503、504、505、506、507、508、509:关键词

A1:议题

A2、A3、A4、A5、A6、A7、A8、A9、A10、A11:衍生议题

具体实施方式

〔议题显示系统和议题显示方法的实施例〕

请参照图1,图1是本发明实施例提供的议题显示系统的示意图。议
题显示系统1包括输入单元11、显示单元13以及运算处理单元12。输入
单元11与显示单元13耦接运算处理单元12。此议题显示系统1可例如设
置于一连接网络的网络服务器,但本发明并不因此限制。使用者2可操作
输入单元11的人机互动界面或者利用终端装置通过网络连线此网络服务
器的输入单元11。输入单元11可以网页方式或是特定的应用程序界面来
呈现,但本发明并不因此限定。所述终端装置可以是个人电脑、智能手机、
平板电脑等,但本发明并不限定终端装置的类型。运算处理单元12则与
网络3连线,以搜集网络3上的多个网址的网页主题内容。显示单元13
用以基于时间特性显示议题和时间区间内的至少一衍生议题。例如,显示
单元13根据时间轴显示议题和至少一衍生议题之间的关联性。议题显示
系统1的详细的运算处理细节将于下进一步说明。

以下将以网页呈现的人机互动界面作为输入单元11和显示单元的例
子,以说明议题显示系统1的操作方式。请同时参照图1与图2,图2是
本发明实施例提供的议题显示分析的概念的流程图。首先,使用者选取网
页的议题(步骤S101)。当使用者利用议题显示系统1观看某一网页的网
页主题内容时,如图3A的主题网页文章30,此议题显示系统1可提供并
显示一个加入追踪的网页按钮31,参照图3A,用以提供使用者设定加入
追踪的议题(S102)。议题显示系统1可将欲追踪的网页导引至设定追踪
的议题的互动界面的网页,参照图3B。使用者可设定议题的初始关键词
33。上述的初始关键词33并不限定为一个关键词,可以是多个关键词。
根据使用者2设定对应议题32的初始关键词33,当使用者2按下新增的
网页按钮34时,议题显示系统1则储存对应议题32的初始关键词33。或
者,在另一实施例中,当使用者2按下新增的网页按钮34时,初始关键
词33可通过输入单元11接收使用者设定的上述主题网页文章30,且运算
处理单元13分析此主题网页文章30的内容而获得。然而,本发明并不限
定议题显示系统1获得初始关键词的方式。

上述的步骤S101与步骤S102是使用者操作议题显示系统1的输入
单元11。使用者2可以针对多个议题设定追踪。后续步骤S103至步骤S110
是议题显示系统1自动进行运算处理。

接着,议题显示系统1设定议题关键词组(包括至少一个关键词)(步
骤S103)。然后,议题显示系统1针对网络3上的网页资料进行过滤与获
取(步骤S104)。接着,运算处理单元13可先根据当期关键词组读取的
网页主题内容,根据标题、内容比对或文章连结追溯方式,将网页主题内
容分群(步骤S105)。将网页主题内容分群可使有相同或类似主题的文章
各自成群,以有助于简化后续分析的运算过程或缩短运算时间。议题显示
系统1可根据议题的相关性建立追踪模型,以及提供过去相关主题既有分
析信息。例如:议题显示系统1使显示的网页主题内容自动显示此网页主
题内容被点赞35、分享36或评价37的次数,参照图3A。当使用者2后
续浏览网页时,议题显示系统1也能自动显示每个网页主题内容相关的分
析主题、点赞、分享、评价等评基本信息。

如果将网页主题内容分群,则可根据分群后每一群的网页主题内容来
分析至少一当期关键词之间的社群声量,并将当期关键词组所包括的至少
一当期关键词与初始关键词计算重复度(或重叠率),以及将至少一当期
关键词的社群声量与初始关键词的社群声量做比较。然而,本发明并不因
此限定,将网页主题内容分群的步骤S105也可以被省略。接下来将说明
议题显示系统1的运算处理单元12针对所设定的议题进行运算处理的过
程(步骤S106至步骤S110)。

步骤S106,建立网页主题内容的标签。详细的说,运算处理单元13
获得一个可设定的(或者固定的)时间区间内的多个网页主题内容的多个
标签(Tags)。所述时间区间例如是以一天、一周或一个月做为单位,但
本发明并不因此限定。通常而言,网络3上的每一个网址可以对应至少一
个网页主题内容。例如:某一个网址显示一则新闻,此新闻的网页主题内
容就是新闻的全文。若此新闻已有设定标签(Tags),则直接使用已设定
的标签。若标签尚未设定,则运算处理单元13通过关键词分群计算,分
析此网页主题内容(新闻)的全文,以解析出多个字词,由此获取此新闻
的一个或两个以上的主要概念,并将其作为标签。

在本实施例中,运算处理单元13根据已知的字词数据库或演算法,
找出字词之间的关联性。所述字词可能是此网页主题内容的主要概念,也
可能不是。例如:利用标准化谷歌距离(normalized google distance)工具
找出字词之间的关联与关联强度。或者,利用字词数据库中的字词的共生
性(co-occurrence),以作为定义关联强度的根据。然后,决定关联强度的
阈值(threshold),在当某两个字词的关联强度在此阈值之上,则此两个字
词被设定为有关连。当某两个字词的关联强度在此阈值之下,则此两个字
词被设定为无关连。由此,形成字词之间的关系图。例如图4所示的字词
关系图,此网页主题内容具有字词401、402、403、404、405、406、407、
408、409、410、411、412、413、414,有关联的字词以连线表示。字词
402、403为有关联。字词407、408为有关联。字词404与字词412有关
联。字词410、411、412、413、414为有关联。

然后,运算处理单元13利用K-core演算法找出此网页主题内容的主
要概念,以建立此网页主题内容的标签。K-core演算法是所属技术领域普
通技术人员的公知常识,不在此赘述。以图4为例,当字词410-414代表
网页主题内容的主要概念,因此经由字词410-414设定此网页主题内容的
一个标签(Tags)。根据上述,运算处理单元13可针对多个网页主题内容
设置对应的标签。因此,每一个网页主题内容被对应于一个或多个标签。
运算处理单元13可以利用内部的资料储存部件(图未绘示)或者外部的
储存单元,如挥发式存储器(如随机存取存储器(RAM))或者是非挥发
式存储器(如硬盘),以储存这些标签。

接着,进行步骤S107,进行标签之间的关联强度计算。运算处理单
元13根据所述标签共同出现的关联性获得所述网页主题内容的当期关键
词组。其中,当期关键词组包括至少一当期关键词。详细的说,运算处理
单元13判断所述网页主题内容各标签在所述网页主题内容中出现的次数
超过一出现次数的阈值时,则将所述标签决定为至少一当期关键词。以台
湾出现的黑心油(地沟油,gutter oil)事件为例,针对在一个初始时间区
间T1内的所有有关于黑心油的网页的主题内容,运算处理单元13可分析
所述网页主题内容,而发现标签如,黑心油、公司A、饲料油、公司B、
公司C、消基会这些标签出现的次数超过出现次数的阈值时,则黑心油、
公司A、饲料油、公司B、公司C、消基会这些标签就是当期关键词。所
述出现次数的阈值可以根据实际应用而决定,本发明并不对此限制。

接着,进行步骤S108,判断是否产生衍生议题。运算处理单元13分
别针对两个方面决定是否产生衍生议题。其一是比较当期关键词与初始关
键词(重复度的评估),甚至是比较当期关键词组与前一期(或前两期)
关键词组。其二是,基于社群声量进行当期关键词之间的关联强度的计算,
以评估当期关键词组的网络声量是否高于前一期的关键词组的网络声量。
上述两者是判断衍生议题的两个需同时存在的必要条件,根据上述两者则
可决定原本的议题是否随着时间进程而产生至少一衍生议题。若没有产生
衍生议题,则进行步骤S110,产生议题演进路径示意图。如果产生衍生议
题,则进行步骤S109,判断是否要新增关键词组。也就是当获得新的标
签,则判断是否要将新的标签新增到当期关键词组。如果要新增当期关键
词组则回到步骤S103再次设定议题关键词。若不需新增当期关键词组,
则进行步骤S110,以图形化显示议题演进路径。根据上述,议题显示系统
1可以自动化搜索与判断衍生议题;其中,当期出现的衍生议题所产生的
衍生关键词会加入当期关键词组并进行重复度和关联强度的计算,直到没
有产生新衍生议题为止。

接下来将详细说明步骤S108的演算方式。在本实施例中,基于图5A、
图5B与图5C显示的时间区间T1、T2、T3的关键词组与关联强度,来说
明如何判断时间区间T1、时间区间T2与时间区间T3的当期关键词以及
其关联强度的差异,以判断是否产生衍生议题。

关于关键词的重复度(或重叠率),利用比较图5A和图5B来说明。
假设,初始关键词是黑心油(501)、公司A(502)。在时间区间T2,除
了黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C
(505)、消基会(506),当期关键词更包括抵制(507)。相较于时间区间
T1,运算处理单元13可根据至少一当期关键词(501-507)与初始关键词
(黑心油(501)、公司A(502))的重叠率,以判断时间区间T2内的网
页主题内容是否已产生至少一衍生议题。

在一实施例中,将图5B与图5A的比较可知,在时间区间T1的当期
关键词(501-506)与初始关键词(黑心油、公司A)的重叠率相近于在
时间区间T2的当期关键词(501-507)与初始关键词(黑心油(501)、公
司A(502))的重叠率。在另一实施例中,运算处理单元13也可判断当
期关键词与前一期关键词的重叠率,例如将时间区间T2的当期关键词
(501-507)与时间区间T1的当期关键词(501-506)做比较,发现只有一
个当期关键词“抵制(507)”没有重叠,而另外六个关键词(501-506)
都重叠。根据同样方法,比较图5B与图5C,在时间区间T3的当期关键
词多了消基会(506)、抵制(507)、公司D(508)与公司E(509),也
就是说,时间区间T3的当期关键词与时间区间T2的当期关键词彼此重叠
的是黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司
C(505)、消基会(506)。

关于关联强度,以台湾出现的黑心油(地沟油,gutter oil)事件为例,
若以黑心油(501)和公司A(502)做为所选议题的初始关键词,且得到
在时间区间T1的黑心油(501)、公司A(502)、饲料油(503)、公司B
(504)、公司C(505)、消基会(506)这些标签作为当期关键词。则黑
心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、
消基会(506)这些当期关键词之间的关联强度系分别根据这些当期关键
词在时间区间T1内的网页主题内容中出现的次数以及这些当期关键词在
同一个网页主题内容出现的次数,再加入这些网页主题内容对应的社群声
量值来计算而得。所述社群声量值是人们对应于当期关键词产生在网络上
的活动的评估,例如是以点赞的次数、分享的次数或者评价的次数来决定。
例如:社群声量值可以根据点赞的次数、分享的次数或者评价的次数进行
权重加总而得到。然而,本发明并不限定社群声量值的计算方式。

以图5A为例,关联强度以各个当期关键词之间的连线的粗细表示。
例如黑心油(501)与公司A(502)这两个当期关键词在同一个网页主题
内容中出现的次数越多则代表黑心油(501)与公司A(502)这两个当期
关键词的关联强度越强。并且,当针对黑心油(501)与公司A(502)这
两个当期关键词的社群声量越高,则黑心油(501)与公司A(502)这两
个当期关键词的关联强度也越强。当黑心油(501)与公司A(502)之间
的关联强度越强,黑心油(501)与公司A(502)之间的连线越粗。此外,
在图5B中,针对时间区间T2,出现新的当期关键词(抵制507),且抵制
(507)与消基会(506)具有强关联强度。在图5C中,针对时间区间T3,
具有强关联强度的当期关键词是公司C(505)、消基会(506)、抵制(507)、
公司D(508)与公司E(509)。而时间区间T3的其他当期关键词包括黑
心油(501)、公司A(502)、饲料油(503)与公司B(504)的关联强度
比较弱。

根据上述,运算处理单元1可分析当期关键词之间以社群声量为基础
计算的关联强度,并与初始关键词的重复度以及依社群声量计算所得的关
联强度做比较,以决定是否产生至少一衍生议题。以上述的图5A、图5B
与图5C来说明,比较图5B与图5A可知,时间区间T1的当期关键词和
时间区间T2的当期关键词重复度相当高,并且时间区间T1的当期关键词
之间的关联强度与时间区间T2的当期关键词之间的关联强度类似,所以
可决定在时间区间T2并没有产生衍生议题。比较图5C、图5B与图5A
可知,时间区间T3的当期关键词和时间区间T2的当期关键词重复度降低
(相较于时间区间T1),并且时间区间T3的当期关键词之间的关联强度
与时间区间T1的当期关键词之间的关联强度明显不同,所以可决定在时
间区间T3已产生衍生议题。代表所述衍生议题的衍生关键词就是公司C
(505)、消基会(506)、抵制(507)、公司D(508)与公司E(509)。

在另一实施例中,判断是否产生衍生议题的详细方式可以是利用关键
词的社群声量加总的差异决定,例如:当当期关键词组中所有当期关键词
的社群声量加总高于初始关键词的社群声量加总时,运算处理单元13判
断时间区间内的网页文章已产生至少一衍生议题且主要讨论议题已转变。

在又一实施例中,运算处理单元13可仅根据社群声量高的至少一当
期关键词是否改变,以判断时间区间内的网页主题内容是否已产生至少一
衍生议题。以图5B和图5C的比较为例,假设在时间区间T2内社群声量
高的当期关键词是黑心油(501)、公司A(502)、饲料油(503)、公司B
(504)、公司C(505)、消基会(506)与抵制(507)。然而,在时间区
间T3,社群声量高的当期关键词已改变为公司C(505)、消基会(506)、
抵制(507)、公司D(508)与公司E(509)。所以可决定已产生至少一
衍生议题。最后,当运算处理单元13决定产生至少一衍生议题时,运算
处理单元13使显示单元12显示议题和至少一衍生议题,如图6所示。初
始设定的议题是A1,衍生议题是A2。衍生议题A2的衍生议题是A3、
A4、A5。衍生议题A3的衍生议题是A5和A6。衍生议题A5的衍生议题
是A6,依此类推至衍生议题A7、A8、A9、A10、A11。据此,可以图形
化显示议题以及至少一衍生议题的演进过程。议题显示系统1也可以进一
步提供互动界面让使用者点选议题(A1)和衍生议题(A2-A11)以查询
相关细部信息。

接着,请参照图7,图2的概念可以归纳为图7的方法流程。本实施
例的议题显示方法执行于图1的议题显示系统1,所述方法包括:使用者
利用输入单元设定对应一议题的初始关键词(步骤S210);然后,运算处
理单元(13)获得一时间区间内的多个网页主题内容的多个标签,并根据
所述标签共同出现的关联性获得所述网页主题内容的当期关键词组,其中
当期关键词组包括至少一当期关键词(步骤S220),接着分析关键词间以
社群声量为基础计算的关联强度,并与初始关键词的重复度以及根据社群
声量计算所得的关联强度做比较,以决定是否产生至少一衍生议题(步骤
S230),以及当决定产生至少一衍生议题时,使显示单元(11)显示议题
和至少一衍生议题;然后,运算处理单元(13)利用显示单元(11)基于
时间特性显示议题和至少一衍生议题(步骤S240)。

设定初始关键词的步骤(S210),可对参照前述图2的步骤S101与
步骤S102的说明。针对运算处理单元(13)的运算步骤S220,可参照图
2的步骤S103至步骤S106的说明。步骤S230可参照图2的步骤S107与
步骤S108的说明。步骤S240可参照前述对于图6的说明。

〔实施例的效果〕

综上所述,本发明实施例所提供的一种议题显示系统和议题显示方
法,可由议题的初始关键词获得多个网页主题内容,并进一步获得网页主
题内容的当期关键词组。接着,获得初始关键词与当期关键词组的社群声
量,并计算初始关键词与当期关键词组之间的关联强度,由此判断是否产
生衍生议题。因此,可以基于时间特性显示议题的演进。由此,对使用者
而言可呈现一个以网页为基础的议题演进互动界面。另一个角度而言,本
发明实施例所提供的一种议题显示系统和议题显示方法可以达到自动化
搜索与判断衍生新议题,并自动加入衍生新议题关键词,以达到扩大议题
搜索与判断的效果。

以上所述仅为本发明的实施例,其并非用以限制本发明的专利范围。

议题显示系统和议题显示方法.pdf_第1页
第1页 / 共18页
议题显示系统和议题显示方法.pdf_第2页
第2页 / 共18页
议题显示系统和议题显示方法.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《议题显示系统和议题显示方法.pdf》由会员分享,可在线阅读,更多相关《议题显示系统和议题显示方法.pdf(18页珍藏版)》请在专利查询网上搜索。

本发明提供一种议题显示系统和议题显示方法,议题显示系统包括输入单元、显示单元及运算处理单元。输入单元接收使用者设定对应议题的初始关键词。显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的多个标签,并根据标签共同出现的关联性获得网页主题内容的当期关键词组。当期关键词组包括至少一当期关键词。接着,运算处理单元分析当期关键词之。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1