《自动分析个人化输入的方法.pdf》由会员分享,可在线阅读,更多相关《自动分析个人化输入的方法.pdf(17页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103136319 A(43)申请公布日 2013.06.05CN103136319A*CN103136319A*(21)申请号 201210251984.1(22)申请日 2012.07.19100143642 2011.11.29 TWG06F 17/30(2006.01)G06F 17/27(2006.01)(71)申请人网际智慧股份有限公司地址中国台湾新北市(72)发明人晁旭光(74)专利代理机构北京科龙寰宇知识产权代理有限责任公司 11139代理人孙皓晨 李涵(54) 发明名称自动分析个人化输入的方法(57) 摘要本发明一种自动分析个人化输入的方法。该方法是。
2、利用一或多个处理器在一背景下自动读取一输入内容,且经由该处理器去判读该输入内容,以产生一输出内容,该输出内容为个人化的关键词或词或其结合,并将该输出内容传送至一接收端,以取得该接收端提供的个人化讯息。(30)优先权数据(51)Int.Cl.权利要求书2页 说明书6页 附图8页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书2页 说明书6页 附图8页(10)申请公布号 CN 103136319 ACN 103136319 A1/2页21.一种自动分析个人化输入的方法,其特征在于:应用于取得一接收端的个人化讯息,该方法是利用一或多个处理器执行下列步骤:利用该处理器在一背景下自动读。
3、取一输入内容;通过该处理器判读该输入内容;产生一输出内容;以及将该输出内容传送至该接收端。2.根据权利要求1所述的方法,其特征在于:该输入内容是包括单一字或词或多个字或词的集合。3.根据权利要求2所述的方法,其特征在于:更包括:根据该输出内容的每一个字或词的输入频率给予该字或词一分数,并将该分数传送至该接收端。4.根据权利要求3所述的方法,其特征在于:根据该输出内容的每一个字或词的输入频率给予该字或词一分数,并将该分数传送至该接收端的步骤,该输入频率根据不同输入时段分别计算,并对各输入时段指定对应的权重,进而计算出该输出内容的加权分数,并将该加权分数传送至该接收端。5.如权利要求2所述的结构,。
4、其特征在于:更包括:将该输出内容中的每一个字或词关联于多个类别中的至少一个类别,并将该关联的类别传送至该接收端。6.根据权利要求1所述的方法,其特征在于:判读该输入内容步骤包括:加载一原始字词库;比对该输入内容与该原始字词库,以判断是否可找出对应的原始字词;若是,将该对应的原始字词从该原始字词库中提取。7.根据权利要求6所述的方法,其特征在于:比对该输入内容与该原始字词库,以判断是否可找出对应的原始字词的步骤更包括:将该对应的原始字词的输入频率与一第一设定值比对,以判断该输入频率是否高于该第一设定值。8.根据权利要求6所述的方法,其特征在于:该提取的原始字词包括单一字或词或多个字或词的集合。9。
5、.根据权利要求6或7所述的方法,其特征在于:判读该输入内容的步骤更包括:载入一学习字词库;将该输入内容中不包含在该原始字词库的字或词,储存于该学习字词库;将该学习字词的输入频率与一第二设定值比对,以判断该输入频率是否高于该第二设定值;若是,将该对应的学习字词从该学习字词库中提取。10.根据权利要求9所述的方法,其特征在于:提取的学习字词包括单一字或词或多个字或词的集合。11.根据权利要求9所述的方法,其特征在于:判读该输入内容的步骤更包括:将该学习字词库中的学习字词的输入次数与一第三设定值比对,以判断该输入次数是否高于该第三设定值;以及将该输入次数高于该第三设定值的学习字词存入该原始字词库。1。
6、2.根据权利要求1所述的方法,其特征在于:更包括一过滤步骤对该输入内容进行分析,以过滤赘字或词。权 利 要 求 书CN 103136319 A2/2页313.根据权利要求1所述的方法,其特征在于:更包括一过滤步骤对该输出内容进行分析,以过滤赘字或词。14.根据权利要求12或13所述的方法,其特征在于:该赘字或词是包括感官动词、程度副词、介系词、连接词、代名词或虚词。15.根据权利要求1所述的方法,其特征在于:更包括一关联性分析步骤对该输出内容进行关联性分析。16.根据权利要求1所述的方法,其特征在于:该自动读取是进一步指定一或多个时间范围,并在该时间范围内读取该输入内容。17.根据权利要求1所。
7、述的方法,其特征在于:更包括:从该接收端取得一反馈信息;以及呈现该反馈信息。18.根据权利要求1所述的方法,其特征在于:判读该输入内容,产生一输出内容,以及将该输出内容传送至该接收端这三步骤中至少一步骤是于一背景进行操作。19.根据权利要求1所述的方法,其特征在于:该输出内容为单一关键词或词或多个关键词或词的集合。20.一种自动分析个人化输入的方法,其特征在于:应用于分析一个以上的使用者间输入内容的关联性,该方法是利用一或多个处理器执行下列步骤:提供一个以上的使用者的输入内容;对每一个使用者,根据其输入内容中的每一个字或词的输入频率,给予该字或词一对应分数;对每一个使用者的输入内容,提取分数高。
8、于一默认值的字或词;以及根据该提取的字或词,分析不同使用者间输入内容的关联性。21.根据权利要求20所述的方法,其特征在于:对每一个使用者,根据其输入内容中的每一个字或词的输入频率,给予该字或词一对应分数的步骤,该输入频率根据不同输入时段分别计算,并对各输入时段指定对应的权重,进而计算出该字或词的加权分数,并根据该加权分数进行提取。22.根据权利要求20所述的方法,其特征在于:更包括:对每一个使用者,将该输入内容中的每一个字或词,分别关联于多个类别中的至少一个类别;且该提取步骤,是针对该多个类别中的至少一个类别进行。权 利 要 求 书CN 103136319 A1/6页4自动分析个人化输入的方。
9、法技术领域0001 本发明涉及一种自动分析个人化输入的方法,具体涉及在背景下自动分析个人化输入,以产生输出内容,进而取得一接收端的个人化讯息的方法。背景技术0002 二十一世纪为信息科技的世纪,随着电子装置及信息系统的成长及网络信息的多元化,通过这三者将虚拟与现实社会紧密结合。在因特网已成为信息传播的主要途径之一后,因特网使用者可以不受地理位置及时间的限制,在24小时全年无休的因特网世界接收各式各样的讯息。0003 随着信息成长速度以等比级数增加,例如因特网上的新闻、社群、部落格、微网志等等的信息正以极快的速度更新成长。由于这些信息快速且大量的充斥于因特网上,从这些天文数字般的信息中去过滤并取。
10、得所需要的讯息变成使用者的负担,因为过滤花费的时间比取得大量讯息所花费时间更多。0004 于是有网络服务者提供搜索或订定关键词词的服务供使用者订阅信息,从天文数字般的信息中发掘符合使用者需要且有用的信息,但是这类的服务在其实际执行上有不便与缺陷存在如下:0005 1.需使用者按照其需求自行提供关键词或词,若使用者未提供关键词就无法获得符合需求的信息。0006 2.这些关键词或词对使用者而言只是在某个时期(time period)符合其需求或意义,过了这个时期或满足需求后这些关键词或词所提供的信息就变成毫无意义,使用者需要自行去更新关键词或词,否者将持续接收到已变成不符合需求的讯息,造成困扰。0。
11、007 为解决上述的问题,相关领域莫不费尽心思来谋求解决之道,但长久以来未见适用的方式被发展完成。因此如何更有效率的在因特网上取得符合个人需求的讯息,实属当前重要研发课题之一,亦成为当前相关领域亟需改进的目标。发明内容0008 为了克服上述现有技术存在的缺陷,本发明的主要目的在提出了一种方法是在背景下执行读取输入内容,并判读分析该输入内容,以产生一输出内容,通过该输出内容从一接收端取得符合该输出内容的信息。0009 本发明的另一目的在提供一种判读个人平日输入的内容,找出个人常用的字或词,作为关键词或词以取得符合个人特定需求的服务信息的方法。0010 本发明的另一目的在提供一种无须个人自行提供关。
12、键词,即可从一接收端自动且动态地取得个人化信息。0011 在本发明一具体实施中,公开了一种自动分析个人化输入的方法,用以取得一接收端的个人化讯息,该方法是利用一或多个处理器执行下列步骤:利用该处理器在一背景下自动读取一输入内容;通过该处理器判读该输入内容;产生一输出内容;以及将该输出说 明 书CN 103136319 A2/6页5内容传送至该接收端。0012 此外判读该输入内容步骤包括:加载一原始字词库;比对该输入内容与该原始字词库,以判断是否可找出对应的原始字词;若是,将该原始字词的输入频率与一第一设定值比对,以判断该输入频率是否高于该第一设定值;若否,则结束该判读步骤。上述产生一输出内容步。
13、骤系包括将输入频率高于该第一设定值的原始字词从该原始字词库中提取,所提取的原始字词是包括单一字或词或多个字或词的集合。0013 此外判读该输入内容的步骤更包括:载入一学习字词库;将不包含在原始字词库内的输入内容与该学习字词库比对,以判断是否可找出对应的学习字词;若是,将该学习字词的输入频率与一第二设定值比对,以判断该输入频率是否高于该第二设定值;若否,则将该输入内容中不包含在该原始字词库的字或词,储存于该学习字词库,并将该储存的学习字词的输入频率与该第二设定值比对,以判断该输入频率是否高于该第二设定值。0014 此外产生一输出内容步骤更包括将输入频率高于该第二设定值的学习字词从该学习字词库中提。
14、取,所提取的学习字词包括单一字或词或多个字或词的集合,该输出内容为单一关键词或词或多个关键词或词的集合。0015 此外判读该输入内容的步骤更包括:将该学习字词库中的学习字词的输入次数与一第三设定值比对,以判断该输入次数是否高于该第三设定值;以及将输入次数高于该第三设定值的学习字词存入该原始字词库,所述的输入内容是包括单一字或词或多个字或词的集合。0016 此外更包括一过滤步骤,是对该输入内容进行分析,以过滤赘字或词,且该赘字或词系包括感官动词、程度副词、介系词、连接词、代名词或虚词。或另外包括一关联性分析步骤,是对该输出内容进行关联性分析。上述自动读取是进一步指定一或多个时间范围,并在该时间范。
15、围内读取该输入内容。0017 上述方法更包括:从该接收端取得一反馈信息,并进而呈现该反馈信息。附图 说明0018 图1为本发明第一较佳实施例主要步骤的流程图;0019 图2为本发明第一较佳实施例详细步骤的流程图;0020 图3A及3B为本发明第二较佳实施例增加学习字词库操作步骤的流程图;0021 图4A为本发明第三较佳实施例增加赘字词过滤步骤的流程图;0022 图4B为本发明第三较佳实施例增加另一赘字词过滤步骤的流程图;0023 图5为本发明第四较佳实施例增加关联性分析步骤的流程图;0024 图6为本发明第五较佳实施例增加输出内容属性纪录步骤的流程图;0025 附图标记说明:110160为步骤。
16、;210250为步骤;310370为步骤;410a及410b为步骤;510为步骤;610630为步骤。具体实施方式0026 为使更进一步了解本发明的特征及技术内容。以下举出较佳实施例以详细说明本发明的内容,并以图示作为辅助说明。说明中提及的符号系参照图式符号。0027 本发明为一种自动分析个人化输入的方法,是应用于取得一接收端的个人化讯说 明 书CN 103136319 A3/6页6息。0028 请参阅图1及图2为本发明的第一较佳实施例。如图1所示为本发明的自动分析个人化输入的方法流程图,该方法利用一或多个处理器执行下列步骤:0029 步骤110:利用该处理器在一背景下自动读取一输入内容;00。
17、30 步骤120:通过该处理器判读该输入内容;0031 步骤130:产生一输出内容;0032 步骤140:将该输出内容传送至该接收端;0033 步骤150:从该接收端取得一反馈信息0034 步骤160:呈现该反馈信息。0035 前述步骤110中的输入内容为一个字或词或多个字或词的集合,且该输入内容在一具体的实施方式中是可利用各种输入方法达成,例如以硬键盘、虚拟键盘输入字符、用触控屏幕以手写输入文字或通过麦克风以语音输入,但是本发明不限于此处所列举。0036 在本步骤110中,背景下自动读取指在使用者不知情的状况下利用本方法纪录使用者的输入内容。在一具体可行实施中是通过一硬键盘执行经常性的输入动。
18、作,例如在文书操作系统上输入内容时,可经由一处理器在该文书操作系统处理该硬键盘输入序列的过程中,同时主动记录该硬键盘输入序列。0037 前述的实施其包含下列三种方式:第一种是启动一管理程序(Hypervisor),并利用中断与设陷机制,取得键盘输入序列;第二种是在操作系统核心阶层,实作一新的设备驱动程序,取代原有设备驱动程序功能,以达到读取键盘输入序列的目的;第三种是利用操作系统(OS)或外挂输入法程序所提供的程序接口,取得键盘输入序列。0038 另外利用触控屏幕以手写输入文字、虚拟键盘输入字符或通过麦克风以语音输入,亦可通过上述三种实施方式中的至少一种方式达成。以上所描述的方法,可应用于各种。
19、操作系统(OS),如Microsoft Windows系列、Linux系列、Unix系列、Android系列或Mac OS X系列等,但是本发明不限于此处所列举。0039 再者步骤110可限定在一或多个特定时段内进行。例如使用者仅希望将下班时间的个人化输入内容作为自动分析的对象,则可将该特定时段设定为晚上七点至早上九点。其具体实现方式通过执行一程序代码,由使用者指定一或多个特定时段,并经由读取系统时间与该特定时段比对,判断是否呼叫自动读取输入内容的程序代码。0040 请续参阅图2所示更详细说明上述步骤120及步骤130的流程图。如图2所示前述步骤120的具体执行包括下列步骤:0041 步骤21。
20、0:加载一原始字词库。此原始字词库储存一个或多个原始字词,该原始字词为一般人们熟知或字辞典中明确定义的字或词或多个字或词的集合;0042 步骤220:比对该输入内容与该原始字词库,以判断是否可找出对应的原始字词,若是则执行步骤230,若否则执行步骤240;0043 步骤230:则将该原始字词的输入频率与一第一设定值比对,以判断该输入频率是否高于该第一设定值,若否则执行步骤240,若是则执行步骤250;0044 步骤240:结束该判读步骤;0045 步骤250:将输入频率高于该第一设定值的原始字词从该原始字词库中提取,以产生该输出内容(步骤130),该输出内容对该输入内容(步骤120)进行分析而。
21、产生单一关说 明 书CN 103136319 A4/6页7键词或词或多个关键词或词的集合。0046 再参阅图1及图2所示,前述步骤140将该输出内容传送至该接收端。此接收端可为一数据库、一新闻订阅服务服务器或是一多媒体订阅服务服务器,但是本发明不限于此处所列举。0047 在本步骤中,该输出内容通过串行接口、蓝牙接口、因特网或无线行动网络等的电信连结,以传送至该接收端所提供的服务接口,如数据库关键词词查询接口、新闻订阅服务的关键词词输入接口或多媒体订阅服务的关键词词输入接口,但是本发明不限于此处所列举。0048 另外前述步骤120,步骤130及步骤140这三个步骤中至少有一个步骤可于背景下进行,。
22、亦即当该步骤进行时不主动告知使用者。0049 前述步骤150从该接收端取得一反馈信息。在本步骤中该反馈信息是由该接收端提供,且其具体实施为该接收端根据该输出内容(即关键词或词或其结合)到前述的服务接口搜寻符合该输出内容的讯息,所符合的讯息即为个人化讯息,其包括文字讯息、网页连结或多媒体数据等,但不限于此处所列举。再通过例如电子邮件、短讯息、多媒体讯息、简易信息聚合文件、网页或上述组合的方式等(但是本发明不限于此处所列举)取得个人化讯息。0050 前述步骤160呈现该反馈信息。在本步骤中具体的实现方式以具有显示功能的电子设备例如计算机、手持式装置、媒体播放装置等(但是本发明不限于此处所列举),去。
23、显现从接收端的传回的个人化讯息。0051 请参阅图3A及图3B所示,为本发明第二较佳实施例,如图3A所示,本较佳实施例的步骤大部分与前述的第一较佳实施例相同,在此即不再对相同的步骤及符号赘述,但是本较佳实施例与前述较佳实施例不同的处为本较佳实施例步骤包括:0052 步骤220:比对该输入内容与该原始字词库,以判断是否可找出对应的原始字词,若是则执行步骤230,若否则执行步骤310;0053 步骤310:载入一学习字词库。此学习字词库储存一个或多个学习字词,该学习字词基本上不存在于该原始字词库,通常为人名、公司名称、产品型号或是自创的字词,但不限于此处所列举;0054 步骤320:将不包含在原始。
24、字词库的输入内容与该学习字词库比对,以判断是否可找出对应的学习字词,若否则执行步骤330,若是则执行步骤340;0055 步骤330:将该输入内容中不包含在该原始字词库的字或词,储存于该学习字词库,成为新增的学习字词;0056 步骤340:将该学习字词的输入频率与一第二设定值比对,以判断该输入频率是否高于该第二设定值,若否则执行前述步骤240结束该判读步骤,若是则执行步骤350;0057 步骤350:将输入频率高于该第二设定值的学习字词从该学习字词库中提取以产生该输出内容(步骤130)。0058 再如图3B所示,在本较佳实施例中,可根据该学习字词被取用的次数,将该学习字词转成惯知或惯用的原始字。
25、词,其具体实现方式是在前述步骤310后执行下列步骤:0059 步骤360:将该学习字词库中的学习字词的输入次数与一第三设定值比对,以判断该输入次数是否高于该第三设定值;0060 步骤370:将输入次数高于该第三设定值的学习字词存入该原始字词库。说 明 书CN 103136319 A5/6页80061 请参阅图4A,为本发明第三较佳实施例,如图所示,本较佳实施例的步骤大部分与前述的第一及第二较佳实施例相同,在此即不再对相同的步骤及符号赘述,但是本较佳实施例与第一及第二较佳实施例不同的处为本较佳实施例的步骤更包括:0062 步骤410a:对该输入内容进行分析,以过滤赘字或词;再经由前述步骤120,。
26、判读过滤后的输入内容。0063 所述步骤410a具体实现方式是可建立一赘字词数据库,再通过比对该输入内容与赘字词数据库以进行分析,进而过滤掉赘字或词。所述的赘字词包括感官动词、程度副词、介系词、连接词、代名词或虚词等等,但是本发明不限于此处所列举。0064 请参阅图4B,为本发明第三较佳实施例另一实施的示意图,如图4B所示,其与图4A的差异为:另包括一步骤410b对该输出内容进行分析,以过滤赘字或词;再经由前述的步骤140,将过滤后的输出内容传送至该接收端。0065 所述的步骤410b的具体实现方式系与前述步骤410a相同,就不再赘述。0066 请参阅图5,为本发明第四较佳实施例,如图所示,本。
27、较佳实施例的步骤大部分与前述的第一及第二较佳实施例相同,在此即不再对相同的步骤及符号赘述,但是本较佳实施例与前述第一及第二较佳实施例不同的处为本较佳实施例的步骤更包括:0067 步骤510:对该输出内容进行关联性分析。0068 本步骤510的具体实现,例如其中一个输出的关键字词为某车辆品牌,另一关键字词为耗油,通过该关联性分析,可得知此二关键字词具有相当的关联性,因此可将其视为同一组输出内容,传送至该接收端,以取得个人化讯息。该关联性分析实施方式可利用数据探勘的关系式规则学习(Association Rule Learning),预先建立字词内容的相互关联性,以作为提取关键字词后进行关联性分析。
28、的依据。0069 请参阅图6,为本发明第五较佳实施例,如图所示,本较佳实施例的步骤大部分与前述第一较佳实施例相同,在此即不再对相同的步骤及符号赘述,但是本较佳实施例与前述第一较佳实施例不同的处为本较佳实施例的步骤更包括:0070 步骤610:根据该输出内容的每一个字或词的输入频率给予该字或词一分数;0071 步骤620:将该输出内容的每一个字或词关联于多个类别中的至少一个类别;0072 步骤630:将该输出内容、其对应的分数、以及其关联的类别传送至该接收端。0073 其中步骤610中,通常输入频率愈高则分数亦愈高。在一实施例中,更可根据不同输入时段计算输入频率,并对各输入时段指定对应的权重,进。
29、而计算出该输出内容的每一个字或词的加权分数,并将该加权分数传送至该接收端。再者,该输入时段的定义,除了可依绝对时间划分,亦可针对个人相对时间区段进行定义,例如将早上九点至晚上六点定义为工作时段,或将晚上七点至十一点定义为休闲时段,但是其定义方式不限于此处所列举。而步骤620,则可通过与一关联字分类数据库进行比对,以决定所属类别(如科学、娱乐、美食等)。0074 在本实施例中,待接收端取得输出内容相关数据后,即可对其进行统计与分类,进而产生对应的使用者数据库,该数据库除可应用于前述各项服务外,亦可应用于社群服务。举例来说,一社群网站可通过上述数据库,提取各个使用者高分的输入内容,并进行分析比对,。
30、进而判定使用者间的关联性大小,以提供交友撮合建议的反馈信息。其中使用者间关联性的判定,可进一步限定于一个或多个特定类别。说 明 书CN 103136319 A6/6页90075 此外,在另一实施例中,该输出内容,可通过其它不同的使用者输入方法与分析方法,而不限于由前述实施例所产生。0076 通过本发明上述的实施,使用者毋需针对相关资讯服务自行输入或更新关键字词,而是利用一自动分析个人化输入的方法,搜集个人化的关键字词,以动态地取得对使用者有意义的个人化讯息。0077 虽然本发明以前述的较佳实施例公开如上,然其并非用以限定本发明,任何熟习相像技艺者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,因此本发明的专利保护范围须视本说明书所附的申请专利范围所界定者为准。说 明 书CN 103136319 A1/8页10图1说 明 书 附 图CN 103136319 A10。