一种广告方法和系统 【技术领域】
本发明涉及一种信息处理技术,尤其涉及一种广告方法和系统。
背景技术
在现实生活中,每个人都有不同的兴趣和习惯。在某些情况下,不同人的兴趣和习惯差别非常大,这些兴趣和习惯的差别可通过人们的言辞表现出来。例如,从表层来看,对于“油”这个字,厨师通过“油”更大可能会联系到“食用油”这个方面,石油工人通过“油”则更大可能会联系到“石油”这个方面,司机通过“油”更大可能会联系到“汽油”或“柴油”这个方面,修理工人通过“油”更大可能会联系到“润滑油”这个方面,营养师通过“油”更大可能会联系到“油炸”这个方面,等等。更进一步地,通过每个人对每一个字词的不同联系,可以形成多维度、多层次的关联网。还以上述的“油”为例。
对于厨师来说,从“油”联想到“食用油”→“食品”→“品尝”,继而形成更宽更广泛的联想网络。相应地,司机通过“油”联想到“汽油”→“汽车”→“车库”等其他相关领域。工人通过“油”联想到“润滑油”→“润滑剂”→“滑轮”等其他相关领域。
同理,对于不同的专业,其言辞表达方式也有很大的不同。例如,从表层来看,对于“油”这个字,厨师行业通过“油”更大可能会联系到“食用油”这个方面,石油行业通过“油”则更大可能会联系到“石油”这个方面,司机行业通过“油”更大可能会联系到“汽油”或“柴油”这个方面,修理行业通过“油”更大可能会联系到“润滑油”这个方面,营养师行业通过“油”更大可能会联系到“油炸”这个方面,等等。更进一步地,通过每个行业对每一个字词的不同联系,可以形成多维度、多层次的关联网。还以上述的“油”为例。
对于厨师行业来说,从“油”联想到“食用油”→“食品”→“品尝”,继而形成更宽更广泛的联想网络。相应地,司机行业通过“油”联想到“汽油”→“汽车”→“车库”等其他相关领域。修理行业通过“油”联想到“润滑油”→“润滑剂”→“滑轮”等其他相关领域。
发明人发现,在现有技术中,获得广告信息是通过关键词匹配实现的,即根据关键词匹配到包括该关键词的广告信息,然后发布该广告信息,比如gmail邮件系统的广告推荐方法,会根据邮件中的内容作为判断依据。比如用户在邮件内容中提到了“今天买了一辆跑车”,邮件系统就会提供“奔驰、宝马”等其他相关的汽车广告。但实际上用户已经买了车,不需要其他的车辆广告,反而需要比如“车蜡、车轮、车险、汽油”等其他广告。但现有技术中的广告系统做不到这一点。因此,现有广告技术不能有效地获得与该关键词相关的广告信息,因此,人们急需一种技术能够有效地发布与关键词相关的广告。以获得事半功倍的效果,提高广告被接受的可能性。
【发明内容】
本发明的实施例提供了一种广告方法和系统,可以有效地发布与关键词相关的广告。
本发明的实施例提供了一种广告方法,包括:通过输入设备获取关键词;根据所述关键词到兴趣关系库进行查询,以获得兴趣关键词,所述兴趣信息关系库包括汉字及汉字之间的关联关系;根据兴趣关键词发布广告信息。
本发明还公开了一种广告系统,包括:获取单元,用于通过输入设备确定获取关键词;查询单元,用于根据所述关键词到兴趣关系库进行查询,以获得兴趣关键词,所述兴趣信息关系库包括汉字及汉字之间的关联关系;发布单元,用于根据兴趣关键词发布广告信息。
根据本发明实施例,由于兴趣关系库记录了汉字及汉字之间的关联关系,该关联关系可以是某一特定行业的关联关系,也可以是某个人关联关系,通过该兴趣关系库可获得特定的广告信息,因而,这种兴趣信息更能反映现实规律,更具有目的性,因而会提高发布广告信息的效率。
【附图说明】
图1示出了本发明实施例一的广告方法;
图2示出了本发明实施例一的建立兴趣关系库的方法;
图3示出了本发明实施例的具有“车”的兴趣关系库中汉字之间的关系;
图4示出了本发明实施例的具有“跑”的兴趣关系库中汉字之间的关系;
图5示出了本发明实施例二的广告系统。
【具体实施方式】
为了便于本领域一般技术人员理解和实现本发明,现结合附图描绘本发明的实施例。
实施例一
通过对每个人语言联想的深层技术剖析,我们可以对这个人的兴趣点做出定位并形成个性化的兴趣地图,以一种系统化的处理方式及装置,对这个人各方面兴趣产生预测能力,从而运用在商业、学术、教育领域。例如,互联网上的个性化广告发布,教学上的个性化学习路径设置,内容搜索领域的个性化搜索,出版领域的个性化百科全书,手机领域的兴趣点推荐,舆论分析领域的社会趋势分析,语言教学领域的个性化导引等等,以获得事半功倍的效果。简而言之,凡是由兴趣导引的种种人类活动,都是本发明的应用范围。
同理,对于不同的行业,其行业兴趣也有很大差别,这些行业兴趣体现在该行业的言辞表达上。
本实施例提供了一种广告方法。如图1所示,包括如下步骤:
步骤11、通过输入设备关键词。
步骤12、根据关键词到兴趣关系库进行查询,以获得兴趣关键词,所述兴趣关系库包括汉字及汉字之间的关联关系。
兴趣关系库可以是按个人兴趣建立,也可按行业建立。
步骤13、根据兴趣关键词发布广告信息。
对于广告业的广告商,可将与该兴趣关键词的相关广告信息发布给该用户所在的终端,以便有目的地发布广告,使得用户乐意接受这些广告,并根据这些广告购买产品。
本发明同样可推广到其它行业,当获得兴趣关键词后,不同行业的主体可采取不同的措施,以提高本行业的信息处理效率。具体而言,当获得兴趣关键词后,可根据该兴趣关键词获得兴趣信息,然后将该兴趣信息发给行业主体(如教育行业的教育策划者),以便行业主体根据该兴趣信息进行处理。如:
对于教育业的教育策划者,可将与该兴趣信息相关的学习项目发给该用户的终端,以便于该用户根据自己的兴趣学习,从而提高学习效率。
上述确定广告信息的方法可针对个人应用。这时,在步骤11,还可获得用户的登录信息,所述登录信息包括用户名称。在步骤12中,根据关键词到与用户名称对应的兴趣关系库中进行查询,以获得兴趣关键词,所述兴趣关系库包括汉字及汉字之间的关联关系,该兴趣关系库是按个人方式建立的兴趣关系库,所述兴趣关系库是针对每一个人收集其谈话记录、学习笔记等作为语料而形成。在步骤13中,根据兴趣关键词确定广告信息。
为了实现本发明的广告方法,根据语料的不同,可有多种建立兴趣关系库的方法。例如,可按行业建立兴趣关系库,即每一个行业建立一个兴趣关系库,这时需要通过总结每个行业言辞的兴趣规律,以建立该行业的兴趣关系库;也可按个人方式建立兴趣关系库,即每一个人建立一个兴趣关系库,这时需要通过总结每个人言辞的兴趣规律,以建立兴趣关系库;还可以在建立行业兴趣关系库的基础上,再以个人方式建立兴趣关系库。如图2所示,下面以按行业方式为例,兴趣关系库的构建步骤如下:
步骤21、针对每一个行业收集该行业的相关内容,如直接在互联网、报纸等新闻媒体中每一个行业收集该行业的有关内容作为语料。
根据语料的不同以其它方式建立兴趣关系库时,仅是语料的来源不同而已,如,对于以个人方式建立兴趣关系库的方法,可以针对每一个人收集其谈话记录、学习笔记等作为语料。
步骤22、对步骤21中语料进行切词,切词处理成语言学定义下的汉语词汇,以获得汉字之间的连通关系。比如一句话“我公司准备申请专利”会被切成“我/公司/准备/申请/专利”。两字词不做修改,字数多于2的将其格式转变为两字形式,即二元词,单字词不做考虑,比如“笔记本”,转变为“笔记/记本”。
根据切分所形成的二元词设置关系域,即,判断所述兴趣关系库中是否有该二元词,若存在,则处理下一个二元词,否则,将该二元词添加到所述兴趣关系库中,在该二元词对应的连通域上置为有效标志,以表示这这个汉字之间存在连通关系,直至对所有语料处理完毕。这样兴趣关系库可用二维矩阵表示,其中,行、列均为排列相同的汉字,比如我们共处理5000个汉字,那么行和列分别由排列相同的5000个汉字构成,矩阵中存在5000*5000个交点,其中若第i行与第j列交点的两个字存在通过切分所形成的词语,则标为有效状态,如标为1,否则标为有无效状态,如标为0。
比如表1所示的矩阵相当于上述的汉字二维矩阵,每一个字母代表一个汉字,一共有11*11即121个交点,表示汉字两两搭配。如果两个字可以形成一个词,那么就在该两字交点设为“1”(如第二行第一列)。再比如两字不能直接形成词,则在两字交点置“0”(第四行第三列)。
表1为“汽动跑车行驶速度与油耗”这11个汉字形成的二维矩阵。其中,矩阵中的所有汉字都可以按照任意顺序排列,不需要有任何内在顺序关系。这里举一句话的例子只是为了方便理解和说明,矩阵有11*11个节点。
表1
汽 动 跑 车 行 驶 速 度 与 油 耗
汽 1 1 1 1 0 0 0 0 0 1 0
动 1 1 1 1 1 1 1 0 0 1 0
跑 1 1 1 1 0 0 0 0 0 0 0
车 1 1 1 1 1 0 1 0 0 1 0
行 0 1 0 1 1 1 1 0 0 0 0
驶 0 1 0 0 1 1 0 0 0 0 0
速 0 1 0 1 1 0 1 1 1 0 0
度 0 0 0 0 0 0 1 1 0 1 0
与 0 0 0 0 0 0 1 0 1 0 0
油 1 0 0 1 0 0 0 1 0 1 1
耗 0 0 0 0 0 0 0 0 0 1 1
表1所示的二维矩阵可容易地从实际语料中得到。
步骤23、根据上述汉字之间的连通关系计算矩阵中任意两个字之间的关系值,并将关系值设置在其对应的关系域中。
计算方法:我们定义概念“耗损值”为从一个汉字到达另一个汉字需要转移的最短步长,比如“汽车”,可以直接成词,那么耗损值为“1”,同理,所有可以直接成词的汉字之间的耗损值都为“1”。再如“汽耗”的耗损值为“2”因为需要“汽油”和“油耗”两步来转移,同理,经过两步可以转换得汉字耗损值都为“2”,经过n步可以转移的汉字耗损值为“n”。需要特别注意的是:耗损值使用“最短”步长。另外,我们定义汉字力如下:汉字力即为一个汉字和其他汉字结合的能力,为一个汉字与其他所有汉字耗损值倒数求和:
Σm=1M1/n]]>
其中,m为其它的汉字的编号,M为汉字的个数,n为当前汉字与编号为m的汉字之间的耗损值。如果某个汉字力的值越大,说明这个汉字的能力越强。
下面,我们再定义两个汉字之间的关系值:任意两个汉字之间的关系值为以两个汉字之间所有可连通路径步长n倒数之和,除以路径条数m。
(∑1/n)/m
上式中m为路径条数。
这样做的目的是便于处理和比较大小,在这种情况下,所有的任意两汉字之间都可能存在关系,关系值介于0和1之间,关系值越大,说明两个汉字之间的关系也密切,例如,“葡萄”一词中“葡”不能通过其它汉字与“萄”连通,这就表明这两个汉字之间的关系非常密切,只要通过“葡萄”中的任一字就可找到另一个字。
根据上述兴趣关系库,当用户输入关键词“跑车”,从根据图3和图4示出的汉字关系可知,当用户输入“跑车”,那么就可以得到汽车领域的“奔驰”兴趣关键词,汽车所需的“汽油、车轮”兴趣关键词,电脑行业的“酷奔”兴趣关键词。然后,根据这些兴趣关键词获得相关的广告。需要注意的是:这些广告可全部出现在广告推荐中,但是并不是说本发明的方法可以准确地预测每一个用户的最准确需求,而是本发明的方法会潜在的找出用户可能的需求,提高广告推荐的效率和准确率,达到一个可以接受的最优情况。
具体而言,根据步骤23,当用户输入“跑车”时,首先将“跑车”分解为单个汉字“跑”和“车”,再从“跑”和“车”与其它汉字之间的关系分别获得与其相关的兴趣关键词。比如从“车”可以找到“汽”、“轮”,这样将它们组合起来就可得到“汽车”“车轮”兴趣关键词;再从“汽”可得到“化”和“油”,将它们组合起来就可得到就可得到“汽化”和“汽油”兴趣关键词,再从“轮”可得到“油”,将它们组合起来就可得到就可得到“油轮”兴趣关键词。同理,从“跑”可以找到“动”、“步”、“奔”,将它们组合起来就可得到“跑动”、“跑步”、“奔跑”兴趣关键词;从“步”可以找到“行”、“走”,将它们组合起来就可得到“步行”、“走步”兴趣关键词;从“奔”可以找到“腾”、“酷”、“驰”,将它们组合起来就可得到“奔腾”、“酷奔”、“奔驰”兴趣关键词。这样,从“跑车”可得到若干兴趣关键词,最后根据这些兴趣关键词获得相关广告。
通过对语料的处理,可以获得不同领域语料的特点,习惯用字及该用字之间的关系,因此,当用户输入关键词、或关键词时,可根据该关键词/关键词、通过这些习惯用字及该用字之间的关系,获得与该关键词/关键词相关的兴趣词,然后根据兴趣词获得兴趣信息。上述相关的兴趣词常常是跨领域的兴趣词,因此在进行广告时,就会进行跨领域推荐与关键词相关的广告,从而大大地扩大了广告的范围。
为了获得更有效地发布广告,当获得与关键词相关的广告后,可根据该广告的点击量进行排序,优先发布排序靠前的预定个数广告,且根据点击量的大小对广告进行排序,即,点击量越大,其位置越靠前。
实施例二
如图5所示,本实施例公开了一种广告系统,包括:获取单元,用于通过输入设备确定获取关键词;查询单元,用于根据所述关键词到兴趣关系库进行查询,以获得兴趣关键词,所述兴趣信息关系库包括汉字及汉字之间的关联关系;发布单元,根据兴趣关键词发布广告信息;建立单元,用于建立兴趣关系库。上述各单元的工作原理,可参照实施例一中内容,在此不再赘述。
根据本发明实施例,由于兴趣关系库记录了汉字及汉字之间的关联关系,该关联关系可以是某一特定行业的关联关系,也可以是某个人关联关系,通过该兴趣关系库可获得特定的广告信息,因而,这种兴趣信息更能反映现实规律,更具有目的性,因而会提高发布广告信息的效率。
虽然通过实施例描绘了本发明,但本领域普通技术人员知道,在不脱离本发明的精神和实质的情况下,就可使本发明有许多变形和变化,本发明的范围由所附的权利要求来限定。