处理装置和处理方法.pdf

上传人:xia****o6 文档编号:5890205 上传时间:2019-03-29 格式:PDF 页数:36 大小:1.99MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410679924.9

申请日:

2014.11.24

公开号:

CN104715317A

公开日:

2015.06.17

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06Q 10/06申请日:20141124|||公开

IPC分类号:

G06Q10/06(2012.01)I

主分类号:

G06Q10/06

申请人:

国际商业机器公司

发明人:

大冢诚; 恐神贵行

地址:

美国纽约

优先权:

2013-258421 2013.12.13 JP

专利代理机构:

北京市中咨律师事务所11247

代理人:

张亚非; 于静

PDF下载: PDF下载
内容摘要

为将认知性偏向的消费者的选择行为表示为可学习的模型,提供了生成选择模型的处理装置、处理方法和程序,该选择模型通过将对象对给予的选项的选择行为模型化而得到。该处理装置包含获取单元、输入矢量生成单元和学习处理单元,该获取单元被配置为获取包含至少一个用于学习的选择行为的学习数据,其中给予所述对象的选项是输入选项并且从所述输入选项中选择出的选项是输出选项,该输入矢量生成单元被配置为生成输入矢量,该输入矢量指示多个种类的选项中的每一个是否被包含在输入选项中,该学习处理单元被配置为使用与用于学习的输入选项对应的输入矢量和输出选项学习该选择模型。

权利要求书

权利要求书
1.  一种用于生成选择模型的处理装置,该选择模型通过将对象对给予的选项的选择行为模型化而得到,所述处理装置包括:
获取单元,其被配置为获取学习数据,该学习数据包含至少一个用于学习的选择行为,其中给予所述对象的选项是输入选项并且从所述输入选项中选择出的选项是输出选项;
输入矢量生成单元,其被配置为生成输入矢量,该输入矢量指示多个种类的选项中的每一个是否被包含在所述输入选项中;以及
学习处理单元,其被配置为使用与用于学习的输入选项对应的输入矢量和所述输出选项学习所述选择模型。

2.  根据权利要求1所述的处理装置,其中所述学习处理单元学习所述选择模型,该选择模型包含与所述对象的认知性偏向对应的选择行为。

3.  根据权利要求2所述的处理装置,其中所述学习处理单元学习所述选择模型,其中被包含在所述输入选项中的选项的选择概率的比例是依赖于被包含在所述输入选项中的其他选项的组合而可变化的。

4.  根据权利要求1所述的处理装置,进一步包括输出矢量生成单元,其被配置为生成输出矢量,该输出矢量指示多个种类的选项中的每一个是否被包含在用于学习的输出选项中,其中
所述学习处理单元使用所述输入矢量和用于学习的所述输出矢量学习所述选择模型。

5.  根据权利要求4所述的处理装置,其中所述学习处理单元给予受限玻尔兹曼机学习所述选择模型。

6.  根据权利要求5所述的处理装置,其中
所述选择模型包含输入层、输出层和中间层,在该输入层中 多个种类的选项中的每一个是输入节点,在该输出层中多个种类的选项中的每一个是输出节点,该中间层包含多个中间节点,以及第一权重值被设置在所述输入节点和所述中间节点之间并且第二权重值被设置在所述中间节点和所述输出节点之间,以及
所述学习处理单元学习在所述输入节点和所述中间节点之间的所述第一权重值和在所述中间节点和所述输出节点之间的所述第二权重值。

7.  根据权利要求6所述的处理装置,其中
在所述选择模型中,对被包含在所述输入层、所述中间层和所述输出层中的节点进一步设置输入偏向、中间偏向和输出偏向,以及
所述学习处理单元进一步学习所述输入层的所述输入偏向、所述中间层的所述中间偏向、以及所述输出层的所述输出偏向。

8.  根据权利要求7所述的处理装置,进一步包括概率计算单元,其被配置为基于包含所述第一权重值、所述第二权重值、所述输入偏向、所述中间偏向和所述输出偏向的参数计算根据所述输入选项,各自选项被选择的概率。

9.  根据权利要求8所述的处理装置,其中所述学习处理单元,针对用于学习的多个种类的选择行为中的每一个,更新所述参数以增加根据所述输入选项所述输出选项被选择的概率。

10.  根据权利要求1所述的处理装置,其中所述对象是用户以及所述选项是给予所述用户的商品或服务的选项。

11.  根据权利要求10所述的处理装置,包括:
指定输入单元,其被配置为接收在多个种类的商品或服务中的要被促销的商品或服务的指定;
选择单元,其被配置为从与多个种类的商品或服务对应的多个种类的选项中选择出包含作为选项的、要被促销的商品或服务的多个输入选项;以及
指定单元,其被配置为在多个输入选项中指定其中与被促销的商品或服务对应的选项的概率更高的输入选项。

12.  根据权利要求1所述的处理装置,其中所述对象是用户以及所述选项在网站上被呈现给所述用户。

13.  一种用于生成选择模型的处理方法,该选择模型通过将对象对给予的选项的选择行为模型化而得到,所述处理方法包括:
获取步骤,其用于获取学习数据,该学习数据包括至少一个用于学习的选择行为,其中给予所述对象的选项是输入选项并且从所述输入选项中选择出的选项是输出选项;
输入矢量生成步骤,其生成输入矢量,该输入矢量指示多个种类的选项中的每一个是否被包含在所述输入选项中;以及
学习处理步骤,其使用与用于学习的输入选项对应的输入矢量和所述输出选项学习所述选择模型。

说明书

说明书处理装置和处理方法
技术领域
本发明涉及处理装置、处理方法和程序。
背景技术
分析消费者的消费行为的方法、用于向消费者推荐商品的系统等(例如,见非专利文献1至3)已为公众所知。已知当消费者从多个商品中选择出一件商品时,该消费者的选择行为是有多种多样的认知性的偏向的。
【非专利文献1】Roe,Robert M.;Busemeyer,Jermone R.;Townsend,James T.;"Multichoice decision field theory:A dynamic connectionst model of decision making.",Psychological Review,Vol.108(2),Apr 2001,370-392.
【非专利文献2】Hruschka,Harald.;"Analyzing market baskets by restricted Boltzmann machines.",OR Spectrum,Aug 2012,1-20.
【非专利文献3】Teppan,Erich Christian;Alexander Felfernig;"Minimization of product utility estimation errors in recommender result set evaluations,"Proceedings of the 2009 IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology-Volume 01.IEEE Computer Society,2009.
发明内容
消费者的这样的认知性地偏向性的选择行为影响根据可选择的商品清单中所包含的物品的种类的商品的相对选择概率。难以使用已知的模型来表示选择行为。即使该认知性偏向被模型化,此模型也是复杂的。进一步 地,即使构建了学习算法,它还是未知的。
在本发明的第一方面,提供了处理装置、处理方法和程序,该处理装置生成通过将对象对给予的选项的选择行为模型化而得到的选择模型。处理装置包括:获取单元,其被配置为获取学习数据,该学习数据包含至少一个用于学习的选择行为,其中给予该对象的选项是输入选项并且从该输入选项中选择出的选项是输出选项;输入矢量生成单元,其被配置为生成输入矢量,该输入矢量指示多个种类的选项中的每一个是否被包含在输入选项中;以及学习处理单元,其被配置为使用与用于学习的输入选项对应的输入矢量和输出选项学习该选择模型。
注意本发明内容没有枚举本发明所有的特征。这些特征组的子组合可以是发明。
附图说明
图1示出根据实施例的认知性偏向的第一示例;
图2示出根据实施例的认知性偏向的第二示例;
图3示出根据实施例的认知性偏向的第三示例;
图4示出根据实施例的处理装置100的配置示例;
图5示出根据实施例的处理装置100的操作流程;
图6示出根据实施例的学习数据的示例;
图7示出根据实施例的选择模型的示例;
图8示出由根据实施例的概率计算单元160计算的选项被选择的概率的示例;
图9示出根据实施例的处理装置100的第一变形例;
图10示出根据实施例的选择模型10的变形例;
图11示出根据实施例的处理装置100的第二变形例;
图12示出由根据实施例的处理装置100的第二变形例输出的选项被选择的概率的示例;
图13是发挥根据实施例的处理装置100的功能的计算机1900的硬件 配置的示例。
具体实施方式
下文参考本发明的实施例以说明本发明。但是,实施例不限制根据权利要求的范围的发明。实施例中所说明的特征的所有组合对于本发明的技术方案并非总是必不可少的。
已经知道,在被呈现了选项从而基于偏好等从选项中选择出任意一个的对象(例如人和动物)的行为中,选择行为的选择结果根据给予的选项而改变。在此实施例中,作为这种选择行为的示例,说明了消费者从多个商品中选择出一个商品的选择行为。
当消费者从多个商品中选择出一个商品时,该消费者的选择行为是有多种多样地认知地偏向性的。例如,当包含第一商品和第二商品的多个商品作为选项被呈现给消费者时,第一和第二商品各自被消费者选择的概率的比例有时根据包含在被呈现的选项中的其它商品而不同。在此情况中,包含在被呈现的选项中的其它商品的存在使消费者的选择行为认知性地偏向化。
图1示出根据此实施例的认知性偏向的第一示例。图1是用于说明相似性效果的图,该相似性效果是此实施例中的认知性偏向。在图1中,商品A、B和S是呈现给消费者的选项。在图1的图中,作为商品的属性的示例,价格被标绘在横坐标上并且商品A、B和S作为质量被标绘在纵坐标上。即,相比商品B而言商品A是具有高价和优质的商品。商品S是与相比商品B而言具有高价和优质的商品相似的商品。
首先,当市场中存在商品A和商品B的选项时,商品A和商品B的份额根据各自商品A和商品B被消费者选择的概率确定。当商品S被加入市场时,因为商品S与商品A相似,商品A的份额有时被减少从而改变商品A和商品B的份额的比例。即,在此情况中,关于商品A和商品B的选项,与商品A相似的商品S的存在将消费者的选择行为认知性地偏向化,从而使得商品A的份额被商品A和S瓜分。这样的认知性偏向的效果被称 为相似性效果。
图2示出根据此实施例的认知性偏向的第二示例。图2是用于说明折中效果的图,该折中效果在此实施例中是认知性偏向。在图2中,商品A、B和C是呈现给消费者的选项。在图2的图中,如在图1中,作为商品的属性的示例,价格被标绘在横坐标上并且该商品A、B和C作为质量被标绘在纵坐标上。即,相比商品B而言商品A是具有高价和优质的商品。商品C是与相比商品B而言具有低价和低质量的商品。
首先,当市场中存在商品A和商品B的选项时,商品A和商品B的份额根据各自商品A和商品B被消费者选择的概率确定。当商品C被加入市场时,商品A、B和C的价格和质量水平被以此顺序安排。具有高价和优质的商品A的份额有时被减少从而改变商品A和商品B的份额的比例。
例如,关于商品A和商品B的选项,相对商品B而言价格和质量都更低的商品C的存在形成了多个商品的价格和质量的平衡的等级。具有高价和优质的商品A的份额被商品A和C瓜分。因此,具有中间价格和中间质量的商品B的份额被提高了。这样的将选择商品C的消费者的选择行为认知性地偏向化的效果被称为折中效果。
图3示出根据此实施例的认知性偏向的第三示例。图3是用于说明吸引效果的图,该吸引效果在此实施例中是认知性的偏向。在图3中,商品A、B和D是呈现给消费者的选项。在图3的图中,如图1中,作为商品的属性的示例,价格被标绘在横坐标上并且该商品A、B和D作为质量被标绘在纵坐标上。即,相比商品B而言商品A是具有高价和优质的商品。商品D是相比商品B而言具有稍高的价格和稍低的质量的商品。
首先,当市场中存在商品A和商品B的选项时,商品A和商品B的份额根据各自商品A和商品B被消费者选择的概率确定。当商品D被加入市场时,因为商品B比商品D相对地具有更低的价格和更好的质量,商品B的份额有时被增加从而改变商品A和商品B的份额的比例。
即,在此情况中,关于商品A和商品B的选项,相对商品B而言价 格和质量都更差的商品D的存在将消费者的选择行为偏向化从而使得更好的印象给予了商品B的价格和质量。这样的认知性的偏向的效果被称为吸引效果。
如上文说明的三个示例中,市场中消费者的选择行为是多种多样地认知性地偏向性的。因此,商品的份额等被确定。所以,例如,当消费者的消费行为被分析时并且当商品被推荐给消费者时,希望使用考虑了认知性偏向的模型。但是,难以使用常规的学习模型表示消费行为。即使认知性偏向被模型化,此模型也是复杂的。此模型不能被学习。
所以,在此实施例中的处理装置100,通过将选择行为公式化为用于学习到输出矢量的映射的问题,而表示作为可学习的模型的、被认知性地偏向化的消费者的选择行为,该映射指示从输入矢量中选择出的选择项目,所述输入矢量指示给予消费者的选项等。即,处理装置100生成选择模型,其通过将对象关于给予的选项的选择行为模型化而得到。
图4示出根据此实施例的处理装置100的配置示例。处理装置100包括获取单元110、存储单元120、输入矢量生成单元130、输出矢量生成单元140、学习处理单元150、和概率计算单元160。
获取单元110接收给予对象的选项,将其作为输入选项,并且获取包含至少一种用于学习的选择行为的学习数据,其用于将从输入选项中选择出的选项设置为输出选项。例如,获取单元110获取在多个商品中提供给消费者的输入选项的数据和被消费者选择出的商品的数据,作为学习数据。获取单元110可以根据用户的输入获取学习数据。或者,获取单元110可以读出并获取以预定格式存储的数据。
获取单元110可以与网络等连接并且在与处理装置100的主体所处的位置不同的位置获取学习数据,并且经由网络将得到的学习数据提供给主体单元。例如,获取单元110访问服务器等,并且得到存储在该服务器中的学习数据。获取单元110可以从在网站上销售商品、服务等的电子商务(EC)网站等得到例如给消费者的商品选项和被消费者购买或放入购物车中的商品的历史等的信息,作为学习数据。
获取单元110可以通过其他的装置被实现并且执行学习数据的获取,作为处理装置100的主体的预处理。作为示例,获取单元110向存储单元120提供得到的学习数据。
存储单元120被连接到获取单元110并且存储从获取单元110收到的学习数据。存储单元120存储由处理装置100生成的选择模型。存储单元120可以存储在用于生成该选择模型的过程中被处理的数据等。存储单元120可以根据来自处理装置100中的单元的请求向请求源提供存储的数据。
输入矢量生成单元130生成输入矢量,其指示多个种类的选项的每一个是否包含在输入选项中。输入矢量生成单元130被连接到存储单元120并且由得到的学习数据生成输入矢量。输入矢量生成单元130向学习处理单元150提供生成的矢量。
输出矢量生成单元140生成输出矢量,其指示用于学习的输出选项中是否包含多个种类的选项的每一个。输出矢量生成单元140被连接到存储单元120并且由得到的学习数据生成输出矢量。输出矢量生成单元140向存储单元120和学习处理单元150提供生成的输出矢量。
学习处理单元150被连接到输入矢量生成单元130和输出矢量生成单元140,并且使用接收到的用于学习的输入矢量和输出矢量学习选择模型。学习处理单元150学习包含对应于对象的认知性偏向的选择行为的选择模型。即,学习处理单元150使用包含偏向参数的参数学习选择模型,该偏向参数是根据给予消费者的选项而确定的值。学习处理单元150被连接到存储单元120并且在存储单元120中存储所学习到的选择模型、确定的参数等。
概率计算单元160基于所学习到的选择模型、确定的参数等根据输入选项计算各自选项被选择的概率。概率计算单元160被连接到存储单元120并且从存储单元120中读取出所学习到的选择模型、确定的参数等。概率计算单元160被连接到输入矢量生成单元130并且接收由输入矢量生成单元130生成的输入矢量。
概率计算单元160计算对应于输入矢量的选项被选择的概率。在此情 况中,获取单元110可以从用户处获取关于该选项(应当计算用于该选项的概率)的信息并且经由输入矢量生成单元130向概率计算单元160提供该信息。当处理装置100是用于选择模型的学习处理的学习装置时,不是必须提供用于预测的概率计算单元160。
在此实施例中处理装置100使用包含偏向参数的参数学习从输入适量向输出矢量的映射并且生成通过将消费者对给予的选项的选择行为模型化而得到的选择模型。处理装置100的具体操作在下文中说明。
图5示出根据该实施例的处理装置100的操作流程。在此实施例中处理装置100执行图5中所示的操作流程、学习选择模型、并且计算对应于学习结果的概率。
首先,获取单元110获取学习数据(S200)。获取单元110获取关于J个商品(该J个商品很有可能被呈现给消费者)、呈现的选项(即从该J个商品中选择出的多个商品)、被消费者从这些选项中选择出的商品等的信息。在此实施例中说明了示例,其中获取单元110取得5个商品(A、B、C、D、和S),作为很有可能被呈现给消费者的商品。
图6示出根据此实施例的学习数据的示例。图6的横坐标指示很有可能被呈现给消费者的商品并且纵坐标指示被消费者选择出的商品的概率。图6示出当4种选项被呈现给消费者时得到的选择结果。
例如,在图6中,由阴影线指示的对应R1的柱状图存在于商品A和B中。商品A的柱状图指示0.6。商品B的柱状图指示0.4。商品A是与商品B相比具有高价和优质的商品。
即,R1是用于向消费者呈现商品A和B的选项并且其指示取得的结果,在该结果中商品A被消费者选择的概率是60%并且商品B被消费者选择的概率是40%。假设商品A和B在市场中的份额是与被消费者选择的概率基本上相同的百分比。在此实施例中,选项R1和通过呈现选项R1而取得的结果是在“初始状态”的学习数据,其用于首先引起消费者选择商品。
在图6中,由波浪线指示的对应R2的柱状图存在于商品A、B和S 中。商品A的柱状图指示0.3,商品B的柱状图指示0.4,和商品S的柱状图指示0.3。因此,R2是用于向消费者呈现商品A、B和S的选项并且指示取得的结果,在该结果中商品A被消费者选择的概率是30%、商品B被消费者选择的概率是40%、以及商品S被消费者选择的概率是30%。
选项R2的商品S是与商品A的性能、价格、质量等相似的商品。当选项R1(商品A和B)被呈现给消费者并且商品A和B的份额被确定之后选项R2被呈现(商品S被加入)时,商品A的份额60%(其为通过呈现选项R1取得的结果)改变为由彼此相似的商品A和S瓜分(在此示例中,商品A是30%并且商品S是30%)。即,在此实施例中,选项R2和通过呈现选项R2取得的结果是指示“相似性效果”的学习数据。
在图6中,由空白指示的对应R3的柱状图存在于商品A、B和C中。商品A的柱状图指示0.3,商品B的柱状图指示0.5,和商品C的柱状图指示0.2。因此,R3是用于向消费者呈现商品A、B和C的选项并且指示取得的结果,在该结果中商品A被消费者选择的概率是30%、商品B被消费者选择的概率是50%、以及商品C被消费者选择的概率是20%。
选项R3的商品C是与商品B相比具有低价和低质的商品。当选项R1(商品A和B)被呈现给消费者并且商品A和B的份额被确定之后选项R3被呈现(商品C被加入)时,商品A的份额60%(其为通过呈现选项R1取得的结果)被减少了。因此,具有中间价格和中间质量的商品B的份额被提高(在此示例中,商品A是30%并且商品B是50%)。即,在此实施例中,选项R3和通过呈现选项R3取得的结果是指示“折中效果”的学习数据。
在图6中,对应R4的柱状图存在于商品A、B和D中。商品A的柱状图指示0.4,商品B的柱状图指示0.5,和商品D的柱状图指示0.1。因此,R4是用于向消费者呈现商品A、B和D的选项并且指示取得的结果,在该结果中商品A被消费者选择的概率是40%、商品B被消费者选择的概率是50%、以及商品C被消费者选择的概率是10%。
选项R4的商品D是与商品B相比具有稍微较低价格和稍微较差质量 的商品。当选项R1(商品A和B)被呈现给消费者并且商品A和B的份额被确定之后选项R4被呈现(商品D被加入)时,因为商品B比商品D相对具有更高的价格和更好的质量,商品B的份额增加(在此示例中,商品B的份额从40%增加至50%)。即,在此实施例中,选项R4和通过呈现选项R4取得的结果是指示“吸引效果”的学习数据。
获取单元110获取如上文说明的学习数据并且将学习数据存储在存储单元120中。与此不同的或者除此之外的,获取单元110可以向输入矢量生成单元130和输出矢量生成单元140提供取得的学习数据。
随后,输入矢量生成单元130生成输入矢量(S210)。输入矢量生成单元130设置例如包含多个选项(商品)xJ作为元素的矢量,作为输入矢量x,其中给予消费者的选项xi被设置为非零值(例如1)并且没有给予消费者的选项被设置为0(J是可能选项的总数并且是等于或大于2的自然数)。即,输入矢量生成单元130生成包含由以下表达式指示的元素xi的输入矢量x:
(表达式1)
xi∈{0,1},i∈{1,...,J}
作为示例,输入矢量生成单元130根据图6中所示的学习数据生成对应5个商品(A、B、C、D、和S)的输入矢量x=(x1,x2,x3,x4,x5)。在这里,x1对应商品A,x2对应商品B,x3对应商品C,x4对应商品D,以及x5对应商品S。因为在初始状态中学习数据的选项R1是用于呈现商品A和B的选项,输入矢量生成单元130设置xR1=(1,1,0,0,0)。相似地,输入矢量生成单元130生成对应选项R1至R4的输入矢量,如下列表达式所示。注意在左侧“x”中省略了矢量符号。
(表达式2)
xR1=(1,1,0,0,0)
xR2=(1,1,0,0,1)
xR3=(1,1,1,0,0)
xR4=(1,1,0,1,0)
随后,输出矢量生成单元140生成输出矢量(S220)。输出矢量生成单元140设置例如包含多个选项(商品)yJ作为元素的矢量,作为输出矢量y,其中被消费者选择出的选项yi被设置为非零值(例如1)并且其他矢量元素被设置为0。即,输出矢量生成单元140生成包含由以下表达式指示的矢量元素yi的输出矢量y:
(表达式3)
yj∈{0,1},j∈{1,...,J}
作为示例,输出矢量生成单元140根据图6中所示的学习数据生成对应5个商品(A、B、C、D、和S)的输出矢量y=(y1,y2,y3,y4,y5)。在这里,y1对应商品A,y2对应商品B,y3对应商品C,y4对应商品D,以及y5对应商品S。当针对初始状态中的学习数据的选项R1,消费者选择商品A时,输出矢量生成单元140设置输出矢量为yR1A=(1,0,0,0,0)。
相似地,当消费者选择商品B时,输出矢量生成单元140设置输出矢量为yR1B=(0,1,0,0,0)。输出矢量生成单元140生成对应选项R1至R4的输出矢量,如下列表达式所示:
(表达式4)
yR1A=(1,0,0,0,0)
yR1B=(0,1,0,0,0)
yR2A=(1,0,0,0,0)
yR2B=(0,1,0,0,0)
yR2S=(0,0,0,0,1)
yR3A=(1,0,0,0,0)
yR3B=(0,1,0,0,0)
yR3C=(0,0,1,0,0)
yR4A=(1,0,0,0,0)
yR4B=(0,1,0,0,0)
yR4D=(0,0,0,1,0)
随后,学习处理单元150使用用于学习的输入矢量和输出矢量执行选 择模型的学习(S230)。在本实施例的学习数据中,例如根据相似性效果的结果,在初始状态商品A和商品B的选择概率的比例(0.6/0.4)改变为不同的比例(0.3/0.4)。相似地,比例根据选项改变为不同的比例,例如,通过折中效果的结果改变为比例(0.3/0.5)以及通过吸引效果的结果改变为比例(0.4/0.5)。
将选择行为模型化是很难的,其中被包含在选项中的商品的选择概率的比例根据呈现给消费者的选项而改变。所以在此实施例中,学习处理单元150将消费者的选择行为公式化为用于学习从输入矢量至输出矢量的映射的问题并且学习选择模型,其中被包含在输入选项里的选项的选择概率的比例是依赖于被包含在输入选项里的其它选项而可变化的。
图7示出根据此实施例的选择模型10的示例。选择模型10包含输入层12、输出层14、和中间层16。输入层12包含作为输入节点的多个种类的选项的每一个。即,输入节点对应输入矢量的元素。节点的值与输入矢量的矢量元素的值基本相同。例如,输入层12包含作为输入节点的x1、x2、x3、x4和x5,其对应输入矢量x=(x1,x2,x3,x4,x5)。
输出层14包含作为输出节点的多个种类的选项的每一个。即,输出节点对应输出矢量的元素。节点的值与输出矢量的元素的值基本相同。例如,输出层14包含作为输出节点的y1、y2、y3、y4和y5,其对应输出矢量y=(y1,y2,y3,y4,y5)。
中间层16包含多个中间节点。中间节点hk的数量K是等于或大于1的自然数并且可以与输入节点的数量(输出节点的数量)J相同。作为示例,中间节点hk的值是非零值(例如1)或0。中间层16是隐藏的层,其用来表示选择模型的输入和输出特性。作为包含在中间层16中的中间节点hk的值,值1或0不是必须作为结果被唯一地计算。例如,可以得到具有值1或0的概率的分布。中间节点hk的值如下列表达式所示:
(表达式5)
hk∈{0,1},k∈{1,...,K}
选择模型10可以表示的输入和输出特性的复杂度,可以根据中间节点 的数量K而被增加和减少。所以,要增加希望被表示的特性,增加中间节点的数量K更可取。另一方面,用于学习选择模型10所必需的计算量根据中间节点的数量K的增加而增加。所以,要以较高的速度执行学习,将中间节点的数量K减少更可取。考虑到这些,处理装置100的用户等可以设置中间节点的数量K为预定的合适的值。在此实施例中说明了一示例,其中中间节点hk的数量K与输入节点的数量J(=5)相同。
在选择模型10中,第一权重值Wik在输入节点xi和中间节点hk之间被设置。即,输入节点xi和中间节点hk被分别地连接。第一权重Wik通过该连接被分别加入数据的流中。在选择模型10中,第二权重值Uik在中间节点hk和输出节点yj之间被设置。即,中间节点hk和输出节点yj被分别地连接。第二权重Uik通过该连接被分别加入数据的流中。
第一权重Wik和第二权重Uik是对称的权重,其用于向流增加固定的权重而不受数据的流的方向的影响。层中的节点没有彼此连接。输入节点xi和输出节点yj不必一定要彼此连接。在此实施例中说明了一示例,其中输入节点xi和输出节点yj没有被连接。
在选择模型10中,对被包含在输入层12、中间层16和输出层14中的节点进一步设置输入偏向、中间偏向和输出偏向。即,输入偏向bix被分别地设置用于输入层12中的输入节点xi。相似地,输出偏向biy被分别地设置用于输出层14中的输出节点yj。中间偏向bkh被分别地设置用于中间层16中的中间节点hk。
学习处理单元150学习在输入节点xi和中间节点hk之间的第一权重Wik以及在中间节点hk和输出节点yj之间的第二权重值Uik。学习处理单元150进一步学习输入层12的输入偏向bix、中间层16的中间偏向bkh、和输出层14的输出偏向biy。即,学习处理单元150学习第一权重值Wik、第二权重值Uik、输入偏向bix、中间偏向bkh、和输出偏向biy,作为参数。作为示例,学习处理单元150将参数设置为矢量θ的元素并且使用参数矢量θ(Wik,Ujk,bix,bih,bjy)学习参数。
例如,学习处理单元150基于受限玻尔兹曼机(Restricted Boltzmann  Machine)学习选择模型。玻尔兹曼机是通过概率元素配置的系统,其以概率方式操作,即使被造成用固定输入操作也会根据概率输出多种值,并且从输出的观测系统行(例如,时间系统行)得到输出的出现概率(出现频率)。当概率元素中的每一个被稳定在概率平衡状态时,即,当概率元素中的每一个的状态的出现概率基本上固定时,状态α的出现概率是与玻尔兹曼分布(exp{-E(α)/T})成比例的。
即,尽管玻尔兹曼机的输出本身在时间上波动,出现概率是由输入被唯一地确定并且是在时间上基本固定的。注意玻尔兹曼机根据初始值有时引起过渡期,其中出现概率在时间上波动。但是,通过引起玻尔兹曼机操作足够长的时间直至初始值的影响减少,出现概率向在时间上基本上固定的值收敛。在此实施例中说明了一示例,其中基于这样的玻尔兹曼机的系统学习选择模型。
学习处理单元150生成包含输入矢量和输出矢量的元素的输入和输出样本矢量s1m=(x1,ym)(或输入和输出样本行、输入和输出样本数组等)。学习处理单元150可以根据对应于选择概率的数量生成输入和输出样本矢量,所述选择概率是消费者的选择结果。
例如,当响应于呈现初始状态中的选项R1消费者选择商品A的结果是60%时,学习处理单元150生成对应于该结果的6个输入和输出样本矢量sR1A。在此情况中,当响应于呈现选项R1商品B的选择结果是40%时,学习处理单元150生成对应于该结果的4个输入和输出样本矢量sR1B。作为示例,学习处理单元150生成如下列表达式所示的输入和输出样本矢量s1m。注意,在下列表达式中还示出学习处理单元150生成的矢量的数量。
(表达式6)
sR1A=(1,1,0,0,0,1,0,0,0,0):6
sR1B=(1,1,0,0,0,0,1,0,0,0):4
sR2A=(1,1,0,0,1,1,0,0,0,0):3
sR2B=(1,1,0,0,1,0,1,0,0,0):4
sR2S=(1,1,0,0,1,0,0,0,0,1):3
sR3A=(1,1,1,0,0,1,0,0,0,0):3
sR3B=(1,1,1,0,0,0,1,0,0,0):5
sR3C=(1,1,1,0,0,0,0,1,0,0):2
sR4A=(1,1,0,1,0,1,0,0,0,0):4
sR4B=(1,1,0,1,0,0,1,0,0,0):5
sR4D=(1,1,0,1,0,0,0,0,1,0):1
学习处理单元150使用表达式(6)中所示的总共40个输入和输出样本矢量,作为用于学习的样本,学习选择模型10。学习处理单元150可以使用通过随机打乱该总共40个输入和输出样本矢量而得到的数据集合,作为用于学习的样本。
学习处理单元150更新参数矢量θ,从而使得对于输入和输出样本矢量中的每一个,p(y,x)和p(y|x)中的至少一个更高。在这里,p(y,x)指示输入矢量是x并且输出矢量是y的同时概率。进一步地,p(y|x)指示输出矢量是y的条件概率。注意p(y,x)和p(y|x)是这样关联的:p(y|x)=p(y,x)/p(x)。
例如,学习处理单元150更新参数从而增加输入选项和输出选项的同时概率p(y,x),该输入选项和输出选项涉及指示用于学习的选择行为的输入和输出样本矢量的每一个。在此情况中,学习处理单元150在同时概率p(y,x)是概率地增加的斜率的方向上更新参数矢量θ的元素。即,学习处理单元150基于图7中所示的选择模型计算关于同时概率p(y,x)的参数矢量θ的斜率,并且在同时概率p(y,x)增加的方向增加或减少从而更新参数矢量θ的元素的每一个。
例如,学习处理单元150更新参数以增加针对用于学习的选择行为的每一个,输出选项根据输入选项被选择的概率(即,条件概率p(y|x))。在此情况中,学习处理单元150在条件概率p(y|x)被概率地增加的斜率的方向上更新参数。即,学习处理单元150基于图7中所示的选择模型10计算关于条件概率p(y|x)的参数矢量θ的斜率,并且在条件概率p(y|x)增加的方向上增加或减少以更新参数矢量θ的元素中的每一个。
可以使用由下列表达式所指示的能量函数E(x,y,h;θ)和自由能F(x, y;θ)、F(x;θ)和F(θ)来指示基于图7中所示的选择模型10的同时概率p(y,x)和条件概率p(y|x)。
(表达式7)
E(x→,y→,h→;θ→)=-Σi=1JΣk=1KxiWikhk-Σj=1JΣk=1KyjUjkhk-Σi=1Jxibix-Σj=1Jyjbjy-Σk=1Khkbkh]]>
(表达式8)
F(x→,y→;θ→)=Σh→p(h→|x→,y→;θ→)E(x→,y→,h→;θ→)+Σh→p(h→|x→,y→;θ→)lnp(h→|x→,y→;θ→)]]>
F(x→;θ→)=Σy→Σh→p(y→,h→|x→;θ→)E(x→,y→,h→;θ→)+Σy→Σh→p(y→,h→|x→;θ→)lnp(y→,h→|x→;θ→)]]>
F(θ→)=Σx→Σy→Σh→p(x→,y→,h→;θ→)E(x→,y→,h→;θ→)+Σx→Σy→Σh→p(x→,y→,h→;θ→)lnp(x→,y→,h→;θ→)]]>
由表达式(7)和表达式(8),下列表达式指示同时概率p(y,x)和条件概率p(y|x)。以此方式,可知基于选择模型10、使用玻尔兹曼机的能量函数和自由能而计算同时概率p(y,x)和条件概率p(y|x)的具体方法。
(表达式9)
p(x→,y→;θ→)=Σh→exp{-E(x→,y→,h→;θ→)}Σx→~Σy→~Σh→~exp{-E(x→~,y→~,h→~;θ→)}=exp{-F(x→,y→;θ→)}exp{-F(θ→)}]]>
(表达式10)
p(y→|x→;θ→)=Σh→exp{-E(x→,y→,h→;θ→)}Σy→~Σh→~exp{-E(x→,y→~,h→~;θ→)}=exp{-F(x→,y→;θ→)}exp{-F(x→;θ→)}]]>
学习处理单元150由下列表达式计算关于同时概率p(y,x)的参数矢量θ的斜率,下列表达式由表达式(7)和表达式(9)计算得到。
(表达式11)
&PartialD;&PartialD;θ&RightArrow;log p(x&RightArrow;,y&RightArrow;;θ&RightArrow;)=<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)-Σx&RightArrow;p(x&RightArrow;;θ&RightArrow;)Σy&RightArrow;&Element;C(x&RightArrow;)p(y&RightArrow;|x&RightArrow;;θ&RightArrow;)<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)]]>
在这里,表达式(11)中的C(x)是使用独热(one-hot)编码(通过矢量表示的编码方法,该矢量中一个元素是1并且所有其它的元素是0)、包含表示元素的矢量的集合,该元素在输入矢量x中是1。通过巧妙设计表达式(11)中的权重和变换该表达式从而得到以下表达式。即,对于没有包含在项目集合中的项目可以取期望值。
(表达式12)
&PartialD;&PartialD;θ&RightArrow;logp(x&RightArrow;,y&RightArrow;;θ&RightArrow;)=<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)-Σx&RightArrow;p(x&RightArrow;;θ&RightArrow;)Σy&RightArrow;p(y&RightArrow;|x&RightArrow;;θ&RightArrow;)<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)]]>
学习处理单元150使用表达式(11)或表达式(12)由预定的初始值更新用于输入和输出样本矢量中的每一个的参数矢量θ。作为示例,学习处理单元150在表达式(11)的斜率增加(正数)的方向上以预定值(ΔW、ΔU、Δbx、Δbh、和Δby)增加初始值的参数矢量θ的矢量元素,其中初始值被替换。例如,学习处理单元150重复更新直至同时概率p(y,x)的增加或 减少收敛到预定范围内。或者,学习处理单元150可以将更新重复预定次数。
学习处理单元150可以由多个初始值分别地重复参数矢量θ的更新。在此情况中,作为示例,学习处理单元150重复更新直至参数矢量θ的元素的每一个收敛到预定范围内。因此,学习处理单元150可以将参数矢量θ设置为具有更高的准确度。
学习处理单元150可以改变初始值,例如,当同时概率p(y,x)的增加或减少没有收敛或当参数矢量θ的部分或全部元素没有收敛时。计算同时概率p(y,x)的斜率以及在斜率方向上更新参数从而以此方式增加同时概率p(y,x)的具体方法叫做“用于生成性训练的斜率”。
相似地,学习处理单元150由以下从表达式(7)、表达式(8)、和表达式(10)计算出的表达式计算关于条件概率p(y|x)的参数矢量θ的斜率:
(表达式13)
&PartialD;&PartialD;θ&RightArrow;logp(y&RightArrow;|x&RightArrow;;θ&RightArrow;)=<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)-Σy&RightArrow;&Element;C(x&RightArrow;)p(y&RightArrow;|x&RightArrow;;θ&RightArrow;)<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)]]>
在表达式(13)中,如同在表达式(11)中,通过巧妙设计权重和变换该表达式从而得到以下表达式。
(表达式14)
&PartialD;&PartialD;θ&RightArrow;logp(y&RightArrow;|x&RightArrow;;θ&RightArrow;)=<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)-Σy&RightArrow;p(y&RightArrow;|x&RightArrow;;θ&RightArrow;)<&PartialD;E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)&PartialD;θ&RightArrow;>p(h&RightArrow;|x&RightArrow;,y&RightArrow;;θ&RightArrow;)]]>
如在同时概率p(y,x)的情况中,学习处理单元150使用表达式(13)或表达式(14)由预定的初始值更新用于输入和输出样本矢量中的每一个的参数矢量θ,并且设置参数矢量θ。计算条件概率p(y|x)的斜率以及在斜 率的方向上更新参数从而以此方式增加条件概率p(y|x)的具体方法叫做“用于区别性训练的斜率”。
在以上说明中,此实施例中的学习处理单元150计算同时概率p(y,x)或条件概率p(y|x)的斜率并且在斜率的方向上更新参数。或者,学习处理单元150可以分别计算同时概率p(y,x)和条件概率p(y|x)的斜率并且基于计算出的两个斜率更新参数。即,作为示例,在由表达式(11)和表达式(12)分别计算同时概率p(y,x)和条件概率p(y|x)的斜率之后,学习处理单元150进一步计算如以下表达式所指示的两个斜率的组合的(混合的)斜率:
(表达式15)
rlogp(x&RightArrow;,y&RightArrow;;θ&RightArrow;)+(1+r)logp(y&RightArrow;|x&RightArrow;;θ&RightArrow;)]]>
如在同时概率p(y,x)等的情况中,学习处理单元150使用表达式(13)由预定的初始值更新用于输入和输出样本矢量中的每一个的参数矢量θ,并且设置参数矢量θ。计算同时概率p(y,x)和条件概率p(y|x)的斜率的组合以及在组合的斜率的方向上更新参数从而以此方式增加同时概率p(y,x)和条件概率p(y|x)的具体方法叫做“用于混合训练的斜率”。
如以上所说明的,此实施例中的学习处理单元150可以基于受限玻尔兹曼机学习通过将消费者的认知性偏向的选择行为模型化而得到的选择模型10。学习处理单元150可以根据已知的学习算法学习选择模型10,而不使用复杂的和特殊的算法。学习处理单元150将其所学习的选择模型10的参数矢量θ存储在存储单元120中。
随后,概率计算单元160基于包含第一权重值、第二权重值、输入偏向、中间偏向、和输出偏向的参数计算根据输入选项(s240)各自选项被选择的概率。概率计算单元160可以从存储单元120读出学习的选择模型10的参数矢量θ并且计算选项被选择的概率。概率计算单元160可以使用表达式(9)和表达式(10)计算选项被选择的概率。
图8示出根据此实施例由概率计算单元160计算的选项被选择的概率 的示例。图8是通过学习以图6中所示的学习数据为目标的选择模型10而得到的结果的示例。即,图8中由横坐标、纵坐标和柱状图分别指示的内容与图6中所示的内容基本上相同。
通过比较图8和图6,可见此实施例的处理装置100可以计算具有与对象学习数据的倾向基本上相同倾向的概率。还可见根据被呈现给消费者的选项,在初始状态中商品A和商品B的选择概率的比例的改变可以被再现。因此,可以确认处理装置100可以使用选择模型10表示被相似性效果、折中效果、吸引效果等认知性地偏向了的消费者的消费行为,并且可以使用已知的学习算法学习选择模型10。
在上文说明中,在此实施例的处理装置100中,学习处理单元150基于受限玻尔兹曼机解析地计算条件概率p(y|x)并且学习选择模型10。或者,学习处理单元150可以使用吉布斯采样(Gibbs sampling)等估计条件概率p(y|x)并且学习选择模型10。
在此情况中,学习处理单元150可以根据L个商品的呈现、通过在固定输入层12的输入矢量的同时在输出层14的输出矢量和中间层16的中间节点上执行吉布斯采样,来估计各自商品被消费者选择的概率。在此情况中,作为示例,学习处理单元150可以使用斜率方法等确定参数矢量θ从而使得将要被估计的条件概率p(y|x)被最大化,以及学习选择模型10。
如上文所说明的,此实施例的处理装置100可以学习选择模型10并且表示消费者的认知性偏向的消费行为。因此,例如,当获取单元110获取包含作为用于学习的选择行为的、针对给予用户的商品或服务的选项被用户选择的选项的学习数据时,学习处理单元150可以学习通过将与商品或服务对应的用户的选择行为模型化而得到的选择模型10。在此情况中,对象是用户并且选项是给予用户的商品或服务的选项。因此,处理装置100可以学习用户的购买行为。
图9示出根据此实施例的处理装置100的第一变形例。在此变形例中的处理装置100中,执行与根据图4中示出的此实施例的处理装置100的单元的操作基本上相同的操作的单元通过相同的参考数字来表示,并且省 略对这些单元的说明。在此变形例中的处理装置100的获取单元110包含指定输入单元112和选择单元114。在此变形例中的处理装置100进一步包含指定单元170。
指定输入单元112接收在多个种类的商品或服务中的要被促销的商品或服务的指定。作为示例,指定输入单元112从用户处接收用户希望销售的商品、服务等的指定。
选择单元114从与多个种类的商品或服务对应的多个种类的选项中选择出包含作为选项的、要被促销的商品或服务的多个输入选项。例如,当用户向指定输入单元112输入将商品B作为要被促销的商品的指定时,选择单元114选择包含商品B的多个选项(A、B)、(A、B、和C)等。选择单元114向输入矢量生成单元130提供涉及以此方式选择出的多个选项的信息。
如上文所说明的,输入矢量生成单元130生成与接收到的选项对应的多个输入矢量并且向概率计算单元160提供输入矢量。如上文所说明的,概率计算单元160读出学习到的选择模型10的参数矢量θ并且计算选项被选择的概率。
指定单元170在多个输入选项中指定这样的输入选项,其中与被促销的商品或服务对应的选项被选择的概率更高。作为示例,根据图8中的结果,指定单元170指定选项R4(商品A、B和C),作为其中商品B被选择的概率更高的选项。以此方式,此变形例中的处理装置100可以根据希望被促进销售的商品等适当地指定应当被呈现给用户的选项。
在上文所说明的此实施例中的处理装置100中,获取单元110可以获取包含被用户从呈现在网站上的多个选项中选择出的选项的学习数据。即,在此示例中,对象是用户以及选项在网站上向用户呈现。因此,处理装置100可以模型化例如通过互联网执行购物的消费者的选择行为。处理装置100可以学习消费者的购买行为并且呈现包含通过网站向消费者促销的商品等的适当的选项。
此实施例中的处理装置100可以根据呈现给消费者的选项计算包含在 选项中的各自商品被选择的概率。所以,处理装置100还可以根据由例如咖啡馆或餐馆的用餐地点呈现给消费者的菜单计算包含在菜单中的菜单项目被选择的概率。因此,处理装置100可以根据由用餐地点等呈现的菜单预测应当准备的菜单项目的数量、材料等。
在上文对此实施例中的处理装置100的说明中,学习处理单元150生成并且学习一个选择模型10。或者,学习处理单元150可以生成并且单独地并独立地学习多个选择模型10的每一个。学习处理单元150生成与多个消费者群体关联的多个选择模型10并且学习用于每一个消费者群体的选择模型10。消费者群体是包含一个或多个消费者的群体。因此,有可能对每一个消费者更详细地分析该消费者的选择行为。
此实施例中的处理装置100可以学习可以表示消费者的认知性偏向的消费行为的选择模型10。但是,商品的选择概率是使用学习到的选择模型10计算的,对没有包含在选项中的商品也计算了具有非零值的选择概率。例如,如在图8中所示的,通过概率计算单元160计算的选项被选择的概率中,对与选项R2对应的商品A、B和S分别计算了非零选择概率。但是,即使对没有包含在选项R2中的商品D,概率计算单元160输出作为计算结果的非零选择概率。
相似地,概率计算单元160对与选项R3对应的商品A、B和C分别计算非零选择概率,并且甚至对没有包含在选项R3中的商品S,输出作为计算结果的非零选择概率。以此方式,对没有呈现给消费者的商品计算的所有的选择概率都是误差。
在此实施例中,说明了一示例,其中参考图7所说明的选择模型10被变形以便减少这样的误差。图10示出根据此实施例的选择模型10的变形例。在此变形例的选择模型10中,执行与根据图7中所示的此实施例的选择模型的部分的操作基本上相同的操作的部分通过相同的参考数字和符号来表示,并且省略了其操作的说明。
在此变形例的选择模型10中,对称权重的第一权重值Wik被设置在输入节点xi和中间节点hk之间。在选择模型10中,第二权重值Ujjk被设置 在输入节点xj、中间节点hk和输出节点yj之间。即,第二权重值Ujjk是三方向的权重,其权重值根据输入节点xj、中间节点hk和输出节点yj的值而设置。
至于第二权重值Ujjk,当输入节点xj的值是1时(在商品被呈现给用户的情况中),与输入节点xj对应的输出节点yj的权重值被设置为参考图7所说明的第二权重值Ujk。对应的输出节点yj之外的节点的权重值被设置为比1小的值。至于第二权重值Ujjk,作为示例,对应的输出节点yj之外的节点的权重值被设置为0。在此情况中,第二权重值Ujjk由以下表达式表示:
(表达式16)
Uijk=Ujkδij
此处,δij是叫做克罗内克δ(Kronecker delta)的函数,当i和j相等(i=j)时其为1并且当i和j不同(i≠j)时其为0。以此方式,在此实施例的选择模型10中,门控函数(gating function)被加到第二权重值上以减少没有被呈现给消费者并且不作为一个选项的商品的选择概率。
说明了一个示例,在此示例中参考图4所说明的处理装置100被变形以便学习此变形例的选择模型10的第一权重值Wik和第二权重值Ujjk。图11示出根据此实施例的处理装置100的第二变形例。在此变形例的处理装置100中,执行与根据图4中所示的此实施例的处理装置100的单元的操作基本上相同操作的单元通过相同的参考数字来表示,并且省略了对这些单元的说明。
即,此变形例的处理装置100处理包含输入层12、输出层14和中间层16的选择模型10,该输入层12包含图10中所示的多个输入节点,该输出层14包含多个输出节点,该中间层16包含多个中间节点。此变形例的处理装置100包含计算单元210。
获取单元110获取向多个输入节点xi的多个输入值。获取单元110可以获取包含多个输入值和应当向与多个输入值对应的多个输出节点输出的多个输出值的学习数据。
输入矢量生成单元130生成输入矢量x,其指示多个种类的选项中的每一个是否被包含在输入选项内。输出矢量生成单元140生成输出矢量y,其指示多个种类的选项的每一个是否被包含在用于学习的输出选项内。
计算单元210与输入矢量生成单元130和输出矢量生成单元140连接,并且接收例如输入矢量和输出矢量的信息。计算单元210使用选择模型10计算来自与多个输入值对应的多个输出节点的多个输出值,在该选择模型10中设置在输出节点和与输入值为0的输入节点对应的中间节点之间的第二权重值的影响被减少。
在来自与多个输入值对应的多个输出节点的多个输出值的计算中,计算单元210可以减少第二权重值的影响,该第二权重值通过将与输入值为0的输入节点对应的输出节点的输出值与比1小的系数相乘而得到。作为示例,在来自与多个输入值对应的多个输出节点的多个输出值的计算中,计算单元210将与输入值为0的输入节点对应的输出节点的输出值与系数0相乘从而设置该输出值为0。
作为示例,计算单元210减少设置在不对应于值为1的输入节点xj的输出节点yi(i≠j)和中间节点hk之间的第二权重值Uijk的幅度,而不改变设置在对应于值为1的输入节点xj的输出节点yj和中间节点hk之间的第二权重值Ujjk。计算单元210可以将第二权重值Uijk的幅度减少为比1小的值。
作为示例,计算单元210将第二权重值Uijk的幅度设置为0,该第二权重值Uijk设置在与值为1的输入节点xj不对应的输出节点yi和中间节点hk之间。计算单元210基于减少后的第二权重值计算来自与多个输入值对应的多个输出节点的多个输出值。作为示例,计算单元210计算如以下表达式所示的输出节点yj的输出值yjout:
(表达式17)
yjout=xiyjUijk=xiyjUjkδij]]>
计算单元210向学习处理单元150提供例如输入矢量、输出矢量、第 一权重值和第二权重值的信息。计算单元210可以被连接到存储单元120。在此情况中,计算单元210向存储单元120提供设置的第一权重值和第二权重值。在此情况中,存储单元120存储设置在输入层12和中间层16之间的节点中的第一权重值以及存储设置在中间层16和输出层14之间的节点中的第二权重值。
学习处理单元150被连接到计算单元210并且基于用于学习的多个输入值和多个输出值学习此变形例中的选择模型10。即,学习处理单元150学习此变形例中的选择模型10,其包含与对象的认知性偏向对应的选择行为。作为示例,学习处理单元150基于由根据上文说明的学习方法的表达式(2)和表达式(4)所指示的多个输入矢量x和多个输出矢量y学习此变形例中的选择模型10。
即,学习处理单元150将设置在输出节点和对应于输入节点(用于学习的其输入值为0)的中间节点之间的第二权重值设置为0,并且学习此变形例中的选择模型10。在此情况中,学习处理单元150作为示例可以使用反应图10中所示的选择模型10的以下表达式,来代替表达式(7)的能量函数:
(表达式18)
E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)=-Σi=1JΣk=1KxihkWik-Σi=1JΣj=1JΣk=1KxiyjhkUjk-Σi=1Jxibix-Σj=1Jyjbjy-Σk=1Khkbkh]]>
当后缀y被定义为由以下表达式所示,表达式(18)可以被表示为像表达式(20)这样:
(表达式19)
y&Element;{1,2,...,J},y=Δ(δy1,δy2,...,δyJ)]]>
(表达式20)
E(x&RightArrow;,y&RightArrow;,h&RightArrow;;θ&RightArrow;)=-Σi=1JΣk=1KxihkWik-Σk=1KxyhkUyk-Σi=1Jxibix-xybyy-Σk=1Khkbkh]]>
通过使用表达式(20)的能量函数和表达式(8)的自由能F(x,y;θ)和F(x;θ),条件概率p(y|x)可以被计算为如表达式(10)所示。所以,学习处理单元150基于表达式(20)的能量函数从表达式(13)计算关于条件概率p(y|x)中的参数矢量θ的斜率,并且在斜率的方向中更新参数,其中条件概率p(y|x)被概率地增加。
如上文说明的,此变形例的学习处理单元150可以学习图10中所示的选择模型10,如关于图7中所示的选择模型10的学习所说明的。注意在图10中所示的选择模型10中,即使矢量h是给出的,矢量x和y不能同时设置。所以,不能执行同时概率p(y,x)的“用于生成性训练的斜率”。
如上文说明的,此变形例的学习处理单元150可以基于受限玻尔兹曼机学习图10中所示的选择模型10,其通过将消费者的认知性偏向的选择行为模型化而得到。根据此变形例的概率计算单元160可以计算选项基于所学习的选择模型10被选择的概率。
图12示出通过根据此变形例的概率计算单元160计算的选项被选择的概率的示例。像图8一样,图12是通过学习图10中所示的、以图6中所示的学习数据为目标的选择模型10而得到的结果的示例。即,图12中分别由横坐标、纵坐标和柱状图指示的内容与图6和图8中所示的内容基本上相同。
通过比较图12和图6,可见此变形例的处理装置100可以计算具有与对象学习数据的倾向基本上相同倾向的概率。还可见根据被呈现给消费者的选项在初始状态中商品A和商品B的选择概率的比例的改变可以被再现。因此,可见此变形例的学习处理单元150可以学习此变形例的选择模型10,其中被包含在输入选项里的选项的选择概率的比例是依赖于被包含 在输入选项中的其他选项的组合而可变化的。
通过比较图12和图8,可见此变形例的处理装置100对没有被包含在选项中的商品将其选择概率基本上计算为0。例如,在图12中所示的选项被选择的概率中,对与选项R2对应的商品A、B和S计算了非零选择概率,并且得到基本上为0的选择概率,作为对没有被包含在R2中的商品D的计算结果。
相似地,对与选项R3对应的商品A、B和C计算了非零选择概率,并且得到基本上为0的选择概率,作为对没有被包含在R3中的商品S的计算结果。以此方式,此变形例的处理装置100可以将对没有呈现给消费者的商品计算的选择概率基本上减少为0并且减少选择概率的误差。
在上文说明中,此变形例的处理装置100使用选择模型10减少选择概率的误差,在该选择模型10中设置在输出节点和与值为0的输入节点对应的中间节点之间的第二权重值的影响被减少。当输入节点具有等于或小于预定阈值的值而非当选择模型10的输入节点xi是0时,处理装置100可以使用用于减少第二权重值的影响的模型。在此情况中,处理装置100可以计算来自多个输出节点的多个输出值,该多个输出节点与多个等于或小于阈值的输入值对应。
在上文说明中,此实施例的处理装置100使用通过将对象关于给予的选项的选择行为模型化而得到的选择模型10。但是,处理装置100不限于此,并且可以使用用于预测概率分布的预测模型。例如,处理装置100可以从大小为A的群体A(离散集合A)中选择任意m个子集合B,并且将子集合B应用到基于受限玻尔兹曼机的预测模型上,以用于预测由子集合B所定义的概率分布。即,当处理装置100学习预测模型并且计算由子集合B所定义的概率分布时,处理装置100可以将没有被包含在子集合B里的群体A的概率分布设置为0。所以,有可能高效地学习并且准确地计算该概率分布。
图13示出计算机1900的硬件配置的示例,该计算机1900起到根据此实施例的处理装置100的作用。根据此实施例的计算机1900包含CPU外 围单元、输入输出单元和遗留的输入输出单元,该CPU外围单元包含通过总线控制器2082彼此连接的CPU 2000、RAM 2020、图形控制器2075和显示装置2080,该输入输出单元包含通过输入输出控制器2084连接到总线控制器2082的通信接口2030、硬盘驱动器2040和DVD驱动器2060,该遗留的输入输出单元包含连接到输入输出控制器2084的ROM 2010、软盘驱动器2050和输入输出芯片2070。
总线控制器2082连接RAM 2020和以高传送速率访问RAM 2020的CPU 2000和图形控制器2075。CPU 2000基于存储在ROM 2010和RAM2020中的程序操作并执行单元的控制。图形控制器2075获取CPU 2000等在RAM 2020中提供的帧缓冲器上生成的图像数据并且引起显示装置2080显示该图像数据。或者,图形控制器2075可以在内部包含存储CPU2000等生成的图像数据的帧缓冲器。
输入输出控制器2084连接总线控制器2082、通信接口2030(其为相对高速率输入输出装置)、硬盘驱动器2040和DVD驱动器2060。通信接口2030经由网络与其他装置通信。硬盘驱动器2040存储被计算机1900中的CPU 2000使用的程序和数据。DVD驱动器2060从DVD-ROM 2095读程序或数据并且经由RAM 2020将该程序或数据提供给硬盘驱动器2040。
ROM 2010和用于软盘驱动器2050的相对低速率输入输出装置和输入输出芯片2070被连接至输入输出控制器2084。ROM 2010存储例如在启动期间由计算机1900执行的引导程序和/或依赖于计算机1900的硬件的程序。软盘驱动器2050从软盘2090读程序或数据并且经由RAM 2020将该程序或数据提供给硬盘驱动器2040。输入输出芯片2070将软盘驱动器2050连接至输入输出控制器2084并且经由例如并行端口、串行端口、键盘端口或鼠标端口将多种输入输出装置连接至输入输出控制器2084。
经由RAM 2020被提供给硬盘驱动器2040的程序被存储在软盘2090、DVD-ROM 2095或例如IC卡的记录介质中并且其由用户提供。程序从该记录介质中被读取出、经由RAM 2020安装在计算机1900的硬盘驱动器 2040中并且在CPU 2000中被执行。
程序被安装在计算机1900中并且引起计算机1900起到获取单元110、存储单元120、输入矢量生成单元130、输出矢量生成单元140、学习处理单元150、概率计算单元160、指定单元170、计算单元210等的作用。
程序中描述的信息处理被计算机1900读取从而起到获取单元110、存储单元120、输入矢量生成单元130、输出矢量生成单元140、学习处理单元150、概率计算单元160、指定单元170、计算单元210等的作用,这些单元是由互相合作的软件和如上文说明的多种硬件资源得到的特定手段。与此实施例中的计算机1900的使用目的对应的信息的操作或处理通过特定手段来实现,由此与该使用目的对应的特定处理装置100被构建。
作为示例,当通信在计算机1900和外围装置等之间被执行时,CPU2000执行加载在RAM 2020上的通信程序并且基于在通信程序中所描述的处理内容指示通信接口2030执行通信处理。通信接口2030被CPU 2000控制并且读取出存储在被提供在存储装置上的传输缓冲区域等中的传输数据,并且向网络传输该传输数据或者将从网络接收到的接收数据写入被提供在存储装置上的接收缓冲区域等,该存储装置例如RAM 2020、硬盘驱动器2040、软盘2090或DVD-ROM 2095。以此方式,通信接口2030可以在通信接口2030和存储装置之间根据DMA(直接存储器访问)系统传送传输和接收数据。或者CPU 2000可以从在传送源处的存储装置或通信接口2030中读取出数据并且将该数据写入在传送目的地处的通信接口2030或存储装置中从而传送传输和接收数据。
CPU 2000根据DMA传送等从存储在例如硬盘驱动器2040、DVD驱动器2060(DVD-ROM 2095)或软盘驱动器2050(软盘2090)的外部存储装置中的文件、数据库等中读取出所有部分或必需的部分,将其读入RAM 2020并且在RAM 2020上向数据应用多种种类的处理。CPU 2000根据DMA传送等将经过处理的数据写回至外部存储装置。在这样的处理中,RAM 2020可以被认为是临时保持外部存储装置的内容。所以,在此实施例中,RAM 2020、外部存储装置等被一般地称为存储器、存储单元、 存储装置等。在此实施例中涉及多种程序、数据、表格、数据库等的多种种类的信息被存储在这样的存储装置上并且经过信息处理。CPU 2000可以在高速缓冲存储器中保持RAM 2020的部分并且在高速缓冲存储器上执行读和写。以此形式,高速缓冲存储器执行RAM 2020的功能的一部分。所以除非当被区分时,高速缓冲存储器也被包含在RAM 2020、存储器、和/或存储装置中。
CPU 2000向从RAM 2020读取出的数据应用由程序的命令序列指定的、包含此实施例中所描述的多种种类的操作、信息的处理、条件确定以及信息的查找和替换的多种种类的处理。例如,在执行条件确定时,CPU2000确定此实施例中所描述的多种可变量是否满足条件,例如这些可变量大于、小于、等于或大于、等于或小于、或等于其他可变量或常数,并且,当该条件被满足(或不被满足)时,分岔到不同的命令序列或调用子程序。
CPU 2000可以查找存储在存储装置中的文件、数据库等中的信息。例如,当多个条目被存储在存储装置中且其中第二属性的属性值分别与第一属性的属性值关联时,CPU 2000可以通过从存储在存储装置中的多个条目中查找其中第一属性的属性值与指定的条件相符的条目,并且读取出存储在该条目中的第二属性的属性值,而得到与满足预定条件的第一属性关联的第二属性的属性值。
上文说明的程序或模块可以存储在外部记录介质中。作为记录介质,除了软盘2090和DVD-ROM 2095,还可以使用例如DVD、蓝光(注册商标)、或CD的光记录介质、例如MO的磁光记录介质、磁带介质、例如IC卡的半导体存储器等。例如被连接至专用通信网络或互联网的服务器系统中提供的硬盘或RAM的存储装置可以被当做记录介质使用从而经由网络向计算机1900提供程序。
上文参考实施例说明了本发明。但是,本发明的技术范围不受实施例中所描述的范围的限制。可以向实施例增加多种改变或改良,这对于本领域技术人员来说是显而易见的。这些改变或改良增加的形式可以被包含在本发明的技术范围内,这从权利要求的范围的描述中是显而易见的。
应当注意到例如权利要求、说明书和附图中说明的装置、系统、程序和方法中的操作、过程、步骤和阶段的执行顺序可以以任意顺序被实现,除非该执行顺序用“以前”、“先于”等具体地清楚地指示并且在先处理的输出在其后处理中被使用。即使权利要求、说明书和附图中的操作流程为方便起见使用“首先”、“随后”等描述,这不意味着以所描述的顺序执行该操作流程是必须的。
【参考符号列表】
10...选择模型
12...输入层
14...输出层
16...中间层
100...处理装置
110...获取单元
112...指定输入单元
114...选择单元
120...存储单元
130...输入矢量生成单元
140...输出矢量生成单元
150...学习处理单元
160...概率计算单元
170...指定单元
210...计算单元
1900...计算机
2000...CPU
2010...ROM
2020...RAM
2030...通信接口
2040...硬盘驱动器
2050...软盘驱动器
2060...DVD驱动器
2070...输入输出芯片
2075...图形控制器
2080...显示装置
2082...总线控制器
2084...输入输出控制器
2090...软盘
2095...DVD-ROM

处理装置和处理方法.pdf_第1页
第1页 / 共36页
处理装置和处理方法.pdf_第2页
第2页 / 共36页
处理装置和处理方法.pdf_第3页
第3页 / 共36页
点击查看更多>>
资源描述

《处理装置和处理方法.pdf》由会员分享,可在线阅读,更多相关《处理装置和处理方法.pdf(36页珍藏版)》请在专利查询网上搜索。

为将认知性偏向的消费者的选择行为表示为可学习的模型,提供了生成选择模型的处理装置、处理方法和程序,该选择模型通过将对象对给予的选项的选择行为模型化而得到。该处理装置包含获取单元、输入矢量生成单元和学习处理单元,该获取单元被配置为获取包含至少一个用于学习的选择行为的学习数据,其中给予所述对象的选项是输入选项并且从所述输入选项中选择出的选项是输出选项,该输入矢量生成单元被配置为生成输入矢量,该输入矢量。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1