计算方法及计算系统.pdf

上传人:zhu****_FC 文档编号:6024357 上传时间:2019-04-03 格式:PDF 页数:11 大小:660.73KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510846723.8

申请日:

2015.11.27

公开号:

CN106815732A

公开日:

2017.06.09

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06Q 30/02申请日:20151127|||公开

IPC分类号:

G06Q30/02(2012.01)I

主分类号:

G06Q30/02

申请人:

英业达科技有限公司; 英业达股份有限公司

发明人:

王俊昌; 林芳妤; 郭士彰

地址:

201114 上海市闵行区漕河泾出口加工区浦星路789号

优先权:

专利代理机构:

上海宏威知识产权代理有限公司 31250

代理人:

袁辉

PDF下载: PDF下载
内容摘要

一种适用于多个输入数据的计算方法包含将输入数据拆分为训练数据与测试数据,将训练数据个别输入多个数学模型进行运算获得运算结果,比对运算结果与测试数据得到相似程度并根据相似程度反复调整该些数学模型的参数组合,根据相似程度及参数组合于多个数学模型挑选其中一者。

权利要求书

1.一种计算方法,适用于多个输入数据,其特征为,该计算方法包含:
将该些输入数据拆分为多个训练数据与多个测试资料;
将该些训练数据个别输入多个数学模型进行运算获得多个运算结果;
比对该些运算结果与该些测试数据得到多个相似程度并根据该些相似程度反
复调整该些数学模型的多个参数组合;以及
根据该些相似程度及该些参数组合挑选该些数学模型其中一者。
2.如权利要求1所述的计算方法,其特征为,该些输入数据报含多个产品数据,将
该些训练数据个别输入该些数学模型的运算包含一产品比对进程,该产品比对进
程根据该些产品数据所对应的多个类型对该些产品数据进行分类获得多个产品相
似度,其中该些运算结果包含该些产品相似度。
3.如权利要求1所述的计算方法,其特征为,该些输入数据报含多个顾客数据,将
该些训练数据个别输入该些数学模型的运算包含一顾客比对进程,该顾客比对进
程根据该些顾客数据所对应的多个交易纪录对该些顾客数据进行分类获得多个顾
客相似度,其中该些运算结果包含该些顾客相似度。
4.如权利要求1所述的计算方法,该些运算结果包含多个第一运算结果与多个第二
运算结果,该些相似程度包含多个第一相似程度与多个第二相似程度,该些参数
组合包含多个第一参数组合与多个第二参数组合,比对该些第一运算结果与该些
测试资料得到该些第一相似程度并根据该些第一相似程度产生该些数学模型的该
些第一参数组合,使该些数学模型采用该些第一参数组合对该些训练数据重新计
算得到该些第二运算结果,比对该些第二运算结果与该些测试资料得到该些第二
相似程度,并根据该些第二相似程度产生该些第二参数组合。
5.如权利要求4所述的计算方法,其特征为,该些第二相似程度包含一最高相似程
度,该些第二参数组合包含一优选参数组合,该最高相似程度对应该优选参数组
合,挑选该些数学模型中对应该优选参数组合。
6.一种计算系统,其特征为,该计算系统包含:
一数据库,用于存储多个输入数据;
一分割单元,耦接该数据库,用于将该些输入数据拆分成多个训练数据以及
多个测试数据;
一处理模块,耦接该分割单元,该处理模块包含:
一存储模块,用于存储多个数学模型;
一运算单元,用于将该些训练数据个别输入该些数学模型进行运算得
到多个运算结果;以及
一比对单元,用于比对该些运算结果与该些测试资料获得多个相似程
度,根据该些相似程度反复调整该些数学模型的多个参数组合;以及
一选择单元,耦接该处理模块,用于根据该些相似程度及该些参数组合挑选
该些数学模型中一者。
7.如权利要求6所述的计算系统,其特征为,该些输入数据报含多个产品数据,其
中将该些训练数据个别输入该些数学模型的运算包含一产品比对进程,该产品比
对进程根据该些产品数据所对应的多个类型对该些产品数据进行分类获得多个产
品相似度,其中该些运算结果包含该些产品相似度。
8.如权利要求6所述的计算系统,其特征为,该些输入数据报含多个顾客数据,其
中将该些训练数据个别输入该些数学模型的运算包含一顾客比对进程,该顾客比
对进程根据该些顾客数据所对应的多个交易纪录对该些顾客数据进行分类获得多
个顾客相似度,其中该些运算结果包含该些顾客相似度。
9.如权利要求6所述的计算系统,该些运算结果包含多个第一运算结果与多个第二
运算结果,该些相似程度包含多个第一相似程度与多个第二相似程度,该些参数
组合包含多个第一参数组合与多个第二参数组合,比对该些第一运算结果与该些
测试资料得到该些第一相似程度并根据该些第一相似程度产生该些数学模型的该
些第一参数组合,使该些数学模型采用该些第一参数组合对该些训练数据重新计
算得到该些第二运算结果,比对该些第二运算结果与该些测试资料得到该些第二
相似程度,并根据该些第二相似程度产生该些第二参数组合。
10.如权利要求9所述的计算系统,其特征为,该些第二相似程度包含一最高相似程
度,该些第二参数组合包含一优选参数组合,该最高相似程度对应该优选参数组
合,挑选该些数学模型中对应该优选参数组合。

说明书

计算方法及计算系统

技术领域

本发明关于一种计算方法及计算系统,特别是关于基于参数调整进而挑选数学模型的计
算方法及计算系统。

背景技术

现行的百货及零售商场提供智能型的商品推荐引擎,该些商品推荐引擎通常是利用后台
的数据(例如会员数据、产品数据、交易纪录等),运用数学模型演算出顾客及产品相关的相
似度信息,再搭配网络舆情数据及短距离传输技术进一步提供用户推荐的产品。然而,数学
模型的种类很多,每一数学模型在不同情形下所演算出的结果也会不同,也就是每一数学模
型于不同情况下各有优缺点,所推荐的商品不一定符合使用者的预期。

发明内容

根据本发明的一实施态样提出一种适用于多个输入数据的计算方法包含将输入数据拆分
为训练数据与测试数据,将训练数据个别输入多个数学模型进行运算获得运算结果,比对运
算结果与测试数据得到相似程度并根据相似程度反复调整该些数学模型的参数组合,根据相
似程度及参数组合于多个数学模型挑选其中一者。

根据本发明的另一实施态样提出一种计算系统包含数据库、分割单元、处理模块及选择
单元。数据库用于存储多个输入数据,分割单元用于将输入数据拆分成训练数据以及测试数
据,处理模块包含存储模块、运算单元以及比对单元。存储模块用于存储多个数学模型并将
数学模型加载运算单元,运算单元用于将训练数据个别输入数学模型进行运算得到运算结果,
比对单元用于比对运算结果与测试数据获得相似程度,根据相似程度反复调整数学模型的参
数,选择单元用于根据相似程度及参数组合挑选多个数学模型中一者。

附图说明

图1绘示本发明的一实施例的计算系统的方块图。

图2绘示本发明的一实施例的适用于多个输入数据的计算方法的方法流程图。

图3绘示本发明的一实施例的输入数据的示意图。

图4绘示本发明的一实施例的输入数据分割的示意图。

图5本发明的一实施例的运算结果的示意图。

图6绘示本发明的一实施例的测试数据的示意图。

组件标号说明:

100:数据库

120:分割单元

130:处理模块

131:存储模块

132:运算单元

133:比对单元

140:选择单元

200:计算方法

S202~S212:步骤

U1~U3:用户

I1~I10:电影

1~10:评分

IPT:输入数据

TRN:训练资料

TST:测试资料

EST1~EST9:运算结果

M1~M3:数学模型

P1、P2:参数

具体实施方式

图1绘示本发明的一实施例的计算系统100的方块图。计算系统100包含数据库110、分
割单元120、处理模块130以及选择单元140。

数据库110用于存储多笔的输入数据,这些输入数据报含了已存在的产品数据、顾客数
据或是交易纪录。其中产品数据可以是属于任何类型产品所包含的数据,例如家电用品、书
籍、服饰、食品等。顾客数据可以包含顾客的姓名、地址、电子信箱、电话号码等。交易纪
录可以是顾客曾经所购买产品的类型、购买数量、购买次数或是针对购买过的商品的评价等。

分割单元120用于将多个输入数据分成训练数据以及测试数据。于一实施例中,可以将
输入数据切分成80%的训练数据及20%的测试数据,也可以将输入数据切分成90%的训练数据
及10%的测试数据。上述分割的比例仅作为举例说明,本发明所涵盖的范围不限定于上述的实
施例。

处理模块130包含了存储单元131、运算单元132以及比对单元133。存储单元131用于
存储各种不同算法的数学模型并将该些数学模型加载运算单元132(例如CPU),其中这些数学
模型是用于计算一群集合对象之间的相似度。常见的数学模型例如Euclidean Distance、
Pearson correlation、Tanimoto coefficient、log-likelihood ratio、singular value
decomposition、alternating least squares等。

运算单元132用于将训练数据输入至数学模型中得到运算结果。举例来说,每一用户针
对购买过的多个产品给予评分,将这些评分数据其中一部分当成训练数据输入数学模型,通
过数学模型进行相似度运算,便可以得到用户与用户之间、产品与产品之间的相似度,也就
是运算结果。,于一些实施例中,运算单元132可为具有运算能力的装置,例如中央处理器
(CPU)。

比对单元133用于将在运算单元132得到的运算结果比对测试数据得到相似程度。根据
相似程度对数学模型的参数反复地进行调整。也就是说根据相似程度调整参数,基于调整后
的新参数进行演算会得到新的运算结果,再将新的运算结果比对测试数据得到新的相似程度,
比对单元133持续地以上述手法以自动化的方式调整数学模型的参数直到达到最高的相似程
度。

选择单元140用于根据相似程度及参数组合(也就是调整后的参数)在多个数学模型中挑
选出最适合之一者,也就是挑选上述所说达到最高相似程度的参数组合所对应的数学模型。
关于如何根据相似程度自动地调整数学模型的参数及挑选最适合的数学模型,将于下列段落
中有详细描述。

请一并参照图2,其绘示本发明的一实施例的适用于多个输入数据IPT的计算方法200的
方法流程图。在步骤S202中,由数据库110中提取多个输入资料,如上述所说,输入数据可
以包含产品数据、顾客数据或是交易纪录等已经存在的历史资料。

请一并参照图3,其绘示本发明的一实施例的输入数据IPT的示意图。如图3所示,用户
U1~U3针对观看过的电影I1~I10进行了评分。其中数字代表用户U1~U3对于电影I1~I10的满
意度评价,数字越大代表满意度越高,用户越喜欢该电影,反之,数字越小代表用户越不喜
欢该电影。于实施例中,用户与用户之间、产品与产品之间的相似度是通过用户评分数据进
行运算。于其他实施例中,用户与用户之间、产品与产品之间的相似度可以通过其他的数据(例
如产品数据/类型、客户基本数据或是历史交易纪录等)来进行运算。

在步骤S204中,分割单元120将输入数据IPT分割成训练数据与测试数据。于一些实施
例,训练数据与测试数据分割的比例为70%与30%、80%与20%或是90%与10%等。请一并参照
图4,其绘示本发明的一实施例的输入数据IPT分割的示意图。如图4所示,用户对十部电影
I1~I10皆进行了评分并且将评分数据(也就是上述的输入数据IPT)依比例70%与30%分割成训
练数据TRN与测试数据TST,其中黑色方方框所包含的就是测试数据TST,未被黑色方框所包
含的就是训练数据TRN。要注意的是,针对训练数据与测试数据分割的比例以及方式,本发明
所涵盖的范围并不限于上述实施例中。

将输入数据IPT分割成训练数据TRN与测试数据TST后,在步骤S206中,运算单元132
将训练数据TRN输入数学模型中进行运算可以得到运算结果。如上述段落所说,数学模型为
目前相关领域中常用的相似度模型,例如Euclidean Distance、Pearson correlation、
Tanimoto coefficient等,其中每一种数学模型皆有其可调整的参数。基于这些参数,通过
这些模型的运算,进行客户比对进程或产品比对进程分别可以得到客户与客户(于实施例中也
就是用户U1~U3)之间的相似度或是产品与产品(于实施例中也就是电影I1~I10)之间得相似
度。

举例来说,请一并参照图5,其绘示本发明的一实施例的运算结果的示意图,如图5所示,
将训练数据TRN(也就是图4中未被黑色方框所包含的数据)输入数学模型M1来运算用户U1~U3
之间的相似度,其中数学模型M1具有可调整的参数P1及P2,数学模型M1基于参数P1及P2
经过运算后可以得到运算结果EST1~EST9,也就是说运算结果EST1~EST3所代表的就是经由数
学模型M1基于这一些训练数据推测出用户U1对电影I3、I6、I9的喜好程度。

同样地,运算结果EST4~EST6所代表的就是经由数学模型M1基于这一些训练数据推测出
用户U2对电影I1、I5、I8的喜好程度。运算结果EST7~EST9所代表的就是经由数学模型M1
基于这一些训练数据推测出用户U3对电影I2、I7、I10的喜好程度。

请一并参照图6,其绘示本发明的一实施例的测试数据TST的示意图。在步骤S208中,
比对单元133将运算结果与测试数据进行比对。于实施例中,也就是将图5的运算结果
EST1~EST9与图6的测试数据TST比对得到相似程度。换句话说,运算结果EST1~EST3比对图
6的用户U1对电影所做的评分U1:[I3:2,I6:3,I9:5],运算结果EST4~EST6比对图6
的用户U2对电影所做的评分U2:[I1:2,I5:9,I8:7],运算结果EST7~EST9比对图6的
用户U3对电影所做的评分U3:[I2:8,I7:3,I10:9]。

由于数学模型M1基于参数P1及P2所运算出来的运算结果EST1~EST9(也就是第一运算结
果)与实际上的测试数据TST之间的相似程度(也就是第一相似程度)低,运算结果
EST1~EST9(也就是第一运算结果)与测试数据之间的误差相当大。也就是说,数学模型M1的
初始参数P1及P2的组合并不是最适合此次的输入数据。

此时在步骤S210中,比对单元133自动地根据第一运算结果与测试数据TST之间的第一
相似程度将数学模型所包含的可调整的参数进行调整,基于调整过后的参数(也就是第一参数
组合),再一次进行运算并得到新的运算结果(也就是第二运算结果),再将第二运算结果与测
试数据TST比对可以得到第二相似程度,若第二相似程度仍然很低,此时再一次调整参数,
可再一次得到新的参数(也就是第二参数组合)。

于此实施例中,根据运算结果EST1~EST9(也就是第一运算结果)与测试数据TST之间的相
似程度(也就是第一相似程度)对数学模型M1的初始参数P1及P2进行适当的调整可以得到第
一参数组合,基于该第一参数组合再一次将图4的训练数据TRN输入数学模型M1得到新的运
算结果EST1~EST9(也就是第二运算结果)。比对单元133再将新的运算结果EST1~EST9(也就
是第二运算结果)与测试数据TST进行比对进而得到第二相似程度。

倘若将参数P1及P2调整之后,得到的新的运算结果EST1~EST9与测试数据之间的第二
相似程度仍然很低,此时比对单元133可以自动地根据上述的第二相似程度,再一次对调整
后的参数P1及P2再进行一次的调整。要注意的是,于不同实施例中,调整参数的次数不一
定相同。

上述所说基于运算结果EST1~EST9与测试数据TST之间的相似程度反复进行参数的调整,
其实施的方式为一自动化的过程。也就是说,当第一次所得到的相似程度很低时,比对单元
133会自动地根据该相似程度,对数学模型内的可允许调整的参数进行调整,并且根据调整后
的新参数再进行第二次运算得到第二运算结果EST1~EST9,将第二运算结果EST1~EST9比对测
试数据TST得到第二相似程度。应该了解到的是第二相似程度高于第一相似程度。换句话说,
比对单元133每次自动调整一次参数,其所得到新的相似程度会比前一次所得到的相似程度
更高。运算结果EST1~EST9与测试数据TST之间的相似程度随着多次自动化的运算及调整后
会越来越高,直到运算结果EST1~EST9趋近于实际的测试数据TST。

上述实施例仅针对数学模型M1来做描述,实际上,于实施例中,存储模块131内存储了
其他的数学模型M2及M3。依照上述相同的做法,将相同的训练数据TRN输入数学模型M2及
M3得到运算结果,并且比对运算结果与测试数据得到相似程度,再针对数学模型M2及M3的
可调整的参数进行反复调整。于不同实施例,其调整数学模型参数的次数皆不相同(例如3次、
5次、20次)。

实施例中所述的数学模型M1、M2及M3皆可能具有不同的可调整参数,也就是说其参数
的属性或是参数调整的方式皆可能不同(例如将参数比重或权重向上调整)。本发明所涵盖的
范围不限定于上述实施例。

当每一数学模型所包含的可调整的参数经过多次反复的调整之后,在步骤S212中,选择
单元140依照相似程度以及参数组合自动地挑选出一个数学模型,其中该数学模型具有优选
的参数组合而且基于该参数组合得到的运算结果与测试数据TST具有最高的相似度。对应

举例来说,于实施例中,数学模型M1所包含的可调整的参数P1及P2经过多次调整后,
基于该多次调整后的参数P1及P2所得到的运算结果EST1~EST9与测试数据TST比对,发现
运算结果EST1~EST9与测试数据TST之间的相似程度很高,也就是运算结果EST1~EST9与测
试数据之间所具有的误差相当低。

另一方面数学模型M2及M3以相同手法经过多次的参数调整,其运算结果EST1~EST9与
测试数据之间的相似程度也很高,此时将数学模型M2及M3所得到的相似程度与数学模型M1
所得到的相似程度相比较,基于多次调整后的参数组合的数学模型M1,其运算结果与实际的
测试数据之间的相似程度为三个模型中最为相近的,上述多次调整后的参数P1及P2即为优
选参数组合,此时选择单元140便挑选数学模型M1。

上述所说的运算结果是以用户I1~U3的角度来做运算得到用户U1~U3之间的相似度,于
另一个例子,运算结果是以产品的角度来做运算,也就是运算产品之间的相似度。于实施例
中,也就是以电影I1~I10的角度来做运算得到电影I1~I10之间的相似度。其挑选数学模型
的实施方式与上述实施例相同,在此不另赘述。

综合以上,可以了解当输入资料不同时,其所分割出的训练数据以及测试数据会不同,
运算结果也会不同,参数调整的方式及次数也会有差异,最后挑选出的数学模型也不同。

举例来说,若图3的输入数据IPT的内容改变,其训练数据TRN以及测试数据TST也有
所改变,此时将训练数据TRN输入同样的数学模型M1、M2及M3,其运算结果EST1~EST9及各
个数学模型的参数调整也会不同,依此道理,最后挑选到的对应优选参数的数学模型不一定
是数学模型M1(可能是数学模型M2或M3)。

换句话说,于本发明的实施例所述的数学模型M1、M2及M3并无绝对的好坏差异,在一
些情形下,数学模型M2比数学模型M1、M3更适合,在另一些情形下,数学模型M3比数学模
型M1、M2更适合。因此本发明所揭示的内容强调考虑特定的输入数据,通过自动化的过程于
不同的数学模型中挑选出最适合此次输入数据内容的数学模型。

通过以上较佳具体实施例的详述,希望能更加清楚描述本发明的特征与精神,而并非以
上述所揭露的较佳具体实施例来对本发明的范畴加以限制。相反地,其目的是希望能涵盖各
种改变及具相等性的安排于本发明所欲申请的权利要求范围的范畴内。

计算方法及计算系统.pdf_第1页
第1页 / 共11页
计算方法及计算系统.pdf_第2页
第2页 / 共11页
计算方法及计算系统.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《计算方法及计算系统.pdf》由会员分享,可在线阅读,更多相关《计算方法及计算系统.pdf(11页珍藏版)》请在专利查询网上搜索。

一种适用于多个输入数据的计算方法包含将输入数据拆分为训练数据与测试数据,将训练数据个别输入多个数学模型进行运算获得运算结果,比对运算结果与测试数据得到相似程度并根据相似程度反复调整该些数学模型的参数组合,根据相似程度及参数组合于多个数学模型挑选其中一者。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1