基于建筑物价值评估的计算方法和装置.pdf

上传人:00****42 文档编号:1636143 上传时间:2018-06-30 格式:PDF 页数:18 大小:1.22MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510181198.2

申请日:

2015.04.16

公开号:

CN104751007A

公开日:

2015.07.01

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 19/00申请日:20150416|||公开

IPC分类号:

G06F19/00(2011.01)I

主分类号:

G06F19/00

申请人:

百度在线网络技术(北京)有限公司

发明人:

祝恒书; 唐方爽

地址:

100085北京市海淀区上地十街10号百度大厦三层

优先权:

专利代理机构:

北京英赛嘉华知识产权代理有限责任公司11204

代理人:

王达佐; 马晓亚

PDF下载: PDF下载
内容摘要

本申请公开了一种基于建筑物价值评估的计算方法和装置。所述方法的一具体实施方式包括:获取多个建筑物的配置数据;基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布;根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度;确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。该实施方式可以有效地利用建筑物的不同配置属性特征,在对建筑物进行价值评估时能够获得更高的准确性和更好的可解释性。

权利要求书

权利要求书
1.  一种基于建筑物价值评估的计算方法,其特征在于,所述方法包括:
获取多个建筑物的配置数据,所述多个建筑物包括待评估建筑物以及至少一个已确定价值的建筑物;
基于所述配置数据,采用机器学习方法对所述多个建筑物建立功能分布模型,得到所述多个建筑物的功能特征分布;
根据所述功能特征分布计算所述已确定价值的建筑物与所述待评估建筑物的相似度;
确定至少一个与所述待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及
基于所述相似建筑物集合中所有建筑物的价值确定所述待评估建筑物的价值。

2.  根据权利要求1所述的方法,其特征在于,所述基于所述配置数据,采用机器学习方法对所述多个建筑物建立功能分布模型,得到所述多个建筑物的功能特征分布,包括:
确定所述多个建筑物可能具有的一个以上功能;
将所述配置数据与每一种可能的功能相关联,初始化建筑物功能分布模型;
以所述多个建筑物的配置数据作为训练样本,采用机器学习方法估计所述建筑物功能分布模型的参数;
基于所述建筑物功能分布模型的参数计算所述多个建筑物的功能特征分布。

3.  根据权利要求1所述的方法,其特征在于,所述功能特征分布包括至少一个功能及每个功能所对应的概率;
所述根据所述功能特征分布计算所述已确定价值的建筑物与所述待评估建筑物的相似度,包括:
计算所述已确定价值的建筑物与所述待评估建筑物的功能特征分布中每一个功能所对应的概率的相似度,得到所述已确定价值的建筑物与所述待评估建筑物的功能相似度分布;
基于所述功能相似度分布确定所述已确定价值的建筑物与所述待评估建筑物的相似度。

4.  根据权利要求3所述的方法,其特征在于,所述基于所述功能相似度分布确定所述已确定价值的建筑物与所述待评估建筑物的相似度,包括:
将所述功能相似度分布的以下任一个特征作为所述已确定价值的建筑物与所述待评估建筑物的相似度:加权和、加权平均值、均值、均方差以及标准差。

5.  根据权利要求1所述的方法,其特征在于,还包括:
对所述配置数据进行泛化处理,包括:
将连续的配置数据离散化,对离散化后的配置数据进行编码,得到配置数据的数值表示;或者
将所述配置数据转换为向量特征表示。

6.  根据权利要求1-5之一所述的方法,其特征在于,还包括:在根据所述功能特征分布计算已确定价值的建筑物与所述待评估建筑物的相似度之前,
基于所述配置数据的时间特性和/或统计特性对所述已确定价值的建筑物进行过滤。

7.  根据权利要求1-5之一所述的方法,其特征在于,所述基于所述相似建筑物集合中所有建筑物的价值确定所述待评估建筑物的价值,包括:
基于所述待评估建筑物与所述相似建筑物集合中已确定价值的建筑物间的相似度和/或时间关联性,确定所述相似建筑物集合中已确定 价值的建筑物的权重;
对所述相似建筑物集合中所有建筑物的价值进行加权求和,以确定所述待评估建筑物的价值。

8.  根据权利要求7所述的方法,其特征在于,根据以下公式确定所述相似建筑物集合中已确定价值的建筑物的权重:
wi=si*(1-γ*Sigmoid(n))
其中,wi为所述相似建筑物集合中已确定价值的建筑物的权重,γ为时间衰减因子,si为第i个已确定价值的建筑物与所述待评估建筑物的相似度,n为所述已确定价值的建筑物确定价值的时间与评估时间之间的时间长度,Sigmoid(n)是以n为变量的Sigmoid函数。

9.  根据权利要求1-5之一所述的方法,所述多个建筑物的功能至少包括:投资功能、学区功能、商区功能、居住功能、工业功能;
所述配置数据至少包括:结构数据、环境数据、地理位置数据。

10.  一种基于建筑物价值评估的计算装置,其特征在于,所述装置包括:
获取单元,用于获取多个建筑物的配置数据,所述多个建筑物包括待评估建筑物以及至少一个已确定价值的建筑物;
建模单元,用于基于所述配置数据,采用机器学习方法对所述多个建筑物建立功能分布模型,得到所述多个建筑物的功能特征分布;
计算单元,用于根据所述功能特征分布计算所述已确定价值的建筑物与所述待评估建筑物的相似度;
确定单元,用于确定至少一个与所述待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及
评估单元,用于基于所述相似建筑物集合中所有建筑物的价值确定所述待评估建筑物的价值。

11.  根据权利要求10所述的装置,其特征在于,所述建模单元用 于按如下方式得到所述多个建筑物的功能特征分布:
确定所述多个建筑物可能具有的一个以上功能;
将所述配置数据与每一种可能的功能相关联,初始化建筑物功能分布模型;
以所述多个建筑物的配置数据作为训练样本,采用机器学习方法估计所述建筑物功能分布模型的参数;
基于所述建筑物功能分布模型的参数计算所述多个建筑物的功能特征分布。

12.  根据权利要求10所述的装置,其特征在于,所述功能特征分布包括至少一个功能及每个功能所对应的概率;
所述计算单元包括:
功能相似度分布确定单元,用于计算所述已确定价值的建筑物与所述待评估建筑物的功能特征分布中每一个功能所对应的概率的相似度,得到所述已确定价值的建筑物与所述待评估建筑物的功能相似度分布;
相似度计算单元,用于基于所述功能相似度分布确定所述已确定价值的建筑物与所述待评估建筑物的相似度。

13.  根据权利要求12所述的装置,其特征在于,所述相似度计算单元将所述功能相似度分布的以下任一个特征作为所述已确定价值的建筑物与所述待评估建筑物的相似度:加权和、加权平均值、均值、均方差以及标准差。

14.  根据权利要求10所述的装置,其特征在于,还包括:
预处理单元,用于对所述配置数据进行泛化处理;
所述预处理单元用于按如下方式对所述配置数据进行泛化处理:
将连续的配置数据离散化,对离散化后的配置数据进行编码,得到配置数据的数值表示;或者
将所述配置数据转换为向量特征表示。

15.  根据权利要求10-14之一所述的装置,其特征在于,还包括:过滤单元,用于基于所述配置数据的时间特性和/或统计特性对所述已确定价值的建筑物进行过滤。

16.  根据权利要求10-14之一所述的装置,其特征在于,所述评估单元用于按如下方式确定所述待评估建筑物的价值:
基于所述待评估建筑物与所述相似建筑物集合中已确定价值的建筑物间的相似度和/或时间关联性,确定所述相似建筑物集合中已确定价值的建筑物的权重;
对所述相似建筑物集合中所有建筑物的价值进行加权求和,以确定所述待评估建筑物的价值。

17.  根据权利要求16所述的装置,其特征在于,所述评估单元根据以下公式确定所述相似建筑物集合中已确定价值的建筑物的权重:
wi=si*(1-γ*Sigmoid(n))
其中,wi为所述相似建筑物集合中已确定价值的建筑物的权重,γ为时间衰减因子,si为第i个已确定价值的建筑物与所述待评估建筑物的相似度,n为所述已确定价值的建筑物确定价值的时间与评估时间之间的时间长度,Sigmoid(n)是以n为变量的Sigmoid函数。

18.  根据权利要求10-14之一所述的装置,所述多个建筑物的功能至少包括:投资功能、学区功能、商区功能、居住功能、工业功能;
所述配置数据至少包括:结构数据、环境数据、地理位置数据。

说明书

说明书基于建筑物价值评估的计算方法和装置
技术领域
本申请涉及数据处理技术领域,具体涉及用于评估的数据处理技术领域,尤其涉及基于建筑物价值评估的计算方法和装置。
背景技术
在现有技术中,建筑物价值的评估的方法主要是基于建筑物的各种配置以及宏观市场指标结合线性回归分析来进行预测。一种常用的预测方法是采用享乐价格模型(Hedonic Pricing Model),将建筑物的配置特征(例如面积、地理位置等)量化后输入模型中计算建筑物的价格。其中将建筑物的配置特征转换为数值进行回归分析比较困难,不恰当的转换可能会导致较低的预测精度。另外,有一些配置特征是相互联系的,例如总价格、每平米价格和总面积,在上述方法中模型的可解释性较差,无法直观地体现出这些配置特征之间的关联。在采用模型计算时,这些互相关联的配置特征之间可能会出现系数正负相抵的结果,从而影响价值估计的精度。
发明内容
为解决上述现有技术中的缺陷,期望提供一种能够充分利用建筑物的配置特征对建筑物进行价值评估的方法,进一步地,还期望提供一种基于整合的配置特征的建筑物价值评估方法,以提升评估的准确度。本申请提供了基于建筑物价值评估的计算方法和装置。
一方面,本申请提供了一种基于建筑物价值评估的计算方法。该方法包括:获取多个建筑物的配置数据,其中多个建筑物包括待评估建筑物以及至少一个已确定价值的建筑物;基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布;根据功能特征分布计算已确定价值的建筑物与待评估建筑物 的相似度;确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。
另一方面,本申请提供了一种基于建筑物价值评估的计算装置。该装置包括:获取单元,用于获取多个建筑物的配置数据,其中多个建筑物包括待评估建筑物以及至少一个已确定价值的建筑物;建模单元,用于基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布;计算单元,用于根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度;确定单元,用于确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及评估单元,用于基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。
本申请提供的基于建筑物价值评估的计算方法和装置,通过基于多个建筑物的配置数据采用机器学习的方法建立功能分布模型,整合了建筑物的配置数据,将配置数据转换为功能特征分布,进而根据功能特征分布确定相似建筑物集合,并基于相似建筑物的价值对待评估建筑物的价值做出评估,有效地利用了建筑物的异构特征,能够获得更高的准确性和更好的可解释性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了建筑物的属性数据与功能的关系示意图;
图2示出了根据本申请一个实施例的基于建筑物价值评估的计算方法的示意性的流程图;
图3示出了根据本申请一个实施例的建立功能分布模型的方法的示意性的流程图;
图4示出了根据本申请另一个实施例的基于建筑物价值评估的计算方法的示意性的流程图;
图5示出了根据本申请一个实施例的基于建筑物价值评估的计算 装置的示意性结构图;
图6示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了建筑物的属性数据与功能的关系示意图。在本申请的实施例中,将建筑物的配置数据与建筑物可能具有的功能相关联。如图1所示,建筑物100可能具有多个功能:功能1、功能2、…功能M。建筑物100也可以包含多个配置数据:配置1、配置2、配置3、…配置N,其中M、N均为正整数。建筑物的每个功能可以与每个配置数据相关联,每个配置数据可以潜在地对应多个功能。具体的关联关系可以由统计数据得出,并且可以由比例数据来表示。在一些实现中,可以统计大数据量的建筑物的配置数据与功能后得出每一个配置数据与其功能间的对应关系。例如,配置数据中面积超过200平方米的建筑物数量占所有住宅功能的建筑物总数量的5%,面积为100-200平方米的建筑物数量占所有住宅功能的建筑物总数量的40%,则可以将建筑物的配置数据中面积大于200平方米和面积在100-200平方米之间与住宅功能间的关联关系分别量化为0.05和0.4。这样,可以基于统计数据建立各配置数据与各功能间的关联关系。
请参考图2,其示出了根据本申请一个实施例的基于建筑物价值评估的计算方法的示意性的流程图。本实施例主要以该方法应用于具有数据处理能力的服务器或终端设备中来说明。
如图2所示,在步骤201中,获取多个建筑物的配置数据。
在本实施例中,服务器或终端设备可以首先获取多个建筑物的配置数据。其中多个建筑物可以包括待评估建筑物和至少一个已确定价值的建筑物。已确定价值的建筑物的配置数据的获取方式包括但不限于:搜集网络上的建筑物数据、从包含建筑物配置数据的广告中提取以及获取人工调查并标记的建筑物数据。这些建筑物的价值可以由价格、升值潜力、可预期的投资回报比等数据直观地表征。
在一些实现中,建筑物的配置数据至少可以包括:结构数据、环境数据以及地理位置数据。其中结构数据可以包括:面积、高度、布局、装修等数据,例如房屋的结构数据可以包括房屋面积、房屋所在楼层、房屋的户型、房屋的装修状况、房屋的采光状况以及车位数量等数据。环境数据可以表征影响建筑物价值的周边环境,可以包括周边自然环境、交通状况、医疗设施、生活服务设施等数据。例如可以包括周边的空气质量、噪音等级、水质、绿化面积等数据,还可以包括景观区、公园、医院、超市、餐饮店铺、学校、公共交通站点、居民区、商场、银行、办公楼、游乐场、工厂等场所的数量、类型及各场所与建筑物间的距离数据。地理位置数据可以包括建筑物的实际地理位置数据和相对地理位置数据,例如房屋的地理位置数据可以包括该房屋所处的位置(例如某街道某号)及该房屋在一个大的区域内的相对位置(例如房屋位于北京市的北四环)。
在步骤202中,基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布。
一般而言,每个建筑物都具有多个潜在的功能。例如房屋可以具有学区房、住宅房、投资房、上班房等功能。这些功能通过建筑物的不同配置数据得到实现,即这些功能与建筑物的配置数据存在如图1中所示的关联性。因此,可以将建筑物表示为若干在功能上的分布,进而根据功能分布对建筑物的价值进行评估。
在本实施例中,可以对建筑物的配置数据进行建模分析。可以采用机器学习方法建立建筑物的功能分布模型,得出建筑物的功能分布模型。在一些实现中,可以基于获取的多个建筑物的配置数据,采用主题模型建立功能分布模型。可以将建筑物作为主题模型中的文档, 建筑物的功能作为主题模型中的主题,每个配置数据作为主题文档中的单词,统计多个建筑物的配置数据,计算每个配置数据对应于每个功能的条件概率。以房屋的配置数据为周边1千米以内公共交通站点数大于5,功能为上班功能为例,可以统计周边1千米已被公共交通站点数大于5的建筑物占所有统计建筑物的比例,并通过机器学习获得上班功能中周边1千米以内公共交通站点数大于5的建筑物的比例以及每个建筑物的功能中上班功能的概率。在机器学习过程中,可以依次或同时计算建筑物可能具有的多个功能的概率,则可以得出每个建筑物的功能特征分布。
在上述机器学习方法中,当各配置数据间具有关联性时,可以通过计算条件概率将这些关联的配置数据进行整合,例如将景观区数量数据和绿化面积数据整合为绿化度数据,并基于整合的绿化度数据计算建筑物各功能的概率。功能分布模型建立过程中采用了配置数据和功能的条件概率,不仅可以反映各配置数据对各功能的影响大小,而且具有更好的可解释性。
在一些实现中,通过建模所获得的建筑物的功能特征分布中每个功能没有具体的含义,这时,可以结合领域知识对各个功能进行解释。例如功能可以包括投资功能、学区功能、商区功能、居住功能、工业功能等,使得功能分布模型具有更好的可解释性。
通过将建筑物的配置数据转换为数值表示的功能特征分布,将配置数据与功能相关联,可以有效地利用建筑物的异构性,即可以有效利用建筑物的不同配置特征,进而保证建筑物价值的估算精度。
在步骤203中,根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度。
在基于步骤202中的模型计算出已确定价值的建筑物的功能特征分布和待评估建筑物的功能特征分布之后,可以根据功能特征分布计算多个已确定价值的建筑物与待评估建筑物的相似度。如上所述,功能特征分布中可以包括至少一个功能及每个功能所对应的概率。该功能特征分布可以表示为向量,向量中每个元素可以表示一种功能及该功能所对应的概率。可以利用相似度计算公式计算已确定价值的建筑 物与待评估建筑物的功能或功能分布的相似度,作为已确定价值的建筑物与待评估建筑物的相似度。该相似度可以表征已确定价值的建筑物与待评估建筑物之间的相似程度或相关程度。相似度越大,则可以认为相似程度或相关性越高。可选的相似度计算方法可以包括余弦相似度计算、皮尔森相关系数计算等。
在一些实施例中,根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度可以采用如下方式进行:计算已确定价值的建筑物与待评估建筑物的功能特征分布中每一个功能所对应的概率的相似度,得到已确定价值的建筑物与待评估建筑物的功能相似度分布,之后基于功能相似度分布确定已确定价值的建筑物与待评估建筑物的相似度。具体而言,可以计算每个功能所对应的概率之间的绝对差的倒数,并进行归一化(即最大相似度为1),作为该功能对应的相似度值。如果某一已确定价值的建筑物的功能特征分布中包含待评估建筑物的功能特征分布中不存在的功能,则可以认为该功能在待评估建筑物的功能特征分布中对应的概率为零。这样,对每一个已知价值的建筑物,可以得到每一个功能所对应的相似度,从而获得每一个已知价值的建筑物与待评估建筑物的功能相似度分布。当建筑物的功能特征分布以向量表示时,功能相似度分布也可以以向量表示,向量中每一个元素的值可以是功能相似度的值。
进一步地,可以将功能相似度分布的以下任一个特征作为已确定价值的建筑物与所述待评估建筑物的相似度:加权和、加权平均值、均值、均方差以及标准差。当功能相似度分布以向量表示时,向量中的每一元素代表一个功能,该元素的值代表该功能所对应的功能相似度的大小。可以计算该向量中所有元素值的加权和、加权平均值、均值、均方差或标准差,得出一个数值,作为已确定价值的建筑物与所述待评估建筑物的相似度。
在本实施例中,对每一个已确定价值的建筑物,按照上述方式计算其与待评估建筑物的相似度,则可以获得每个已确定价值的建筑物与待评估建筑物的相似度。
在步骤204中,确定至少一个与待评估建筑物相似度最大的已确 定价值的建筑物,构成相似建筑物集合。
在获得多个已确定价值的建筑物与待评估建筑物的相似度之后,可以对相似度进行排序,从所有已确定价值的建筑物中选取至少一个与待评估建筑物相似度最大的建筑物,构成相似建筑物集合。由于步骤203所计算出的相似度为基于功能特征分布的相似度,因而相似建筑物集合中的建筑物可以认为是与待评估建筑物功能相似的建筑物。
在步骤205中,基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。
在本实施例中,确定相似建筑物集合之后,可以根据该集合中建筑物的价值来估算待评估建筑物的价值。相似建筑物集合中可以包含多个与待评估建筑物功能相似的建筑物。在一些实现中,为使待评估建筑物的价值评估准确性更高,可以对多个与待评估建筑物功能相似的建筑物的价值做平均,将相似建筑物的价值的平均值作为待评估建筑物的价值评估结果。
在另一些实现中,还可以对相似建筑物集合中所有建筑物的价值进行加权求和,以确定待评估建筑物的价值。一般情况下,建筑物的价值评估与评估时间相关。相似建筑物集合中已确定价值的建筑物的价值确定时间可能与待评估建筑物的价值评估时间关联程度不同。评估时间与价值确定时间相近的,时间关联性较强,而评估时间与价值确定时间相距较远的,时间关联性较差。同时,还可以考虑相似度大小对价值评估的不同影响。因此,可以基于上述考量为相似建筑物集合中的建筑物设置权重。该权重可以基于待评估建筑物与相似建筑物集合中已确定价值的建筑物间的相似度和/或时间关联性来确定。如果以γ表示时间衰减因子,si为第i个已确定价值的建筑物与待评估建筑物的相似度,n表示确定价值的时间与评估时间之间的时间长度,相似建筑物集合中已确定价值的建筑物的权重wi可以根据式(1)来计算:
wi=si*(1-γ*Sigmoid(n))            (1)
其中,Sigmoid(n)是以n为变量的Sigmoid函数。当γ=0时可以不考虑时间衰减,wi=si。当γ≠0时,权重wi随时间长度n增长逐渐减 小。
如果相似建筑物集合中第i个建筑物的价值已被确定为Pi,则待评估建筑物的价值PP可以根据式(2)计算:
PP=Σiwi*Pi---(2)]]>
通过对多个建筑物的价值做加权平均,根据不同建筑物与待评估建筑物之间的相似度和时间关联性大小确定该建筑物价值在待评估建筑物价值评估中所占的比重,可以提升建筑物价值评估计算的可靠性和准确性。
对于本申请的上述实施例,应用场景可以为:基于当前房源和历史房源的配置信息以及历史房源的房价来估算当前房源的价格。假设每个房源都有潜在的各种功能,如学区房功能、投资功能、住宅功能、上班房功能等。这些功能可以通过该房源的不同配置信息来得到实现。可以采用机器学习方法对房源进行建模,得到不同房源在功能上的分布,之后可以根据功能分布计算当前房源与历史房源之间的相似度,从而利用相似度找到功能相似的历史房源,利用这些功能相似的历史房源的售价来估计当前房源的价格。在估计过程中,可以考虑历史房源与当前房源的相似度大小和售出时间不同对房价的影响,为历史房源的房价设置权重,对多个相似房源的售价进行加权平均,得到对当前房源的预测售价。可选地,还可以利用预测售价减去当前标价,再除以当前标价,得到当前房源的升值潜力。
本申请上述实施例可以不仅可以应用于上述应用场景中的房屋售价预估系统和房屋升值潜力评估系统,还可以用于异常房屋出售检测系统和房屋推荐系统中。例如,在异常房屋出售检测系统中,可以根据上述实施例的方法计算房屋的价值,并与房屋的实际售价作对比,如果二者相差较大,可以认为该房屋为异常出售的房屋。又例如在房屋推荐系统中,可以根据上述实施例的方法计算房屋的相似度,并基于相似度大小向用户推荐功能相似的房屋;也可以根据上述实施例的方法计算多个待选房屋的预估价格,基于待选房屋的预估价格推荐符合用户期望价格的房屋;还可以在基于房屋的预测售价和实际售价计算出房屋的升值潜力后,向用户推荐高升值潜力的房屋。
本申请上述实施例提供的方法通过基于已确定价值的建筑物与待评估建筑物的配置数据,采用机器学习方法得出功能特征分布,之后计算相似度,确定相似建筑物集合,并根据相似建筑物的价值计算待评估建筑物的价值。能够有效地利用建筑物的异构特征,并且可以通过整合具有关联性的配置数据,提升建筑物价值评估的可靠性和准确性。
进一步参考图3,其示出了根据本申请一个实施例的建立功能分布模型的方法的示意性的流程图,也即示出了图2所示实施例中步骤202的一种实现方式的流程图。
如图3所示,在步骤301中,确定多个建筑物可能具有的一个以上功能。
在本实施例中,可以首先根据经验或通过网络等信息搜集方式获取的统计数据确定建筑物可能具有的一个以上功能。例如,可以通过网络上公开的建筑物功能信息或通过大数据量的建筑物训练获知已确定价值的建筑物具有的功能,如学区功能、商区功能、居住功能、投资功能、工业功能等功能,则可以假设待评估建筑物也具有这些功能。
在步骤302中,将配置数据与每一种可能的功能相关联,初始化建筑物功能分布模型。
如上所述,建筑物的每个功能可以与每个配置数据相关联,每个配置数据可以潜在地对应多个功能。每个配置数据可以潜在地对应多个功能。在一些实现中,配置数据与功能的关联关系可以由统计数据得出,并且可以由比例数据或权重来表示。在本实施例中,建筑物的功能分布模型可以包含这种关联关系,例如可以是一个以各配置数据与各功能的关联系数为输入、以功能及功能的概率为输出的概率分布模型。在初始化建筑物的功能分布模型时,可以基于上述统计的比例数据或权重设定配置数据与各功能的关联系数的初始值,也可以随机设置关联系数的初始值,获得初始化的功能分布模型。
在步骤303中,以多个建筑物的配置数据作为训练样本,采用机器学习方法估计建筑物功能分布模型的参数。
在本实施例中,可以通过采用机器学习方法对样本集进行训练来 调整功能分布模型的参数,得到可靠稳定的关联系数值以及功能分布模型。其中样本集可以是上述多个建筑物的配置数据,采用的机器学习方法可例如为基于限制的矩阵分解、主题模型等。在一些实现中,还可以根据已确定价值的建筑物的功能来计算模型的误差,并基于误差调整模型的参数。例如当已确定价值的一个建筑物的功能为商区功能时,如果在训练过程中计算得该建筑物的商区功能的概率很小,则可以将与商区功能相关联的配置数据(如周边餐饮店铺数量、居民区数量、银行数量)的关联系数调高;或者可以统计多个建筑物由功能分布模型确定的最大概率的功能与实际功能之间的差异,作为当前功能分布模型的误差,如果误差超过阈值,则可以不断对模型的参数进行纠偏调整,当模型的误差足够小(例如小于阈值)时,可以认为当前的功能分布模型参数为合适的参数。
在步骤304中,基于建筑物功能分布模型的参数计算多个建筑物的功能特征分布。
在确定功能分布模型的参数后,可以确定功能分布模型。该模型可以将配置数据转换为功能特征分布。将已确定价值的建筑物和待评估建筑物的配置数据输入该模型则可以计算出这些建筑物潜在的功能及每一种功能所对应的概率,即可以获得多个建筑物的功能特征分布。
请参考图4,其示出了根据本申请另一个实施例的基于建筑物价值评估的计算方法的示意性的流程图。
如图4所示,在步骤401中,获取多个建筑物的配置数据。
服务器或终端设备可以首先获取多个建筑物的配置数据。其中多个建筑物可以包括待评估建筑物和至少一个已确定价值的建筑物。建筑物的配置数据可以通过如下方式获取:搜集网络上的建筑物数据、从包含建筑物配置数据的广告中提取以及获取人工调查并标记的建筑物数据。
在一些实现中,建筑物的配置数据至少可以包括:结构数据、环境数据以及地理位置数据。其中结构数据可以包括:面积、高度、布局、装修等数据。环境数据可以表征影响建筑物价值的周边环境数据,可以包括周边自然环境、交通状况、医疗设施、生活服务设施等数据。 地理位置数据可以包括建筑物的实际地理位置数据和相对地理位置数据。
在步骤402中,对配置数据进行泛化处理。
建筑物的配置数据中可以包括一些非量化的数据,例如装修状况、自然环境、地理位置等数据。这些数据通常不具有具体的数值表示。在本实施例中,可以对这些数据进行泛化处理。在一些实现中,可以对将连续的配置数据离散化,对离散化后的配置数据进行编码,得到配置数据的数值表示。例如可以将配置数据量化,得到由离散数据表示的配置数据,然后可以将离散数据编码为0、1特征,使一个具有T个取值(T为正整数)的离散数据转化为T个取值为0或1的特征。在另一些实现中,可以将配置数据转换为向量特征表示。例如可以将自然环境数据转换为包含水质等级、空气质量等级、噪音等级、绿化面积等级的一维向量。其中水质等级、空气质量等级、噪音等级、绿化面积等级可以由环保部门提供的数据得出,也可以由用户根据具体水质数据、空气质量数据、噪音数据、绿化面积数据进行等级评定来确定。
建筑物通常包含多种不同类型的配置数据,在一些实施例中,可以对所有配置数据都进行泛化处理,将所有的配置数据转换为同一种数据形式表示,例如向量、矩阵或者比例数值,以便在基于转换后的配置数据建模时基于同一种数据形式对模型进行训练,使各配置数据对建筑物功能分布的影响更加明确,训练得到的功能特征分布模型具有更好的可解释性。
在步骤403中,基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布。
在本实施例中,可以采用机器学习方法对建筑物的配置数据进行建模分析,得出建筑物的功能分布模型。在机器学习过程中,可以依次或同时计算建筑物可能具有的多个功能的概率,得到每个建筑物的功能特征分布。
在步骤404中,基于配置数据的时间特性和/或统计特性对已确定价值的建筑物进行过滤。
在本实施例中,为了降低相似度计算的复杂度,可以增加时间限制,过滤配置数据陈旧的建筑物。具体地,可以将获取的配置数据中与待评估建筑物的建成时间或评估时间相距较远的数据剔除。例如可以将配置数据中数据计算时间与待评估建筑物建成时间相距超过10年的数据所对应的建筑物或建成时间与待评估建筑物建成时间相距超过20年的建筑物过滤掉。还可以基于配置数据的统计特性,采用例如k-d树(即k维树,k为正整数)等数据结构对配置数据进行过滤,从而对相应的建筑物进行过滤。
在步骤405中,根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度。
在基于步骤403中的模型计算出已确定价值的建筑物的功能特征分布和待评估建筑物的功能特征分布之后,可以根据功能特征分布计算多个已确定价值的建筑物与待评估建筑物的相似度。功能特征分布可以表示为向量,向量中每个元素可以表示一种功能及该功能所对应的概率。可以利用相似度计算公式计算已确定价值的建筑物与待评估建筑物的功能或功能分布的相似度,作为已确定价值的建筑物与待评估建筑物的相似度。可选的相似度计算方法可以包括余弦相似度计算、皮尔森相关系数计算等。
在本实施例中,对每一个已确定价值的建筑物,按照上述方式计算其与待评估建筑物的相似度,则可以获得每个已确定价值的建筑物与待评估建筑物的相似度。
在步骤406中,确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合。
在获得多个已确定价值的建筑物与待评估建筑物的相似度之后,可以从所有已确定价值的建筑物中选取至少一个与待评估建筑物相似度最大的建筑物,构成相似建筑物集合。
在步骤407中,基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。
在本实施例中,确定相似建筑物集合之后,可以根据该集合中建筑物的价值来估算待评估建筑物的价值。相似建筑物集合中可以包含 多个与待评估建筑物功能相似的建筑物。在一些实现中,为使待评估建筑物的价值评估准确性更高,可以对多个与待评估建筑物功能相似的建筑物的价值做平均,将相似建筑物的价值的平均作为待评估建筑物的价值评估结果。
在另一些实现中,还可以基于时间关联性和相似度对相似建筑物集合中所有建筑物的价值进行加权求和,以确定待评估建筑物的价值。
上述步骤401、403、405、406和407分别与前述实施例中的步骤201、202、203、204和205相同,上述针对图2中各步骤的描述也适用于本实施例中的对应步骤,此处不再赘述。从图4中可以看出,与图2所述实施例不同的是,本实施例所提供的方法增加了泛化处理的步骤402和过滤步骤404。通过增加的步骤402可以将配置数据转化为数值特征,以便于进行功能分布模型的计算和估计。通过增加的步骤404可以进一步提升相似度计算的精确性,进而更准确地确定相似建筑物,并基于相似建筑物的价值估算待评估建筑物的价值。
请参考图5,其示出了根据本申请一个实施例的基于建筑物价值评估的计算装置500的示意性结构图。如图5所示,基于建筑物价值评估的计算装置500可以包括获取单元501、建模单元502、计算单元503、确定单元504以及评估单元505。获取单元501可以用于获取多个建筑物的配置数据,其中多个建筑物包括待评估建筑物以及至少一个已确定价值的建筑物。建模单元502可以用于基于获取单元501获取的多个建筑物的配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布。计算单元503可以用于根据建模单元502所得出的功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度。确定单元504可以用于基于计算单元503的相似度计算结果确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合。评估单元505可以用于基于确定单元确定的相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。
在一些实现中,计算单元503可以包括:功能相似度分布确定单元和相似度计算单元。其中功能相似度分布确定单元可以用于计算已 确定价值的建筑物与待评估建筑物的功能特征分布中每一个功能所对应的概率间的相似度,得到已确定价值的建筑物与待评估建筑物的功能相似度分布。相似度计算单元可以用于基于功能相似度分布确定单元得到的功能相似度分布确定已确定价值的建筑物与待评估建筑物的相似度。
在一些实施例中,上述基于建筑物价值评估的计算装置500还可以包括预处理单元506和过滤单元507。其中预处理单元506可以用于对配置数据进行泛化处理。例如将连续的配置数据离散化,对离散化后的配置数据进行编码,得到配置数据的数值表示;或者将配置数据转换为向量特征表示。过滤单元507可以基于配置数据的时间特性和/或统计特性对已确定价值的建筑物进行过滤。
装置500中记载的诸单元与参考图1和图4描述的方法中的各个步骤相对应。由此,上文针对基于建筑物价值评估的计算方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。装置500中的相应单元可以与终端设备和/或服务器中的单元相互配合以实现本申请实施例的方案。
本申请上述实施例提供的基于建筑物价值评估的计算装置,通过建模单元将配置数据准换为功能特征分布,在对建筑物价值进行评估时可以有效地利用建筑物的不同配置属性特征,并且可以通过整合具有关联性的配置属性特征,获得更高的准确性和更好的可解释性。
图6示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的 输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端设备中的计算机可读存储介质。该计算机可读存储介质存储有一个或者一个以上程序,该程序可以包含用于执行流程图所示的方法的程序代码。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

基于建筑物价值评估的计算方法和装置.pdf_第1页
第1页 / 共18页
基于建筑物价值评估的计算方法和装置.pdf_第2页
第2页 / 共18页
基于建筑物价值评估的计算方法和装置.pdf_第3页
第3页 / 共18页
点击查看更多>>
资源描述

《基于建筑物价值评估的计算方法和装置.pdf》由会员分享,可在线阅读,更多相关《基于建筑物价值评估的计算方法和装置.pdf(18页珍藏版)》请在专利查询网上搜索。

本申请公开了一种基于建筑物价值评估的计算方法和装置。所述方法的一具体实施方式包括:获取多个建筑物的配置数据;基于配置数据,采用机器学习方法对多个建筑物建立功能分布模型,得到多个建筑物的功能特征分布;根据功能特征分布计算已确定价值的建筑物与待评估建筑物的相似度;确定至少一个与待评估建筑物相似度最大的已确定价值的建筑物,构成相似建筑物集合;以及基于相似建筑物集合中所有建筑物的价值确定待评估建筑物的价值。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1