《一种基于运营商网络数据的常住人口分析方法.pdf》由会员分享,可在线阅读,更多相关《一种基于运营商网络数据的常住人口分析方法.pdf(6页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104217087A43申请公布日20141217CN104217087A21申请号201310204412222申请日20130529G06F19/0020110171申请人上海载德信息科技有限公司地址201104上海市闵行区集心路168号5号楼202室72发明人高向友段仕勇樊伟健陆洋麟54发明名称一种基于运营商网络数据的常住人口分析方法57摘要本发明涉及一种基于运营商网络数据的常住人口分析方法,它在采集的运营商网络数据的基础上应用蚁群算法的主要思想,对一定区域内的用户人群的网络数据进行统计,根据其出现的位置,时间指标进行分类,通过给定的函数变换对上述因素统计分析所得到的结。
2、果进行运算,将其作为人口分类的一个评判依据,从而对人群的特征值常住人口进行迭代修正,并返回新的评判结果。本发明克服了原有统计分类方法回归差、收敛慢,以及对于异常数据异常敏感,容易造成误判与漏判的缺点;具有要求的样本数据少,初始值要求不精确,可以随时根据数据进行修正的特点;使区域内的常住人口划分更加真实的反应了现状。51INTCL权利要求书1页说明书3页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书3页附图1页10申请公布号CN104217087ACN104217087A1/1页21一种基于运营商网络数据的常住人口分析方法,其特征在于包括以下步骤步骤A从人口普查信息。
3、、派出所掌握的社区人口信息处获取划定区域内的初始数据;步骤B从运营商处获取历史数据和实时数据,数据的内容包括采集号码、采集时间、采集地点;步骤C根据用户数据出现的位置、时间进行分类,并通过给定的函数变换,对运营商数据和初始数据进行反复迭代匹配分析,从而将原始数据分为两大类,一类是可以初步确定的,另一类是异动的数据,即由于原始数据缺失造成的新补充数据;步骤D针对函数变换分析,引入活动规律模型,将这些模型动态的添加到知识网络中,模型包括上下班高峰时段规则模型、夜晚时段规则模型、节假日规则模型和气候条件规则模型;步骤E根据不断丰富的知识网络,再根据运营商实时采集的数据,作出修正,通过蚁群算法的信息熵。
4、概念将用户进行进一步的分类。权利要求书CN104217087A1/3页3一种基于运营商网络数据的常住人口分析方法技术领域0001本发明属于数据挖掘分析技术领域,具体涉及一种基于运营商网络数据的常住人口分析方法,它可以精确的判断出某一区域内的人口分类,即哪些是常住人口,为相关部门掌握及时、精确、有效的数据。背景技术0002目前特定区域内人口情况复杂,人口流动复杂,国家相关部门往往只掌握静态信息,这些信息往往滞后,更新不及时,不能为相关决策提供很好的技术支撑。传统的常住人口分析方法往往采用比较简单的模型,从直观的概念出发,比如认为常住人口通常都是在晚上呈现特定地点固定的数据,而白天的活动规律就比较。
5、复杂,舍弃这个情况进行分析。随着城市生活的多样化,这个活动规律并不能十分精确的反应现状。此外,传统的统计方法要获得的样本足够大和足够多,回归差、收敛慢,而且对于异常数据异常敏感,容易造成误判,漏判。0003蚁群算法是一种用来在图中寻找优化路径的机率型算法。该算法基于正反馈原理,具有强鲁棒性、收敛性好、并行性和自适应性等优点,初被用于解决大多数优化问题或者能够转化为优化求解的问题。随着蚁群算法不断发展和完善,目前其应用领域已扩展到多目标优化、数据分类、数据聚类、模式识别、系统建模、流程规划、信号处理、图像处理、决策支持以及仿真和系统辩识等方面。蚁群算法以其诸多优点非常适合用于用户群体行为特征的分。
6、类。此外,运营商掌握的大量用户数据,可以作为实时分析人口分类的另一种数据来源。发明内容0004有鉴于此,本发明的目的在于针对现有技术中的不足,采用蚁群算法,结合运营商海量数据,提供一种基于运营商网络数据的常住人口分析方法,推算人群分类。0005为完成上述目的,本发明采用的技术方案是在采集的运营商网络数据的基础上应用蚁群算法的主要思想,对一定区域内的用户人群的网络数据进行统计,根据其出现的位置、时间指标进行分类,通过给定的函数变换对上述因素统计分析所得到的结果进行运算,将其作为人口分类的一个评判依据,从而对人群的特征值常住人口进行迭代修正,并返回新的评判结果。具体来说,本发明提供了一种基于运营商。
7、网络数据的常住人口分析方法,包括以下步骤0006步骤A从人口普查信息、派出所掌握的社区人口信息处获取划定区域内的初始数据;0007步骤B从运营商处获取历史数据和实时数据,数据的内容包括采集号码、采集时间、采集地点;0008步骤C根据用户数据出现的位置、时间进行分类,并通过给定的函数变换,对运营商数据和初始数据进行反复迭代匹配分析,从而将原始数据分为两大类,一类是可以初说明书CN104217087A2/3页4步确定的,另一类是异动的数据,即由于原始数据缺失造成的新补充数据;0009步骤D针对函数变换分析,引入活动规律模型,将这些模型动态的添加到知识网络中,模型包括上下班高峰时段规则模型、夜晚时段。
8、规则模型、节假日规则模型和气候条件规则模型;0010步骤E根据不断丰富的知识网络,再根据运营商实时采集的数据,作出修正,通过蚁群算法的信息熵概念将用户进行进一步的分类。0011本发明的有益效果在于1克服了原有统计分类方法回归差、收敛慢,以及对于异常数据异常敏感,容易造成误判与漏判的缺点;2具有要求的样本数据少,初始值要求不精确,可以随时根据数据进行修正的特点,同时也可以很好的引入外部因素,比如人口普查信息等外部数据录入,对不同的因素可以动态调整相应的加权值。附图说明0012下面结合附图对本发明进一步说明。0013图1为本发明基于运营商网络数据的常住人口分析方法的原理示意图。具体实施方式0014。
9、如图1所示为本发明提供的基于运营商网络数据的常住人口分析方法的原理示意图,其分析方法,包括以下步骤0015步骤A从人口普查信息、派出所掌握的社区人口信息处获取划定区域内的初始数据;0016步骤B从运营商处获取历史数据和实时数据,数据的内容包括采集号码、采集时间、采集地点;数据采集的粒度一般为2小时,当数据越多,评判依据越精确;0017步骤C根据用户数据出现的位置、时间进行分类,并通过给定的函数变换,对运营商数据和初始数据进行反复迭代匹配分析,从而将原始数据分为两大类,一类是可以初步确定的,另一类是异动的数据,即由于原始数据缺失造成的新补充数据;0018步骤D针对函数变换分析,引入活动规律模型,。
10、将这些模型动态的添加到知识网络中,模型包括上下班高峰时段规则模型、夜晚时段规则模型、节假日规则模型和气候条件规则模型;0019上下班高峰时段规则模型在这个时段,运营商采集数据频率加大,一般认为上下班之外的白天时间,常住人口大多数是不在本区域内活动的。0020夜晚时段规则模型传统上,晚上是判别比较简单的,因为人的活动作息规律表明,晚上都是休息时间,采集的数据可以很好的符合这个特征。0021节假日规则模型这个活动规律是根据往年的经验,在节假日期间,常住人口例行的出行计划。0022气候条件规则模型当恶劣气候发生的时候也影响人们的活动规律,比如大雨天人们倾向于不在街上活动。0023步骤E根据不断丰富的。
11、知识网络,再根据运营商实时采集的数据,作出修正,通过蚁群算法的信息熵概念将用户进行进一步的分类。0024在上述步骤中,函数变换的初值是根据外部数据为依据,这些因素占用的比重是说明书CN104217087A3/3页5根据后期的数据不断进行修正的。函数变换的模型也是动态调整的,是将原有外部数据不断进行剔除,提炼的一个过程。0025本发明考虑了数据分析过程中不良数据的鉴别和分析;考虑了几种常见的影响人群活动规律的因素,比如白天作息,休息日,节假日,极端天气;在时间上考虑了某段时间内数据缺失,系统可以自动按照知识网络进行自动补全,并根据后续的结果实时修正这个知识网络。通过实验表明,此方法使区域内的常住人口划分更加真实的反应了现状,在实时性上也得到了很好的保证。0026以上具体实施方式仅用于说明本发明,而非用于限定本发明,本领域技术人员对上述实施例进行的等同变形、替换都在权利要求保护范围之内。说明书CN104217087A1/1页6图1说明书附图CN104217087A。