一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的地块价格数据生成方法与装置与流程

2022-03-16 13:52:26 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,特别是涉及一种基于人工智能的地块价格数据生成方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.随着计算机技术的发展,出现了人工智能技术,通过人工智能技术可以通过分析历史数据来对后续事件与数据做出分析与预测,以给人们做出决策提供数据支持。
3.以人工智能技术应用于地块价格数据生成场景为例,地块定价一直是房地产领域的核心问题,地块定价是指对政府挂出的地块确定其市场价格,现有市场上的地块定价是相关领域专家负责,缺点是人力成本高、周期长、效率低,并且每一个专家都是根据自己的经验公式进行定价,每个专家的偏好不同、经验公式不同,最终的地块定价也不同,这样造成最终的地块价值误差较大,并且不同的专家考虑的偏好不同,会影响最终的决策。不同专家根据其积累的部分经验提炼成了地块定价的公式,每个人积累的经验是有局限性的,并不能更加全面、细致的考虑到所有的场景,所以如果遇到了新的场景,则准确性会大幅度降低。
4.针对上述情况目前已有技术提出采用机器学习模型来实现地块定价数据生成,然而目前的机器学习模型存在准确率不高的缺陷,因此导致最终生成地块价格数据不准确。


技术实现要素:

5.基于此,有必要针对传统基于机器学习模型生成的地块价格数据不准确的问题,提供一种准确的基于人工智能的地块价格数据生成方法、装置、计算机设备、存储介质和计算机程序产品。
6.第一方面,本技术提供了一种基于人工智能的地块价格数据生成方法。所述方法包括:
7.获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
8.根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选地块、并获取所述候选地块对应的相似度系数;
9.将所述目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取所述候选地块的价格调整系数,所述预设已训练机器学习模型用于求解所述目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
10.获取候选地块价格数据,根据所述候选地块价格数据、所述价格调整系数以及所述相似度系数,加权得到目标地块的价格数据。
11.在其中一个实施例中,所述根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选
地块、并获取所述候选地块对应的相似度系数包括:
12.对所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据采取相似度评估方法,获取目标地块与历史已定价地块之间相似度系数;
13.筛选相似度系数大于预设相似度阈值的历史已定价地块,得到候选地块,并记录所述候选地块对应的相似度系数。
14.在其中一个实施例中,所述预设已训练机器学习模型用于采用最小二乘法模型,对所述目标地块价格影响因子数据以及所述候选地块价格影响因子数据进行拟合学习,求解得到所述候选地块的价格调整系数。
15.在其中一个实施例中,所述预设已训练机器学习模型还用于将目标地块价格影响因子数据以及所述候选地块价格影响因子数据导入至最小二乘法模型;采用混合人工蜂群算法与改进粒子群算法求解所述最小二乘法模型,得到所述候选地块的价格调整系数。
16.在其中一个实施例中,所述改进粒子群算法的求解过程包括以下步骤:
17.初始化粒子群;
18.获取所述初始化粒子群中各粒子的适应度;
19.根据所述各粒子的适应度更新出现全局最优的粒子位置以及粒子序号;
20.根据所述出现全局最优的粒子位置以及粒子序号,更新粒子群速度和位置,返回所述获取所述初始化粒子群中各粒子的适应度的步骤,并记录返回次数;
21.当所述返回次数达到预设次数阈值时,停止返回,获取最新的粒子群速度和位置。
22.在其中一个实施例中,采用混合人工蜂群算法与改进粒子群算法求解包括:
23.利用改进的粒子群算法搜索初始最优解,得到初始食物源;
24.引领蜂带领跟随蜂到所述初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源;
25.对所述新食物源和所述初始食物源的适应度值进行贪婪选择,获取较优食物源;
26.将所述较优食物源重新作为所述初始食物源,返回所述引领蜂带领跟随蜂到所述初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源的步骤,记录迭代返回次数;
27.当迭代返回次数达到预设迭代返回次数阈值时,记录最新的食物源,得到所述最小二乘法模型的最优解。
28.第二方面,本技术还提供了一种基于人工智能的地块价格数据生成装置。
29.所述装置包括:
30.参数获取模块,用于获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
31.筛选模块,用于根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选地块、并获取所述候选地块对应的相似度系数;
32.价格调整模块,用于将所述目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取所述候选地块的价格调整系数,所述预设已训练机器学习模型用于求解所述目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
33.加权计算模块,用于获取候选地块价格数据,根据所述候选地块价格数据、所述价格调整系数以及所述相似度系数,加权得到目标地块的价格数据。
34.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
35.获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
36.根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选地块、并获取所述候选地块对应的相似度系数;
37.将所述目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取所述候选地块的价格调整系数,所述预设已训练机器学习模型用于求解所述目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
38.获取候选地块价格数据,根据所述候选地块价格数据、所述价格调整系数以及所述相似度系数,加权得到目标地块的价格数据。
39.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
40.获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
41.根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选地块、并获取所述候选地块对应的相似度系数;
42.将所述目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取所述候选地块的价格调整系数,所述预设已训练机器学习模型用于求解所述目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
43.获取候选地块价格数据,根据所述候选地块价格数据、所述价格调整系数以及所述相似度系数,加权得到目标地块的价格数据。
44.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
45.获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
46.根据所述目标地块价格影响因子数据以及所述历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与所述目标地块相似的候选地块、并获取所述候选地块对应的相似度系数;
47.将所述目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取所述候选地块的价格调整系数,所述预设已训练机器学习模型用于求解所述目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
48.获取候选地块价格数据,根据所述候选地块价格数据、所述价格调整系数以及所述相似度系数,加权得到目标地块的价格数据。
49.上述基于人工智能的地块价格数据生成方法、装置、计算机设备、存储介质和计算
机程序产品,通过相似度对比分析方式从历史已定价地块中查找出与目标地块相似的候选地块,进一步的,采用已训练机器学习模型求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解,以减小候选地块和目标地块之间价格因子差异对最终地块价格的影响;最后采取基于相似度系数加权计算方式,加权得到目标地块的价格数据,充分考虑不同候选地块价格对目标地块价格的影响。整个过程中,通过相似度筛选、价格调整系数最优求解以及基于相似度系数的加权计算三个方面来生成目标地块价格数据,可以得到准确的目标地块价格数据。
附图说明
50.图1为一个实施例中基于人工智能的地块价格数据生成方法的应用环境图;
51.图2为一个实施例中基于人工智能的地块价格数据生成方法的流程示意图;
52.图3为改进粒子群算法的处理流程示意图;
53.图4为混合人工蜂群算法与改进粒子群算法的处理流程示意图;
54.图5为一个实施例中基于人工智能的地块价格数据生成装置的结构框图;
55.图6为一个实施例中计算机设备的内部结构图。
具体实施方式
56.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
57.本技术实施例提供的基于人工智能的地块价格数据生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102响应用户操作,生成地块价格数据生成请求,在该地块价格数据生成请求中携带有所需分析的目标地块相关数据,终端102将地块价格数据生成请求上传至服务器104,服务器104从地块价格数据生成请求中获取目标地块价格影响因子数据、并存缓存数据库中获取历史已定价地块价格影响因子数据;根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数;将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。进一步的,服务器104还可以将生成的目标地块的价格数据反馈中终端102,以使用户了解到目标地块的合理报价。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
58.在一个实施例中,如图2所示,提供了一种基于人工智能的地块价格数据生成方
法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
59.s200:获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据。
60.目标地块是指本次需要评估、生成地块价格数据的地块。例如用户需要对标号为n的地块进行价格评估,则地块n即为目标地块。价格影响因子数据是指影响地块价格的因子参数,可以理解的是,影响地块价格包括很多维度、很多方面的数据,这些不同维度的数据即构成不同的价格影响因子数据。具体来说,可以基于预设地块价格评价体系,将这些多维度的数据进行体系化,得到价格影响因子,分析在每个因子下对应的数据,即得到价格影响因子数据。预设地块价格评价体系可以是基于专家经验数据生成的评价体系。具体来说,影响因子包括距离、区域、板块、城市、业态、开发商品牌、销售时间、供应时间等。简单来说,可以将地块价格影响因子理解地块价格的特征向量。
61.s400:根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数。
62.历史已定价地块是指在历史记录已经完成价格定价的地块,通过分析历史已定价地块的价格数据,采取自学习方式可以得到目标地块的价格数据。一般来说,历史已定价地块包含一个数量庞大的地块集合,为了减小后续机器学习求解的数据处理量,在这里首先从历史已定价地块中筛选出与目标地块相似的候选地块,即选择出与目标地块比较相似的已定价地块作为后续机器学习的样本。进一步的,在进行相似筛选过程中,可以通过机器学习中的相似度评价模型,获取历史已定价地块与目标地块之间的相似度系数,筛选相似度系数大于预设相似度阈值对应的已定价地块作为候选地块。
63.s600:将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解。
64.完美的候选地块就是价格影响因子数据与目标地块完全一致,这样的候选地块对应的价格数据是最准的。而现实情况中,候选地块的价格影响因子数据会与目标地块会有不同,所以需要对候选地块价格进行调整,扣除掉价格影响因子数据不同的原因造成的价格不同,调整后的候选地块价格才具有参考性。基于实际经验可知影响地价的因子有多种,可以通过归集、提炼以及融合历史经验(专家经验)具体可以包括交通因子、教育因子、商业配套因子、医疗资源因子、旅游资源因子等,针对每个因子通过机器学习模型自动学习最接近实际、高精度最高的价格调整系数。
65.预设已训练机器学习模型是预先已经训练的机器学习模型,其具备自学习功能。在这里,通过预设已训练机器学习模型来求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解,即通过预设已训练机器学习模型来求解价格调整系数的最优解。非必要的,这个求解过程可以是由预设已训练机器学习模型采用机器学习中的最小二乘法来求解得到。具体的,可以采用机器学习中的最小二乘法对候选地块价格影响因子数据进行拟合学习,区分不同价格影响因子对应的价格调整系数,具体可以区分出不同城市、地区、板块等价格影响因子对应的价格调整系数,将目标地块和候选地块之间差异的价格影响因子数据转换成价格调整系数,进而得到不同候选地块对应调整的后的价格数据。
66.s800:获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。
67.如上已述的,在s600得到了价格调整系数,基于该价格调整系数可以减小不同候选地块与目标地块不同价格影响因子对地块价格数据的影响。另外,基于相似度系数来进行加权得到目标地块的价格数据,相似度越高的候选地块,其最终决定目标地块的价格数据权重越大,通过加权计算的方式可以准确得到目标地块的价格数据。
68.具体来说,加权求和具体公式如下:
[0069][0070]
其中,wi是第i个候选地块与目标地块对应的相似度(s400中得到),为第i个候选地块经过价格调整系数调整后的价格,m是候选地块数目。候选地块加权求和,可以减少个别候选地块价格异常造成的干扰,使得结果更加稳定、可靠。具体来说,候选地块的权重与其对应的相似度正相关,相似度越高,其对应的权重值越高。所有候选地块的权重可以为一个固定的整数,例如可以直接为1,基于每个候选地块与目标地块的相似度,正相关方式分配其对应的权重,具体可以是线性正相关的方式来分配这些候选地块的权重。
[0071]
上述基于人工智能的地块价格数据生成方法,通过相似度对比分析方式从历史已定价地块中查找出与目标地块相似的候选地块,进一步的,采用已训练机器学习模型求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解,以减小候选地块和目标地块之间价格因子差异对最终地块价格的影响;最后采取基于相似度系数加权计算方式,加权得到目标地块的价格数据,充分考虑不同候选地块价格对目标地块价格的影响。整个过程中,通过相似度筛选、价格调整系数最优求解以及基于相似度系数的加权计算三个维度来生成目标地块价格数据,可以得到准确的目标地块价格数据。
[0072]
在其中一个实施例中,根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数包括:
[0073]
对目标地块价格影响因子数据以及历史已定价地块价格影响因子数据采取相似度评估方法,获取目标地块与历史已定价地块之间相似度系数;筛选相似度系数大于预设相似度阈值的历史已定价地块,得到候选地块,并记录候选地块对应的相似度系数。
[0074]
预设相似度阈值是预先设定的阈值,其可以根据实际情况的需要预先设定,例如可以设定为60%、65%、70%等。在本实施例中,采用相似度评估法获取目标地块与历史已定价地块之前相似度系数,筛选相似度较大的历史已定价地块,得到候选地块,可以显著减少后续机器学习求解过程中数据处理量,也能过滤掉一些异常、杂乱的数据,可以提高后续生成价格数据的准确性。具体来说,相似度评估方法可以为余弦相似度法。
[0075]
具体可以采用机器学习中相似度评估法获取目标地块与历史已定价地块之前相似度系数。其具体评估的公式如下:
[0076][0077]
式中,simi表示第i个候选地块与目标地块的相似度得分,bj表示目标地块的第j个参考因子取值,x
i,j
表示第i个因子第j个参考因子取值。
[0078]
在其中一个实施例中,预设已训练机器学习模型用于采用最小二乘法模型,对目标地块价格影响因子数据以及候选地块价格影响因子数据进行拟合学习,求解得到候选地块的价格调整系数。
[0079]
最小二乘法模型如下所示:
[0080][0081][0082]
其中。自变量是xl,表示编号为l的因子对应的价格调整系数,k为历史地块样本编号,n为总的历史样本地块数目,p为目标地块对应的候选地块编号,sk为样本k对应的候选地块总数,l为价格调整因子的编号,nf为价格调整因子的总数目,pj
k,p
表示编号k个地块对应的编号p候选的实际价格,pk为编号k的样本地块实际价格,f
l,q
()表示编号l编号的因子对应的第q个价格调整函数,调整函数可以是非线性复杂的函数。并且此函数针对于不同的区域会有不同的函数形式,所以也需要对使用的函数形式进行优化,为每一个板块区域自动化自适应选择一个合适价格调整函数,能够让模型拟合更加精准,假设第l个价格调整因子对应的价格调整函数集合为fset
l
,fq
l
表示这个集合的数目,

t
p,l,k
表示第k 个样本对应的第p个候选地块在因子l维度的的取值与目标地块的差量,价格调整就会根据这个调整因子差量进行调整的,但是这个差量需要经过调整函数映射后才能直接用以价格调整。约束条件表示在选择第l个价格调整因子对应的调整函数时,只能选择唯一一个调整函数。可以看到,自变量为x
l
与xf
l,q
,其中x
l
为连续变量,xf
l,q
为离散0-1变量,将x
l
与xf
l,q
。按照顺序排列成一个向量记作x。整个目标函数是为了降低候选通过价格调整后与目标地块的价格差,并且对所有样本都进行训练,要求整体最优。
[0083]
在其中一个实施例中,预设已训练机器学习模型还用于将目标地块价格影响因子数据以及候选地块价格影响因子数据导入至最小二乘法模型;采用混合人工蜂群算法与改进粒子群算法求解最小二乘法模型,得到候选地块的价格调整系数。
[0084]
进一步研究发现,在上述求解场景中,虽然可以通过求解最小二乘法模型得到的最优解,但是上述最小二乘法是非线性的,为进一步提升求解到最优解的准确度,在这里采
用混合人工蜂群算法与改进粒子群算法来求解最小二乘法模型,以得到更加准确的最优解,即得到更加准确的候选地块的价格调整系数。具体来说,人工蜂群算法、粒子群算法是两个不同迭代寻求最优解的算法,这2 种算法有各自的优点,一般常用于迭代搜索最优解的场景中。为了充分发挥这2 种算法的优势,在这里对粒子群算法进行改进,并且与人工蜂群算法进行混合,以高效且准确得出最优解。
[0085]
为详细说明粒子群算法和人工蜂群算法技术原理以及优点,下面详细展开描述这2种最优解求解算法。
[0086]
原始粒子群算法的实施过程为:首先根据均匀分布,初始化一定数量的粒子,并且对各个粒子初始化一个速度向量,假设寻优的空间为n,令xi=(x
i1
,x
i2

,x
in
) 表示第i个个体在研究区域中所处的位置,vi=(v
i1
,v
i2

,v
in
)表示第i个个体的速度。在算法进行迭代的过程中,每一个粒参需要考其他两个位置进行位置变化迭代,即为迭代规则,设nbesti=(nbest
i1
,nbest
i2

,nbest
in
)表示在上一次迭代中出现的全局最优的粒子的位置;设pbesti=(pbest
i1
,pbest
i2

,pbest
in
)表示第i个粒子周围一定范围内的最优解,该向量表示的是位置。第i个粒子是根据以下规则(式 1-1,1-2)确定自身下一步的行动,即确定下一步运动的方向和运动的位移:
[0087]vi
=vi c1·
rand()
·
(nbest
i-xi) c2·
rand()
·
(pbest
i-xi)
ꢀꢀꢀ
(1-1)
[0088]
xi=xi viꢀꢀꢀ
(1-2)
[0089]
其中c1是针对全局最优粒子速度矢量添加的加速常量,c2是针对第i个粒子周围一定范围内的最优粒子的速度矢量添加的加速常量,这两个常量要适度选取,不能偏大,因为这样可能会直接跳过最终的搜寻目标或者突然收敛到某一局部最优区域,也不能偏小,这样可能会导致收敛速度过慢,降低该算法的效率;rand()是针对全局最优和局部最优添加的随机波动,其取值范围为0到1。在迭代的过程中,为了保证每个粒子对全局进行地毯式的搜素,需要给粒子设置一个速度上限,该上限记为v
max
,在具体应用中,v
max
取值越小,粒子的搜索越精细,相当于每次挪动一小步,不会一下子飞到很远的地方去,这样会提高局部搜索能力,但正因为局部搜索很精细,会在一定程度上影响收敛速度,尤其是在处理大型的非线性优化问题的时候,粒子群算法效率很低。既然要进行多次迭代,就要对迭代设置一个终止条件。迭代终止条件可以从两个方面进行设置:一个可以设置最大的迭代次数,迭代到多少次即停止迭代,或者是设置最小误差,当误差落在什么范围之内即停止迭代,然后将得到的最优解输出,即为所求。
[0090]
在其中一个实施例中,改进粒子群算法的求解过程包括以下步骤:
[0091]
初始化粒子群;获取初始化粒子群中各粒子的适应度;根据各粒子的适应度更新出现全局最优的粒子位置以及粒子序号;根据出现全局最优的粒子位置以及粒子序号,更新粒子群速度和位置,返回获取初始化粒子群中各粒子的适应度的步骤,并记录返回次数;当返回次数达到预设次数阈值时,停止返回,获取最新的粒子群速度和位置。
[0092]
在本实施例中,针对传统粒子群算法进行改进,根据粒子的适应度来更新出现全局最优的粒子位置,以寻找到最优的粒子位置,即寻求到最优解。具体来说,针对全局最优的粒子位置更新为:若某个粒子的适应度优于上一步迭代得到的最优的粒子所对应的适应度,则用该粒子的pbesti(第i个粒子周围一定范围内的最优解)取代nbesti(上一次迭代中出现的全局最优的粒子的位置),并将该粒子的序号赋给最优粒子。
[0093]
为详细说明上述改进粒子群算法的求解过程,下面将采用步骤的形式,并且结合图3详细说明。具体对原始的粒子群算法进行改进,改进后的算法如下:
[0094]
step1:初始化种群,根据公式(1-3)随机产生m个初始粒子x'0,计算其适应度值,选出若干优秀粒子,并且所有粒子初始化进步程度为0,速度为0,搜索总次数为0。
[0095][0096]
其中,j表示自变量向量x的下标,x
j,min
的表示第j个下标的自变量的取值下限,x
j,max
的表示第j个下标的自变量的取值上限,rand()表示01均匀分布的随机变量,round()表示取整操作,因为针对于0-1取值的变量要保证其取值为0 或者1.
[0097]
step2:对于每个粒子,根据其历史存储的速度值来判断其是否该被剔除,对于历史连续速度绝对值小于阈值的粒子进行删除,删除没有寻优潜力的粒子。
[0098]
step3:计算剩下粒子的适应度值。
[0099]
step4:对剩下的粒子随机生成每个粒子所对应的领域,选择出其对应的领域粒。
[0100]
step5:根据粒子所在领域及适应度值计算局部最优解p
best
与全局适应度值排名靠前的粒子。
[0101]
step6:根据轮盘赌原则,在排名靠前的粒子中为每一个粒子选择所对应的 n
best
,其中适应度值越优秀的粒子被选中的可能性越大。
[0102]
step7:对剩下的粒子根据公式(1-4)更新粒子的速度,并储存起来。
[0103]vi 1
=vi c1·
rand()
·
(nbest
i-xi) c2·
rand()
·
(pbest
i-xi)
ꢀꢀꢀ
(1-4)
[0104]
step8:对剩下的粒子根据公式(1-5)、(1-6)、(1-7)更新粒子的位置。
[0105]
因为有部分自变量是0-1变量,对其进行位置更新时,需要进行特殊处理,处理方式如下:
[0106]
1)当x
i,j
为连续变量时,i表示第i次的迭代,j表示自变量向量x下标,更新如下:
[0107]
x
i,j
=x
i,j
v
i,j

ꢀꢀꢀ
(1-5)
[0108]
2)当x
i,j
为0-1变量时,更新如下:
[0109][0110]
其中,
[0111]
3)另外,对于0-1类型的变量,还必须要满足约束所以还要进行如下(1-7)变换:记xf
l,q
在自变量x自的标记为index
l,q
,其中1≤q≤fq
l

[0112][0113]
经过(1-4)变换,可以保证0-1变量满足约束
[0114]
step9:判断是否达到最大迭代次数或达到允许误差的范围,如果是算法终止,否则随机生成一些新的粒子去补充删除的粒子。
[0115]
在其中一个实施例中,采用混合人工蜂群算法与改进粒子群算法求解包括:
[0116]
利用改进的粒子群算法搜索初始最优解,得到初始食物源;引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源;对新食物源和初始食物源的适应度值进行贪婪选择,获取较优食物源;将较优食物源重新作为初始食物源,返回引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源的步骤,记录迭代返回次数;当迭代返回次数达到预设迭代返回次数阈值时,记录最新的食物源,得到最小二乘法模型的最优解。
[0117]
改进后的粒子群算法,前期搜索能力强,可以快速找到很多较优良的个体,虽然后期引入删除机制能够跳出局部最优解,但其搜索能力差。而人工蜂群算法则相反,其前期搜索盲目性强,每次搜索都是独立的,未利用个体之间的紧密关系,不会像粒子群算法参考其他优秀个体进行搜索。在人工蜂群算法中,每次迭代种群数目保持不变,在删除个体的同时要用随机生成的新个体进行替代,但是这些随机生产的个体成为较好的个体的可能性很小,易造成重复运算。另外,蜂群算法在每一个优良个体邻域内的多次随机搜索,也未充分利用个体间的联系。所以,在迭代次数相同时,蜂群算法花费的时间明显多于粒子群算法。在后期搜索过程中,蜂群算法却优于粒子群算法,这是由于蜂群算法在侦查蜂找到食物源之后,引领蜂直接就按概率把跟随蜂带到较优的食物源处进行搜索,不像粒子群算法那样的一步一步向较优解靠近进行搜索,后期蜂群的搜索效率高于粒子群。
[0118]
根据上述分析,在上述实施例中的蜂群与改进粒子群的混合优化算法概括起来就是:算法的前期利用改进的粒子群算法搜索到一些较优良的解,以这些解作为食物源,然后再利用蜂群算法的强有力的局部搜索能力对这些食物源所在的邻域进行局部的搜索。在对食物源领域进行搜索时,跟随蜂不采用蜂群算法中的随机方式进行食物源挖掘,而是在食物源的小领域内,构建子粒子群,采用改进的粒子群算法对食物源进行挖掘,这样就将二者的优点结合起来了。根据粒子群算法优点,将粒子群有序的搜索方式代替蜂群算法中跟随蜂在优秀食物源局部范围内的随机搜索方式,从而提高了运算效率,提高了算法搜索能力。
[0119]
为详细说明上述混合人工蜂群算法与改进粒子群算法的求解过程,下面将采用步骤的形式,并且结合图4详细说明。具体对原始的粒子群算法进行改进,改进后的算法如下:
[0120]
step1:初始化种群,根据公式(1-3)随机生成产生m个初始种群x'i,按照改进的粒子群算法迭代一定次数后搜索出若干优秀解,作为初始食物源。
[0121]
step2:在食物源附近搜索时,引领蜂带领一定数量的跟随蜂到各个食物源附近按照改进粒子群方式搜索新的食物源。搜索完成之后,对新食物源与当前食物源位置的适应度值进行贪婪选择,选取较好的食物源,搜索次数 searchi=searchi n
s-pso
×ns-cycle
,其中searchi表示在探索蜂在第i个食物源周围寻找新食物源的历史总次数,n
s-pso
表示该食物源附近探索蜂的个数,n
s-cycle
表示小粒子群的迭代次数。
[0122]
step3:在食物源附近,根据公式(1-8)确定引领蜂带领的跟随蜂的个数。
[0123]
[0124]
其中,fiti表示第i个食物源的适应度值,n表示食物源的个数,n
t-follow
表示总跟随蜂个数。
[0125]
step4:若searchi》limit,则放弃第i个食物源,并且第i个食物源附近的探索蜂变为侦查蜂。
[0126]
step5:迭代总次数iteration=iteration 1,判断iteration》max_cycle是否成立,若成立则迭代结束,记录保留的最佳食物源,否则返回step2继续循环。
[0127]
为更进一步详细说明本技术基于人工智能的地块价格数据生成方法的技术方案及其效果,下面将以具体实例说明。
[0128]
由于实际的样本数目很大,因子数目很多,为了清晰演示出整体步骤,将因子进行极大的简化,截取出几条样本数据展示出来,如下表1所示。
[0129]
表1为不同地块价格影响因子数据
[0130][0131]
以上述样本数据为例,整个地块价格数据生成包括以下步骤:
[0132]
第一步:候选地块选择
[0133]
1.1、确定候选地选择因子:
[0134][0135]
1.2、首先输入目标地块的经纬度118.705a;32.1453b;注上述经纬度参数中x;y;a;b用于指代不同的数据,以对经纬度数据进行模糊化处理。
[0136]
1.3、计算出目标地块的因子取值,具体如下表2所示。
[0137]
表2为目标地块的因子取值
[0138][0139]
将取值为字符类型的因子,通过one-hot变换,转换成数值型;
[0140]
1.4、之后根据目标地块的因子向量与历史地块的因子向量,求得相似度得分。设定一个相似度阈值,比如:0.7,相似度大于等于0.7的会被筛选出来,作为候选地块。假设选择出来了5个地块作为候选地块,相似度分别为0.9;0.8; 0.75;0.71;0.7。
[0141]
第二步:候选地块价格调整
[0142]
2.1、调整因子选择
[0143][0144]
2.2、调整系数自动学习
[0145]
模拟候选地块筛选的过程,分别将历史的每一个地块样本作为目标地块,筛选出其对应的候选地块,之后将调整系数作为自变量,整体学习调整系数大小。比如:目标地块的交通分数是100,而候选地块的交通分数是150,候选地块的交通分数减去目标地块的交通分数差值50,结合业务经验构建一个差值的映射函数f(),先计算出f(50),之后再乘以系数(这个系数就是通过最小二乘法自动求解出来的),算出所有的因子价格调整值,求出价格调整总和,之后,将候选地块实际价格减去这个调整价格总和就是调整之后的价格。具体如下:
[0146][0147]
第三步:候选地块价格加权求和
[0148]
第一步假设选择出来了5个地块作为候选地块,相似度分别为0.9;0.8;0.75; 0.71;0.7。第二部假设计算的候选地块调整价格为:100;110;105;103;120;则加权求和为:
[0149][0150]
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0151]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的基于人工智能的地块价格数据生成方法的基于人工智能的地块价格数据生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于人工智能的地块价格数据生成装置实施例中的具体限定可以参见上文中对于基于人工智能的地块价格数据生成方法的限定,在此不再赘述。
[0152]
如图5所示,本技术还提供了一种基于人工智能的地块价格数据生成装置。装置包括:
[0153]
参数获取模块200,用于获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
[0154]
筛选模块400,用于根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数;
[0155]
价格调整模块600,用于将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对
价格调整的最优解;
[0156]
加权计算模块800,用于获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。
[0157]
上述基于人工智能的地块价格数据生成装置,通过相似度对比分析方式从历史已定价地块中查找出与目标地块相似的候选地块,进一步的,采用已训练机器学习模型求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解,以减小候选地块和目标地块之间价格因子差异对最终地块价格的影响;最后采取基于相似度系数加权计算方式,加权得到目标地块的价格数据,充分考虑不同候选地块价格对目标地块价格的影响。整个过程中,通过相似度筛选、价格调整系数最优求解以及基于相似度系数的加权计算三个维度来生成目标地块价格数据,可以得到准确的目标地块价格数据。
[0158]
在其中一个实施例中,筛选模块400还用于对目标地块价格影响因子数据以及历史已定价地块价格影响因子数据采取相似度评估方法,获取目标地块与历史已定价地块之间相似度系数;筛选相似度系数大于预设相似度阈值的历史已定价地块,得到候选地块,并记录候选地块对应的相似度系数。
[0159]
在其中一个实施例中,预设已训练机器学习模型用于采用最小二乘法模型,对目标地块价格影响因子数据以及候选地块价格影响因子数据进行拟合学习,求解得到候选地块的价格调整系数。
[0160]
在其中一个实施例中,预设已训练机器学习模型还用于将目标地块价格影响因子数据以及候选地块价格影响因子数据导入至最小二乘法模型;采用混合人工蜂群算法与改进粒子群算法求解最小二乘法模型,得到候选地块的价格调整系数。
[0161]
在其中一个实施例中,价格调整模块600还用于初始化粒子群;获取初始化粒子群中各粒子的适应度;根据各粒子的适应度更新出现全局最优的粒子位置以及粒子序号;根据出现全局最优的粒子位置以及粒子序号,更新粒子群速度和位置,返回获取初始化粒子群中各粒子的适应度的步骤,并记录返回次数;当返回次数达到预设次数阈值时,停止返回,获取最新的粒子群速度和位置。
[0162]
在其中一个实施例中,价格调整模块600还用于利用改进的粒子群算法搜索初始最优解,得到初始食物源;引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源;对新食物源和初始食物源的适应度值进行贪婪选择,获取较优食物源;将较优食物源重新作为初始食物源,返回引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源的步骤,记录迭代返回次数;当迭代返回次数达到预设迭代返回次数阈值时,记录最新的食物源,得到最小二乘法模型的最优解。
[0163]
上述基于人工智能的地块价格数据生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0164]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。
其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储xx 数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的地块价格数据生成方法。
[0165]
本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0166]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
[0167]
获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
[0168]
根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数;
[0169]
将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
[0170]
获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。
[0171]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0172]
对目标地块价格影响因子数据以及历史已定价地块价格影响因子数据采取相似度评估方法,获取目标地块与历史已定价地块之间相似度系数;筛选相似度系数大于预设相似度阈值的历史已定价地块,得到候选地块,并记录候选地块对应的相似度系数。
[0173]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0174]
初始化粒子群;获取初始化粒子群中各粒子的适应度;根据各粒子的适应度更新出现全局最优的粒子位置以及粒子序号;根据出现全局最优的粒子位置以及粒子序号,更新粒子群速度和位置,返回获取初始化粒子群中各粒子的适应度的步骤,并记录返回次数;当返回次数达到预设次数阈值时,停止返回,获取最新的粒子群速度和位置。
[0175]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0176]
利用改进的粒子群算法搜索初始最优解,得到初始食物源;引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源;对新食物源和初始食物源的适应度值进行贪婪选择,获取较优食物源;将较优食物源重新作为初始食物源,返回引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源的步骤,记录迭代返回次数;当迭代返回次数达到预设迭代返回次数阈值时,记录最新的食物源,得到最小二乘法模型的最优解。
[0177]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0178]
获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
[0179]
根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史
已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数;
[0180]
将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
[0181]
获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。
[0182]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0183]
对目标地块价格影响因子数据以及历史已定价地块价格影响因子数据采取相似度评估方法,获取目标地块与历史已定价地块之间相似度系数;筛选相似度系数大于预设相似度阈值的历史已定价地块,得到候选地块,并记录候选地块对应的相似度系数。
[0184]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0185]
初始化粒子群;获取初始化粒子群中各粒子的适应度;根据各粒子的适应度更新出现全局最优的粒子位置以及粒子序号;根据出现全局最优的粒子位置以及粒子序号,更新粒子群速度和位置,返回获取初始化粒子群中各粒子的适应度的步骤,并记录返回次数;当返回次数达到预设次数阈值时,停止返回,获取最新的粒子群速度和位置。
[0186]
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
[0187]
利用改进的粒子群算法搜索初始最优解,得到初始食物源;引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源;对新食物源和初始食物源的适应度值进行贪婪选择,获取较优食物源;将较优食物源重新作为初始食物源,返回引领蜂带领跟随蜂到初始食物源附近搜索,利用改进的粒子群算法搜索新的食物源,得到新食物源的步骤,记录迭代返回次数;当迭代返回次数达到预设迭代返回次数阈值时,记录最新的食物源,得到最小二乘法模型的最优解。
[0188]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0189]
获取目标地块价格影响因子数据以及历史已定价地块价格影响因子数据;
[0190]
根据目标地块价格影响因子数据以及历史已定价地块价格影响因子数据,从历史已定价地块中对比筛选出与目标地块相似的候选地块、并获取候选地块对应的相似度系数;
[0191]
将目标地块价格影响因子数据和候选地块价格影响因子数据输入至预设已训练机器学习模型,获取候选地块的价格调整系数,预设已训练机器学习模型用于求解目标地块价格影响因子数据和候选地块价格影响因子数据之间的差异对价格调整的最优解;
[0192]
获取候选地块价格数据,根据候选地块价格数据、价格调整系数以及相似度系数,加权得到目标地块的价格数据。
[0193]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
[0194]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读
取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器 (ferroelectric random access memory,fram)、相变存储器(phase changememory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器 (random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random accessmemory,sram)或动态随机存取存储器(dynamic random access memory, dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0195]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0196]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形与改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献