基于一维卷积神经网络的土地拟建项目的预测方法及系统与流程

2022-06-29 23:33:24 来源：中国专利 TAG：

1.本发明涉及土建工程领域，尤其涉及基于一维卷积神经网络的土地拟建项目的预测方法及系统。

背景技术：

2.城市土地项目开发中，土地项目开发类型错误会导致一系列不良后果，如项目建成后抗风险水平差，收益偏低甚至为负等。因此精准预测待开发土地的项目类型，不仅对能为城市土地的开发利用带来有效的保证，在城市的健康发展和城市土地的科学开发利用中也起到了巨大贡献。
3.目前的项目类型判断，主要由土地评估师依靠经验，通过一系列抽样调研来确定，虽有一定的准确性，耗费的人力物力大，该类方法需要土地评估师具有较强的专业知识以及专业能力，可迁移性较差。
4.针对上述情况，亟需本领域工作人员提供一种能够精准对拟建的土地项目进行预测的方法。

技术实现要素：

5.本发明提供了基于一维卷积神经网络的土地拟建项目的预测方法及系统，用以解决如何对土地项目进行预测的技术问题。
6.为解决上述技术问题，本发明提出的技术方案为：基于一维卷积神经网络的土地拟建项目的预测方法，包括：
7.确定影响土地项目类型的土地属性；
8.基于土地拟建项目预测模型对土地项目类型和土地属性的数据分别进行预处理；
9.将土地属性的数据作为土地拟建项目预测模型的输入，输出土地项目类型预测结果。
10.优选的，搭建土地拟建项目预测模型包括以下步骤：
11.选取已有的土地项目类型以及对应的土地属性的数据作为样本集，按照预设比例将样本集划分为训练集和测试集；
12.初始化土地拟建项目预测模型，利用训练集对土地拟建项目预测模型进行训练；
13.设置损失函数，通过反向传播和优化方法对土地拟建项目预测模型进行迭代训练，当达到设置的迭代轮数或损失函数值经过设定迭代轮数不再降低时，停止迭代训练得到收敛的土地拟建项目预测模型。
14.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
15.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分
布与训练集中对应的土地项目类型的概率分布之间的距离。
16.优选的，还包括：利用测试集对土地拟建项目预测模型进行测试，将利用测试集得到的土地拟建项目预测结果与测试集中对应的土地项目类型进行对比，计算土地拟建项目预测模型的准确率，若准确率达到设定阈值，则保存土地拟建项目预测模型；若准确率没有达到设定阈值，则继续对土地拟建项目预测模型进行迭代训练，直至准确率达到设定阈值。
17.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
18.土地拟建项目预测模型包括：输入层、第一卷积层、第二卷积层、池化层、flatten层、全连接层和输出层；
19.第一卷积层用于对属性特征进行卷积得到第一层特征；
20.第二卷积层用于对第一层特征进行卷积得到第二层特征；
21.将第二层特征输入池化层，输出得到多个一维特征层；
22.flatten层用于将多个一维特征层进行特征层一维化，输出一维化后的特征数据；
23.全连接层用于将特征数据映射到样本标记空间，输出项目类型分类向量；
24.输出层采用分类器输出土地拟建项目预测概率分布，作为土地拟建项目预测结果。
25.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
26.对土地属性参数进行预处理包括：将土地属性的数据转化为特征向量数据，再将土地属性参数的特征向量数据进行归一化处理。
27.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
28.对土地项目类型进行预处理包括：使用标签编码对土地项目类型进行编码处理。
29.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
30.土地属性包括以下一项或任意多项的组合：高程，坡度，高速距离，火车站距离，机场距离，市中心距离，行政中心距离、餐饮店密度，公交站点密度，商场点密度，写字楼密度，学校点密度，住宅密度，酒店密度和医院密度。
31.优选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
32.土地项目类型包括以下任意两项或两项以上的组合：商业、住宅、写字楼、酒店和医院。
33.本发明的实施例还提供了一种计算机系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法
的步骤。
34.本发明具有以下有益效果：
35.本发明通过确定影响土地项目类型的土地属性，基于土地拟建项目预测模型对所述土地项目类型和所述土地属性的数据分别进行预处理，将所述土地属性的数据作为土地拟建项目预测模型的输入，输出土地项目类型预测结果，可以科学地获得所要预测的土地项目最合理的类型，节省了土地评估师进行土地项目预测所需的人力物力，不仅对城市土地的开发利用带来有效的保证，而且还为城市的健康发展和城市土地的科学开发提供了便利，解决了如何对土地项目进行预测的技术问题。
36.除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照附图，对本发明作进一步详细的说明。
附图说明
37.构成本技术的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
38.图1是本发明优选实施例的基于一维卷积神经网络的土地拟建项目的预测方法的流程图；
39.图2是本发明优选实施例的土地拟建项目预测模型的结构图；
40.图3是土地拟建项目预测模型的准确率随迭代次数增加的变化图；
41.图4土地拟建项目预测模型的损失函数值随迭代次数增加的变化图。
具体实施方式
42.以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
43.实施例1：
44.参见图1，本发明的基于一维卷积神经网络的土地拟建项目的预测方法，包括：
45.s1：确定影响土地项目类型的土地属性；
46.s2：基于土地拟建项目预测模型对土地项目类型和土地属性的数据分别进行预处理；
47.s3：将土地属性的数据作为土地拟建项目预测模型的输入，输出土地项目类型预测结果。
48.在本实施方式中，通过土地拟建项目预测模型对土地拟建项目类型进行预测，可以得到合理的土地项目类型预测结果指导土地项目开发，通过上述方法，不仅可以快速准确的对土地项目进行预测，对土地拟建项目进行合理选择，同时节省了对土地项目预测消耗的大量人力物力。
49.可选的，搭建土地拟建项目预测模型包括以下步骤：
50.选取已有的土地项目类型以及对应的土地属性的数据作为样本集，按照预设比例将样本集划分为训练集和测试集；
51.初始化土地拟建项目预测模型，利用训练集对土地拟建项目预测模型进行训练；
52.设置损失函数，通过反向传播和优化方法对土地拟建项目预测模型进行迭代训
练，当达到设置的迭代轮数或损失函数值经过设定迭代轮数不再降低时，停止迭代训练得到收敛的土地拟建项目预测模型。
53.在本可选的实施方式中，土地拟建项目预测模型以一个一维卷积神经网络作为基线模型，包括：输入层、第一卷积层、第二卷积层、池化层、flatten层、全连接层和输出层，然后采用控制变量分步调优方法进行超参调优，该模型当前需要调优的参数有迭代次数epochs,批规模batch_size，权重初始化方法，各卷积层的滤波器数量，卷积和池化的核尺寸，全连接层神经元数量，sgd优化方法的学习率，学习率衰减和动量。最终确定本发明的一维卷积神经网络的超参数设置为：迭代次数epochs为100，批规模batch_size为16；权重初始化方法为he_normal；卷积层c1的filters＝128，kernel_size＝2，卷积层c2的filters＝128，kernel_size＝2，池化层s1最大池化pool_size＝2，全连接层units＝128；优化方法：sgd的学习率learning_rate＝0.01，学习率衰减decay＝0.0001，动量momentum＝0.9。采用最优参数组合，迭代训练土地拟建项目预测模型。
54.此外，本发明按照9:1的比例将样本集划分为训练集和测试集，利用训练集对土地拟建项目预测模型进行训练，将训练集中的土地属性的数据输入进土地拟建项目预测模型，得到土地项目类型预测结果，设置损失函数，通过反向传播和优化方法对土地拟建项目预测模型进行迭代训练，当达到设置的迭代轮数或损失函数值(loss值)经过设定迭代轮数不再降低时，停止迭代训练得到收敛的土地拟建项目预测模型。
55.在本可选的实施方式中，在训练集中按预设的比例选取作为验证集(一般在训练集中选取20％作为验证集)，在训练得到收敛的土地拟建项目预测模型后，对土地拟建项目预测模型进行验证，当准确率accuracy满足设定阈值时，再利用测试集对土地拟建项目预测模型进行测试。
56.设定准确率的阈值为90％，若准确率达到设定阈值，则保存土地拟建项目预测模型，训练集和验证集的loss值以及准确率accuracy值如表1所示。
[0057] loss值accuracy值训练集0.06490.9861验证集0.07070.9803
[0058]
表1
[0059]
此外，参见图3，土地拟建项目预测模型的准确率随迭代次数增加的变化图的横坐标为迭代次数，纵坐标为准确率，可见土地拟建项目预测模型的准确率accuracy值随迭代次数epochs增加而增加，accuracy值开始增加较快，后来逐渐平稳。其中train代表训练集，valid代表验证集。
[0060]
参见图4，土地拟建项目预测模型的损失函数值随迭代次数增加的变化图的横坐标为迭代次数，纵坐标为损失函数值，可见土地拟建项目预测模型的损失函数值loss值随迭代次数epochs增加而下降，loss值开始下降较快，后来逐渐平稳。其中train代表训练集，valid代表验证集。
[0061]
可选的，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，损失函数为利用交叉熵函数计算的土地拟建项目预测的结果概率分布与训练集中对应的土地项目类型的概率分布之间的距离。
[0062]
需要说明的是，交叉熵刻画的是两个概率分部之间的距离，或可以说其刻画的是
通过概率分布q来表达概率分布p的困难程度，p代表正确答案，q代表的是预测值，交叉熵越小，两个概率的分布越接近，交叉熵损失函数通常使用在softmax上，而softmax通常使用在神经网络的末端，使其预测结果以概率的形式输出。softmax函数为：
[0063][0064]
其把原始输出zj转化成概率，从而可以通过交叉熵来计算预测的概率分布和真实答案的概率分布之间的距离。
[0065]
在本可选的实施方式中，土地拟建项目预测模型将土地拟建项目预测结果的概率分布作为土地项目类型预测结果输出，土地项目类型包括商业、住宅、写字楼、酒店和医院，商业、住宅、写字楼、酒店和医院的概率之和为1，将土地项目类型按顺序分別编码为0、1、2、3和4，当土地拟建项目预测结果为其中某个土地项目类型时，概率分布中上述的作为预测结果的土地项目类型的概率为各项土地项目类型的概率中的最高值，例如当土地拟建项目预测结果为商业时，预测结果的概率分布为(0.8，0.1，0.02，0.06，0.02)。
[0066]
可选的，还包括：利用测试集对土地拟建项目预测模型进行测试，将利用测试集得到的土地拟建项目预测结果与测试集中对应的土地项目类型进行对比，计算土地拟建项目预测模型的准确率(accuracy值)，若准确率达到设定阈值，则保存土地拟建项目预测模型；若准确率没有达到设定阈值，则继续对土地拟建项目预测模型进行迭代训练，直至利用测试集对土地拟建项目预测模型进行测试的准确率达到设定阈值。
[0067]
加载训练好的模型，利用测试集的数据对土地拟建项目预测模型进行测试，准确率为0.9775，可见土地拟建项目预测模型的准确率达到阈值要求90％。其中使用测试集对土地拟建项目预测模型进行测试的精确率precision、召回率recall、和f1分数(f1分数、召回率、精确率三方面可观察分类模型对于每一类别分类的好坏)如表2所示：
[0068] precisionrecallf1-score00.990.990.9910.990.990.9920.990.970.9830.930.960.9340.940.920.93macro avg0.970.970.96
[0069]
表2
[0070]
需要说明的是，土地项目类型包括商业、住宅、写字楼、酒店和医院，土地项目类型按顺序分別编码为0、1、2、3和4。
[0071]
可选的，土地拟建项目预测模型包括：输入层、第一卷积层、第二卷积层、池化层、flatten层、全连接层和输出层；
[0072]
参见图2，其中，输入层(输入特征面)、第一卷积层(输出特征面卷积层c1)、第二卷积层(输出特征面卷积层c2)、池化层(输出特征面池化层s1)、flatten层、全连接层和输出层(softmax输出层)
[0073]
第一卷积层用于对属性特征进行卷积得到第一层特征；
[0074]
第二卷积层用于对第一层特征进行卷积得到第二层特征；
[0075]
将第二层特征输入池化层，输出得到多个一维特征层；
[0076]
flatten层用于将多个一维特征层进行特征层一维化，输出一维化后的特征数据；
[0077]
全连接层用于将特征数据映射到样本标记空间，输出项目类型分类向量；
[0078]
输出层采用分类器输出土地拟建项目预测概率分布，作为土地拟建项目预测结果。
[0079]
在本可选的实施方式中，卷积层可表述为c＝f(xk b),其中x为输入，k为卷积核，b为偏置值，f为激活函数。卷积层c1在特征上作窗口滑动，进行卷积后得到第一层特征。
[0080]
卷积层c2在得到的特征上继续作与c1相同的操作后得到更高级别的特征，更高级别的特征为第二层特征。
[0081]
池化层可表述为：s＝f(down(c) b)，其中down为下采样选择的函数，此处采用的是最大池化。
[0082]
通过以上操作后得到多个一维特征层，然后利用flatten层将多个一维特征层“压平”，即将特征层一维化。然后将一维化后的特征数据输入到全连接层中，通过全连接层将特征空间映射到样本标记空间。为了加快学习速率，在全连接层中进行批量归一化处理(batch normalization)。
[0083]
输出层采用softmax分类器。通过全连接层后的输出为z1，z2，
…
，zm，m＝5，然后经softmax操作后，输出土地拟建项目预测概率分布。
[0084]
可选的，对土地属性参数进行预处理包括：将土地属性的数据转化为特征向量数据，再将土地属性的数据的特征向量数据进行归一化处理。
[0085]
需要说明的是，神经网络本质上是对数据的高度抽象，进行了归一化，神经网络能够更轻松地学习到数据中蕴含的模式，准确率更高，收敛速度更快。
[0086]
可选的，对土地项目类型进行预处理包括：使用标签编码对土地项目类型进行编码处理。
[0087]
可选的，土地属性包括以下一项或任意多项的组合：高程，坡度，高速距离，火车站距离，机场距离，市中心距离，行政中心距离、餐饮店密度，公交站点密度，商场点密度，写字楼密度，学校点密度，住宅密度，酒店密度和医院密度。
[0088]
在本可选的实施方式中，土地项目i的土地属性的数据的特征向量可以表示为xi＝[f1i，f2i，f3i，f4i，f5i，f6i，f7i，f8i，f9i，f10i，f11i，f12i，f13i，f14i，f15i]，i＝1，2，3，...，n。
[0089]
需要说明的是，餐饮店密度，公交站点密度，商场点密度，写字楼密度，学校点密度，住宅密度，酒店密度和医院密度为所要进行预测的土地项目的3公里内pois邻近属性，pois是point of interests(兴趣点)的缩写，土地属性中餐饮店密度，公交站点密度，商场点密度，写字楼密度，学校点密度，住宅密度，酒店密度和医院密度都是土地的邻近兴趣点属性。
[0090]
可选的，土地项目类型包括以下任意两项或两项以上的组合：商业、住宅、写字楼、酒店和医院。
[0091]
实施例2：
[0092]
一种计算机系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。
[0093]
该系统可以实现上述的基于一维卷积神经网络的土地拟建项目的预测方法的各个实施例，且能达到相同的有益效果，此处，不做赘述。
[0094]
综上可知，本发明通过确定影响土地项目类型的土地属性，基于土地拟建项目预测模型对所述土地项目类型和所述土地属性的数据分别进行预处理，将所述土地属性的数据作为土地拟建项目预测模型的输入，输出土地项目类型预测结果，可以科学地获得所要预测的土地项目最合理的类型，节省了土地评估师进行土地项目预测所需的人力物力，不仅对城市土地的开发利用带来有效的保证，而且还为城市的健康发展和城市土地的科学开发提供了便利，解决了如何对土地项目进行预测的技术问题。
[0095]
在本说明书的描述中，参考术语“一个实施方式”、“一些实施方式”、“示意性实施方式”、“示例”、“具体示例”或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0096]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0097]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0098]
应当理解，本发明的实施方式的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0099]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步
骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0100]
此外，在本发明的各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0101]
上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0102]
尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施方式进行变化、修改、替换和变型。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

基于一维卷积神经网络的土地拟建项目的预测方法及系统与流程

相关文献

最热文献