一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息处理方法及装置与流程

2022-11-14 15:20:54 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,具体而言,本技术涉及一种信息处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

2.随着经济高速发展,公共设施的服务能力逐渐成为了一项重要的考验。理解各区域对公共设施的需求由哪些因素决定,以及准确地预测未来的公共设施需求,在制定城市发展策略、公共设施资源分配等社会规划中起到重要的作用。
3.传统的需求预测或是人流预测方法基本都是静态模型,将区域的特征视作静态的固定值,根据物理空间中的距离、人口属性等数据拟合人流。相关技术方案中主要是将需求用简单的表达式建模,但实际上城市中存在的大量不确定性,难以具有较好的预测能力。


技术实现要素:

4.本技术实施例提供了一种信息处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术的上述问题。所述技术方案如下:
5.根据本技术实施例的一个方面,提供了一种信息处理方法,该方法包括:
6.获取目标区域在当前时段的当前区域属性信息序列,所述当前时段包括连续的多个子时段;所述当前区域属性信息序列包括所述多个子时段的区域属性信息;
7.将所述当前区域属性信息序列输入至预先训练的需求预测模型,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果;
8.其中,所述需求预测模型是基于多个带有标签的训练样本对神经网模型进行训练得到的,其中,每个所述训练样本包括一个样本区域的样本区域属性信息序列,每个所述训练样本的标签为所述训练样本对应的公共设施需求信息的真实结果。
9.根据本技术实施例的另一个方面,提供了一种信息处理装置,该装置包括:
10.当前信息获取模块,用于获取目标区域在当前时段的当前区域属性信息序列,所述当前时段包括连续的多个子时段;所述当前区域属性信息序列包括所述多个子时段的区域属性信息;
11.预测模块,用于将所述当前区域属性信息序列输入至预先训练的需求预测模型,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果;
12.其中,所述需求预测模型是基于多个带有标签的训练样本对神经网模型进行训练得到的,每个所述训练样本包括一个样本区域的样本区域属性信息序列,每个所述训练样本的标签为所述训练样本对应的公共设施需求信息的真实结果。
13.作为一种可选实施例,每个子时段的区域属性信息包括以下至少一种:
14.所述目标区域在该子时段的至少一个属性维度的第一属性值;
15.所述第一属性值相对于上一子时段的变化量;
16.相应区域的相邻区域在该子时段的至少一个属性维度的第二属性值;
17.所述第二属性值相对于上一子时段的变化量;
18.各个目标公共设施的级别信息,其中,所述各个目标公共设施为第一区域中的公共设施,所述目标区域为所述第一区域中的子区域;
19.各个目标公共设施与所述目标区域的距离。
20.作为一种可选实施例,预测模块具体用于:
21.对于当前时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
22.对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;
23.根据当前时段中的最后一个子时段的隐状态向量,获得所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果。
24.作为一种可选实施例,预测模块还用于:对每个子时段的区域属性信息进行编码,得到每个子时段的编码向量;
25.预测模块根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量,包括:根据所述第一个子时段的编码向量,获得所述第一个子时段的隐状态向量;
26.预测模块根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量,包括:
27.根据所述子时段的编码向量以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量。
28.作为一种可选实施例,还包括模型训练模块,模型训练模块用于通过以下方式训练得到需求预测模型:
29.通过所述神经网络模型得到每个训练样本对应的预测结果;
30.根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失;
31.若满足训练结束条件,则将所述神经网络模型作为所述需求预测模型;若不满足训练结束条件,则基于训练损失对模型参数进行调整,并基于所述多个训练样本对调整后的模型继续训练,直至满足训练结束条件。
32.作为一种可选实施例,每个所述样本区域属性信息序列包括样本区域在样本时段的区域属性信息,所述样本时段包括连续的多个子时段;
33.模型训练模块用于:
34.对于样本时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
35.对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;对于样本时段中的至少一个子时段,根据所述至少一个子时段的隐状态向量,获得所述训练样本对应的预测结果;
36.其中,所述训练样本对应的预测结果包括所述至少一个子时段中每个子时段对应的公共设施需求信息的预测结果。
37.作为一种可选实施例,模型训练模块根据各个训练样本的真实结果和预测结果之
和“该”也可包括复数形式。应该进一步理解的是,本技术实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“a和/或b”可以实现为“a”,或者实现为“b”,或者实现为“a和b”。
58.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
59.首先对本技术涉及的几个名词进行介绍和解释:
60.(1)兴趣点(point of interest,poi),是一个地理位置点,通常是问题中有用并且感兴趣的位置,城市中兴趣点的种类分布与区域的用地功能息息相关。
61.(2)公共设施:由政府或其他社会组织提供的给社会公众使用的poi,包括教育、医疗卫生、文娱、交通、体育、社会福利等类别。
62.(3)公共设施需求:一个区域对公共设施的需求,具体体现为一定时间内由该区域出发的访问该公共设施的人流,更高的人流对应地区对该设施更高的需求。
63.现有的基于城市结构与历史区域属性来预测区域公共设施需求的工作可以分为两类:
64.1)以物理规律为基础的建模城市中的人流的方法,如重力模型、一般约束模型等。其中重力模型把区域对公共设施的需求比作万有引力,区域到访设施的人流量随着区域人口变大而增加,随二者之间距离增大而减少,用类似万有引力公式的表达式建模此函数。
65.2)数据驱动的方法,用成熟的机器学习模型在大规模的区域属性及地理属性数据集上有监督地拟合区域对公共设施的人流,这种模型通常具有不错的泛化能力,能够比较精准地预测公共设施需求。此外,一些经典的时间序列预测统计模型也可用于设施需求,如自回归模型、隐马尔科夫模型等。这些模型能够捕捉公共设施需求序列的动态变化规律,解决动态的需求预测问题。
66.但现实中,城市系统瞬息万变,一个区域在连续两个月间都可能会有很大的属性变化,而这种变化必将对区域的公共设施需求产生相应的影响。如果忽视区域属性随时间的变化,将无法准确地推断未来的公共设施需求。所以现有的经典模型或是数据驱动的人流建模等方法均无法胜任设施需求预测任务,存在精度低的性能缺陷。
67.现有的技术方案中,传统模型的假设把公共设施需求用简单的表达式建模,加之城市中存在的大量不确定性,难以具有较好的预测能力。
68.静态的公共设施需求预测方法没能构建公共设施需求时间序列上的相关性,无法充分地刻画需求随历史属性变化的规律,所以不能达到很精确的预测效果。与之相比,时间序列统计模型也是对多个时段的公共设施需求构成的序列作为输入,不能建模大量属性间的关系,在面对上百上千种区域属性及较长的时间序列时,难以取得精确的预测效果。
69.所以,如何在高速发展、环境不断变化的区域中基于区域结构及属性动态地预测公共设施需求是一个亟待解决的问题。
70.本技术提供的信息处理方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,旨在解决现有技术的如上技术问题。
71.本技术实施例的发明构思在于,通过机器学习方法构建神经网络模型,以区域属性信息为基础拟合未来时段的公共设施需求,以此来捕捉区域公共设施需求随历史信息及区域属性变化的变化规律,达到准确地预测区域对公共设施的需求的目的。
72.下面通过对几个示例性实施方式的描述,对本技术实施例的技术方案以及本技术的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
73.图1为本技术实施例提供的实现公共设施需求预测的系统架构示意图,其中,该系统结构包括服务器100和多个用户设备200。
74.用户设备是指用户使用的终端设备,终端设备可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机、可穿戴设备、车机设备、车载终端等等。用户设备上安装有服务器100提供服务的目标应用程序,目标应用程序可以为应用程序或者操作系统,目标应用程序为公共设施需求预测的实现提供运行环境。例如,目标应用程序可以为市政规划应用,公共设施需求预测服务可以基于目标应用程序实现,目标应用程序为公共设施需求预测服务提供运行环境。再如,目标应用程序可以为安卓(android)操作系统,导航服务可以基于目标应用程序的快应用实现,目标应用程序为用于提供公共设施需求预测服务的快应用提供运行环境。用户可以借助用户设备200向服务器100发送公共设施需求预测请求,公共设施需求预测请求中包括当前时段的当前区域属性信息序列。
75.当任一用户在用户设备上触发了公共设施需求预测请求之后,该用户设备将该公共设施需求预测请求发送至服务器100,以使服务器100能够基于该公共设施需求预测请求确定目标区域在公共设施需求信息的预测结果。
76.本技术实施例的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是提供车联网服务、路网协同、车路协同、智能交通、自动驾驶、工业互联网服务、数据通信(如4g、5g等)等专门或平台服务器等。
77.本技术实施例的服务器的执行方法可以以云计算(cloud computing)的形式完成,云计算是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
78.作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为iaas(infrastructure as a service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
79.按照逻辑功能划分,在iaas(infrastructure as a service,基础设施即服务)层上可以部署paas(platform as a service,平台即服务)层,paas层之上再部署saas(software as a service,软件即服务)层,也可以直接将saas部署在iaas上。paas为软件运行的平台,如数据库、web容器等。saas为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,saas和paas相对于iaas是上层。
80.服务器100用于执行本技术实施例提供的信息处理方法,根据用户设备发送的目标区域在当前时段的当前区域属性信息序列,获得目标区域在当前时段的下一子时段的公共设施需求信息的预测结果,并将预测结果发送至用户设备进行显示。
81.应理解,上述提供的应用场景仅为示例,在实际应用中,本技术实施例提供的信息处理方法还可以应用于其他需要进行公共设施需求预测的应用场景,在此不对本技术实施例提供的信息处理方法的应用场景的组成部分做任何限定。
82.本技术实施例中提供了一种信息处理方法,如图2所示,该方法包括:
83.s101、获取目标区域在当前时段的当前区域属性信息序列。
84.需要注意的是,本技术实施例在进行公共设施需求的预测时,并不是以目标区域在当前时段的公共设施需求序列为模型的输入,而是以当前区域属性信息序列为模型的输入,以建模区域的区域属性信息与区域的公共设施需求间的非线性关系,为获得高精度的公共设施需求的预测结果奠定基础。
85.本技术实施例对于区域的划分方式不作具体的限定,是按照某种方式对预设地理空间进行划分之后的最小单元,划分方式是任意的,当地理空间为城市时,可以使用经纬度进行网格划分;也可以使用路网进行街区划分。当然,本技术实施例也适用于对于相比城市更大的地理空间进行处理,例如该地理空间也可以为省级行政区域。
86.本技术实施例的区域属性,也即一个区域的特征,用来表征该区本身的一些特点,包括但不限于人口组成、职住人口情况、poi分布等特征。
87.本技术实施例的当前时段包括连续的多个子时段,本技术实施例对于每个时段的时长不作具体的限定,例如可以为月、季度、年等等。当前区域属性信息序列包括多个子时段的区域属性信息。
88.s102、将当前区域属性信息序列输入至预先训练的需求预测模型,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果。
89.本技术实施例的需求预测模型是基于多个带有标签的训练样本对神经网模型进行训练得到的。每个所述训练样本包括一个样本区域的样本区域属性信息序列。样本区域属性信息序列包括样本时段中多个子时段的区域属性信息。本技术实施例的样本区域可以包括目标区域,也可以包括除目标区域以外的其他区域,当样本区域包括目标区域时,样本区域属性信息序列对应的样本时段为当前时段之前的历史时段。当样本区域包括除目标区域以外的其他区域,样本时段在一些情况下也可以是当前时段。
90.每个训练样本的标签为训练样本对应的公共设施需求信息的真实结果。也即训练样本在样本时段的下一子时段的公共设施需求信息的真实结果。
91.可以理解的是,在执行步骤s102之前,还可以预先训练得到需求预测模型,具体可通过如下方式训练得到需求预测模型:首先,收集一定数量的样本区域的样本区域属性信息序列,获取每个样本区域属性信息序列对应的公共设施需求信息的真实结果,随即,基于
样本区域的样本区域属性信息序列,以及样本区域属性信息序列对应的公共设施需求信息的真实结果对初始模型进行训练,其中,以样本区域的样本区域属性信息序列作为训练样本,样本区域属性信息序列对应的公共设施需求信息的真实结果作为样本标签,从而得到需求预测模型。其中,初始模型可以是单一神经网络模型,也可以是多个神经网络模型的组合。
92.本技术实施例通过将当前时段的当前区域属性信息序列输入需求预测模型,使得需求预测模型以区域属性信息为基础,充分拟合未来时段的公共设施需求,以此来捕捉区域公共设施需求随区域属性在时间尺度上的变化规律,极大地发掘了区域属性蕴含的信息,有效地提升预测效果,达到准确地预测区域对公共设施的需求的目的。
93.在上述各实施例的基础上,作为一种可选实施例,每个子时段的区域属性信息包括以下至少一种:
94.1)目标区域在该子时段的至少一个属性维度的第一属性值。本技术实施例的属性维度可以是与人口相关的各个属性维度,例如职住人口的数量、年龄分布、性别比例等等。
95.2)第一属性值相对于上一子时段的变化量。在获取各个属性维度的第一属性值的基础上,本技术实施例通过获取当前子时段相比上一子时段的第一属性值的变化量,有助于充分挖掘各个属性维度对需求变化的影响。
96.3)相应区域的相邻区域在该子时段的至少一个属性维度的第二属性值。本技术实施例通过获取相应区域的相邻区域的各个属性维度的第二属性值,有助于充分挖掘区域间存在的空间相似性和相互之间的制约关系,为模型合理地建模空间信息奠定基础。本技术实施例对于相邻区域的数量不作具体限定,例如可以为5个。
97.4)第二属性值相对于上一子时段的变化量。本技术实施例通过获取当前子时段相比上一子时段的第一属性值的变化量,有助于充分挖掘各个属性维度对需求变化的影响,同时可更深入的挖掘区域间的空间相似性和制约关系。
98.5)各个目标公共设施的级别信息,其中,所述各个目标公共设施为第一区域中的公共设施,所述目标区域为所述第一区域中的子区域。本技术实施例对于目标公共设施的类型不作具体限定,例如可以是医院、学校、商场。以医院为例,医院的级别信息可以包括三级甲等、二级甲等,等。
99.6)各个目标公共设施与所述目标区域的距离。本技术实施例在计算一个目标公共设施与目标区域的距离时,可以以该目标公共设施与目标区域的中心的间距进行表示,从而无论该目标公共设施是否位于目标区域内部,都可以获得相应的距离。
100.本技术实时例通过充分考虑区域属性信息对需求变化的影响以及相邻区域的相互制约关系,采用丰富的目标区域自身以及邻区的属性维度的属性值、属性值的变化情况、公共设施的级别以及距离,可以有效地表征复杂区域系统中微分形式的需求依赖关系。
101.在上述各实施例的基础上,作为一种可选实施例,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果,包括:
102.s201、对于当前时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
103.s202、对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向
量;
104.s203、根据当前时段中的最后一个子时段的隐状态向量,获得所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果。
105.本技术实施例在获得预测结果时,首先对第一个子时段的区域属性信息进行特征提取,获得第一个子时段的隐状态向量,对于第一个子时段以外的子时段,则基于该子时段的区域属性信息以及该子时段的前一个子时段的隐状态向量,确定该子时段的隐状态向量,使得当前时段中在先时段的区域属性信息能够合理地传递到在后时段的隐状态向量中,除第一个子时段之后的每一个子时段的隐状态向量,能够积累该子时段之前的各个子时段的信息。由于最后一个子时段的隐状态向量积累了所有子时段的信息,因此利用最后一个子时段的隐状态向量进行公共设施需求信息的预测,使得需求预测模型能够利用区域属性信息在当前时段的变化情况,更准确地预测出公共设施需求信息。
106.在上述各实施例的基础上,作为一种可选实施例,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果,还包括:
107.对每个子时段的区域属性信息进行编码,得到每个子时段的编码向量。
108.本技术实施例的需求预测模型首先通过编码层对当前时段的每个子时段的区域属性信息进行特征提取,获得每个子时段的区域属性信息的编码向量(简称每个子时段的编码向量)。
109.具体来说,本技术实施例通过编码层对区域属性信息所包括的目标区域自身以及邻区的属性维度的属性值、属性值的变化情况、公共设施的级别以及距离进行编码,这一步充分考虑了区域属性信息对需求变化的影响以及区域之间的相互关系,通过丰富的多种属性维度的属性值、属性值的变化情况、公共设施的属性等作为输入,编码层将属性编码至大小一致的隐空间。在一个实施例中,本技术实施例的隐空间的维度为64维。
110.如图3所示,本技术实施例的编码层采用全连接层(dense layer)、归一化层以及激活函数层的连接架构,这种连接架构充分利用了每一子时段的区域属性信息,同时考虑了相邻子时段的区域属性的增量以建模复杂区域系统中微分形式的需求依赖关系。本技术实施例对于全连接层、归一化层以及激活函数层的层数不作限定,例如可以为图3中的全连接层31、归一化层32以及激活函数层33。本技术实施例的激活函数可以采用leaky relu函数(带泄露修正线性单元函数)或者elu激活函数。与relu函数及其变体相比,使用elu激活函数可在神经网络中缩短训练时间并提高准确度。本技术实施例的编码层首先通过全连接层对区域属性信息所包括的各个类型的数据对应的特征值整合为一个值,随后通过归一化层进行标准化处理,警告处理的数据符合标准正态分布,以防止梯度爆炸和梯度消失,最后通过激活函数层提高数据的表达能力,从而突出区域属性信息所蕴含的特征。
111.在上述各实施例的基础上,作为一种可选实施例,所述根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量,包括:
112.根据所述第一个子时段的编码向量,获得第一个子时段的隐状态向量。
113.所述根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定子时段的隐状态向量,包括:
114.根据所述子时段的编码向量以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量。
115.请参见图4,其示例性地示出了本技术实施例的需求预测模型的架构图,如图所示,需求预测模型包括3部分,分别为编码层、循环层以及预测层。图中当前时段中共包括10个子时段(分别为子时段0~子时段9),每个子时段的区域属性信息通过编码层的处理,获得对应子时段的编码向量,10个子时段对应的编码向量分别用x0~x9进行表示,并且,编码层在对子时段0的区域属性信息进行编码时,还同时得到了子时段0对应的隐状态向量。本技术实施例对于获得子时段0对应的隐状态向量的方式不作具体限定,例如,可以直接将子时段0对应的编码向量作为隐状态向量。
116.对于子时段1~子时段9中的每个子时段,编码层获得该子时段对应的编码向量,并向循环层输出,循环层对上一子时段对应的编码向量进行线性变换后,与该子时段对应的编码向量相加,获得该子时段对应的隐状态向量,本技术实施例通过对各个子时段重复该流程,能够将先前子时段的信息合理地传递到若干子时段之后的子时段,捕捉公共设施需求序列中的时序依赖。该流程可以用以下公式表示:
117.h
t
=x
t
wh
t-1
118.其中,h
t
表示子时段t对应的隐状态向量,x
t
表示子时段t对应的编码向量,w表示线性变换系数,可以理解的是t为大于1的整数。
119.在获得各个子时段对应的隐状态向量后,本技术实施例可以通过预测层根据各子时段对应的隐状态向量,预测各子时段的预测结果。应当理解的是,每个子时段对应的预测结果,是该子时段的下一个时段的公共设施需求信息。例如,子时段2对应的预测结果,是预测的子时段3的公共设施需求信息。因此,对于当前时段的最后一个时段,该最后一个时段对应的预测结果,也即当前时段的下一个子时段的公共设施需求信息。本技术实施例的需求预测模型可以获得当前时段中每个子时段对应的预测结果,因此在实际应用时,如果获得当前时段的公共设施需求信息的实际结果,可以将当前时段的公共设施需求信息的实际结果与预测结果进行比对,获得预测精度,以评估下一时段的公共设施需求信息的预测结果的准确性。
120.在上述各实施例的基础上,作为一种可选实施例,本技术实施例的预测层采用densenet(密集连接的卷积网络)结构的深度神经网络。此结构由若干个神经网络层连接组成,并且每一层的输入不仅为上一层的输出,而是之前每一层的输出的组合,即在任意两层间都存在一条通路,将信息从前面的神经网络层直接传递到后面的神经网络层。此网络结构具有良好的稳定性,经验证,采用densenet结构的深度神经网络可以有效解决本应用场景中区域需求信息较稀疏的问题,可导到稳定的预测效果,具有强大的抗过拟合和泛化能力。
121.请参见图5,其示例性地示出了本技术实施例获得一个子时段对应的预测结果的流程示意图,如图所示,子时段t的目标区域的区域属性信息包括目标区域在子时段t的至少一个属性维度的第一属性值(图中以区域属性进行表示)、第一属性值相对于上一子时段的变化量(图中以区域属性增量进行表示)、邻域在子时段t的至少一个属性维度的第二属性值(图中以邻域属性进行表示)、第二属性值相对于上一子时段的变化量(图中以邻域属性增量进行表示)以及目标公共设施的属性信息(级别信息以及目标公共设施与所述目标区域的距离等),为了更准确地体现不同类型的区域属性信息对公共设施需求的影响,本技术实施例在获得上述各个类型的区域属性信息的特征向量后,将区域属性和邻域属性的特
征向量进行融合,获得第一融合向量,将区域属性增量和邻域属性增量的特征向量进行融合,获得第二融合向量,进一步地,本技术实施例还需要获得子时段t的公共设施需求信息,并获得该信息的特征向量(图中以历史需求进行表示),将历史需求、第一融合向量、第二融合向量以及目标公共设施的属性信息对应的特征向量进行全连接处理,获得子时段t的编码向量x
t

122.对前一时段(也即子时段t-1)的隐状态向量h
t-1
以权重w进行线性变换,将线性变换的结果w h
t-1
与子时段t的编码向量x
t
进行相加,获得子时段t的隐状态向量h
t
,通过densenet网络对隐状态向量h
t
进行处理,densenet网络由若干个神经网络层连接组成,从图中可以看出,每一层的输入不仅为上一层的输出,而是之前每一层的输出的组合,即在任意两层间都存在一条通路,将信息从前面的神经网络层直接传递到后面的神经网络层,最终输出子时段t对应的预测结果y
t

123.在上述各实施例的基础上,作为一种可选实施例,如图6所示,需求预测模型是通过以下方式训练得到的:
124.通过神经网络模型得到每个训练样本对应的预测结果;
125.根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失;
126.若满足训练结束条件,则将所述神经网络模型作为所述需求预测模型;
127.若不满足训练结束条件,则基于训练损失对模型参数进行调整,并基于所述多个训练样本对调整后的模型继续训练,直至满足训练结束条件。
128.本技术实施例的训练损失可以通过预设的损失函数计算得到,损失函数可以为softmax函数、交叉熵损失函数等等,本技术实施例不作具体的限定。
129.本技术实施例的训练结束条件可以结合实际技术需要进行设置,在本技术的实施例中,该训练结束条件可以设置为最大迭代次数,若训练的迭代次数达到了最大迭代次数,则认为达到训练结束条件。该最大迭代次数的具体数值,可以结合实际技术需要进行设置,通常可以结合训练效率以及视频指纹特征的提取精度进行综合考虑。
130.在上述各实施例的基础上,作为一种可选实施例,每个所述样本区域属性信息序列包括样本区域在样本时段的区域属性信息,所述样本时段包括连续的多个子时段。
131.本技术实施例的训练样本的标签包括样本区域在样本时段的下一个子时段的公共设施需求信息的真实结果,在一些实施例中,每个训练样本的标签还包括样本区域在样本时段的公共设施需求信息的真实结果。
132.通过所述神经网络模型得到每个训练样本对应的预测结果,包括:
133.s301、对于样本时段中第一个子时段,根据第一个子时段的区域属性信息,获得第一个子时段的隐状态向量;
134.s302、对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;
135.s303、对于样本时段中的至少一个子时段,根据所述至少一个子时段的隐状态向量,获得所述训练样本对应的预测结果;训练样本对应的预测结果包括至少一个子时段中每个子时段对应的公共设施需求信息的预测结果。
136.本技术实施例的神经网络模型首先分别获得各个子时段的隐状态向量,其中第一
个子时段的隐状态向量仅根据该子时段的区域属性信息,而不涉及其他子时段的信息,对于除第一个子时段以外的其他子时段,则根据该子时段的区域属性信息以及该子时段的前一个子时段的隐状态向量,获得该子时段的隐状态向量。
137.本技术实施例在训练模型时,并不需要仅基于最后一个子时段的隐状态向量获得对应子时段的公共设施需求信息的预测结果,而是可以选取多个子时段,分别利用选取的多个子时段的隐状态向量,得到相应子时段对应的公共设施需求信息的预测结果,将多个子时段的对应的公共设施需求信息的预测结果作为训练样本对应的预测结果。这样获得的训练样本对应的预测结果是一个公共设施需求信息的预测结果的序列,可以捕捉公共设施需求的时序依赖,以此获得的模型具有更高的预测精度。
138.在上述各实施例的基础上,作为一种可选实施例,通过所述神经网络模型得到每个训练样本对应的预测结果,还包括:
139.对样本时段中每个子时段的区域属性信息进行编码,得到每个子时段的编码向量;
140.所述根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量,包括:根据所述第一个子时段的编码向量,获得所述第一个子时段的隐状态向量;
141.所述根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量,包括:
142.根据所述子时段的编码向量以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量。
143.本技术实施例在模型训练时,通过编码层对样本时段的每个子时段的区域属性信息进行特征提取,获得每个子时段的区域属性信息的编码向量(简称每个子时段的编码向量),可以理解的是,各个子时段的编码向量的维度相同。
144.本技术实施例的神经网络模型的编码层可以采用全连接层(dense layer)、归一化层以及激活函数层的连接架构,这种连接架构充分利用了每一子时段的区域属性信息,同时考虑了相邻子时段的区域属性的增量以建模复杂区域系统中微分形式的需求依赖关系。本技术实施例对于全连接层、归一化层以及激活函数层的层数不作限定,例如可以为图3中的全连接层31、归一化层32以及激活函数层33。本技术实施例的激活函数可以采用leaky relu函数(带泄露修正线性单元函数)或者elu激活函数。与relu函数及其变体相比,使用elu激活函数可在神经网络中缩短训练时间并提高准确度。
145.在上述各实施例的基础上,作为一种可选实施例,根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失,包括:
146.对于每个训练样本的预测结果中的每个子时段对应的预测结果,确定所述子时段对应的预测结果和真实结果的偏差,根据每个训练样本的各子时段对应的偏差的离散程度,确定所述训练损失。
147.由上述实施例可知,本技术实施例的每个训练样本的预测结果可以李继伟是多个子时段对应的预测结果构成的序列,在确定训练损失时,本技术实施例可以分别确定该序列中每个子时段对应的预测结果和真实结果间的偏差,然后根据该偏差的离散程度确定该训练损失。在一个实施例中,本技术实施例可以用均方误差来表征偏差的离散程度。
148.在上述各实施例的基础上,作为一种可选实施例,本技术实施例的每一子时段的
公共设施需求信息为相应子时段相对于前一子时段的公共设施需求的变化量。
149.需要说明的,在实际应用中不同地区的公共设施需求的绝对量的分布差异很大,直接以公共设施需求的绝对量进行训练和预测,存在一定的误差,而本技术实施例通过将绝对量转化为变化量,可以显著地降低预测误差。应当理解的是,当公共设施需求信息用于表征相应子时段相对于前一子时段的公共设施需求的变化量时,在获得当前时段的下一子时段的公共设施需求的变化量后,可以将该变化量与当前时刻的最后一个子时段的公共设施需求进行累加,即可获得当前时段的下一子时段的公共设施需求。
150.请参见图7,其示例性地示出了本技术再一个实施例的信息处理方法的流程示意图,如图所示,包括:
151.s401、获取多个训练样本,每个训练样本包括一个样本区域的样本区域属性信息序列,每个所述样本区域属性信息序列包括样本区域在样本时段的区域属性信息,所述样本时段包括连续的多个子时段,每个所述训练样本的标签为所述训练样本对应的公共设施需求信息的真实结果,每一子时段的公共设施需求信息为相应子时段相对于前一子时段的公共设施需求的变化量;
152.s402、对于样本时段中第一个子时段,根据第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
153.s403、对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;
154.s404、对于样本时段中的至少一个子时段,根据所述至少一个子时段的隐状态向量,获得所述训练样本对应的预测结果,训练样本对应的预测结果包括所述至少一个子时段中每个子时段对应的公共设施需求信息的预测结果;
155.s405、根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失;
156.s406、若满足训练结束条件,则将所述神经网络模型作为所述需求预测模型;若不满足训练结束条件,则基于训练损失对模型参数进行调整,并基于所述多个训练样本对调整后的模型继续训练,直至满足训练结束条件;
157.s407、获取目标区域在当前时段的当前区域属性信息序列,所述当前时段包括连续的多个子时段,所述当前区域属性信息序列包括所述多个子时段的区域属性信息;
158.s408、对于当前时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
159.s409、对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;
160.s410、根据当前时段中的最后一个子时段的隐状态向量,获得所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果;
161.s411、根据当前时段的下一子时段的公共设施需求信息的预测结果以及当前时段中最后一个子时段的公共设施需求,获得当前时段的下一子时段的公共设施需求。
162.请参见图8,图8示出了本技术的该场景实施例中适用的一种公共设施需求规划系统的结构示意图,如图所示,该公共设施需求规划系统包括用户终端、数据存储服务器和预
测服务器。
163.用户终端可以通过网络与预测服务器通信连接,用户终端可以是运行任一具有获取公共设施需求信息功能的应用程序的终端。本技术实施例对于应用程序的类型不作限定,可以是需要用户下载安装的应用,也可以是云应用,还可以是小程序中的办公应用,当用户需要获得目标区域的公共设施需求信息时,用户终端将目标区域在当前时段的当前区域属性信息序列通过网络上传至预测服务器。应当理解的是,当前时段包括连续的多个子时段;当前区域属性信息序列包括多个子时段的区域属性信息。
164.数据存储服务器存储了一定数量的带有标签的训练样本,还存储了基于训练样本训练得到的需求预测模型,每个所述训练样本包括一个样本区域的样本区域属性信息序列,每个所述训练样本的标签为所述训练样本对应的公共设施需求信息的真实结果。文本服务器可以对训练样本进行分类存储,即每个存储区间用于存储同一省级区域或者具有类似经济发展程度的样本区域对应的训练样本。
165.预测服务器调用数据存储服务器中存储的需求预测模型,以当前区域属性信息序列作为需求预测模型的输入,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果,并将该预测结果返回用户终端进行展示。
166.预测服务器还可以将获得的预测结果发送至数据存储服务器,由数据存储服务器在获得当前时段的下一子时段的公共设施需求信息的真实结果后,将真实结果和预测结果进行比对,若两者差异较大,则构建新的训练样本对需求预测模型的参数进行优化,该新的训练样本对应的样本时段中最后一个时段为该当前时段的下一子时段。
167.本技术实施例提供了一种信息处理装置,如图9所示,该信息处理装置可以包括:当前信息获取模块901以及预测模块902,其中,
168.当前信息获取模块901,用于获取目标区域在当前时段的当前区域属性信息序列,所述当前时段包括连续的多个子时段;所述当前区域属性信息序列包括所述多个子时段的区域属性信息;
169.预测模块902,用于将所述当前区域属性信息序列输入至预先训练的需求预测模型,通过所述需求预测模型得到所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果;
170.其中,所述需求预测模型是基于多个带有标签的训练样本对神经网模型进行训练得到的,每个所述训练样本包括一个样本区域的样本区域属性信息序列,每个所述训练样本的标签为所述训练样本对应的公共设施需求信息的真实结果。
171.本技术实施例的装置可执行本技术实施例所提供的方法,其实现原理相类似,本技术各实施例的装置中的各模块所执行的动作是与本技术各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
172.本技术实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现信息处理方法的步骤,与相关技术相比,通过将当前时段的当前区域属性信息序列输入需求预测模型,使得需求预测模型以区域属性信息为基础,充分拟合未来时段的公共设施需求,以此来捕捉区域公共设施需求随区域属性在时间尺度上的变化规律,极大地发掘了区域属性蕴含的信息,有效地提升预测效果,
达到准确地预测区域对公共设施的需求的目的。
173.作为一种可选实施例,每个子时段的区域属性信息包括以下至少一种:
174.所述目标区域在该子时段的至少一个属性维度的第一属性值;
175.所述第一属性值相对于上一子时段的变化量;
176.相应区域的相邻区域在该子时段的至少一个属性维度的第二属性值;
177.所述第二属性值相对于上一子时段的变化量;
178.各个目标公共设施的级别信息,其中,所述各个目标公共设施为第一区域中的公共设施,所述目标区域为所述第一区域中的子区域;
179.各个目标公共设施与所述目标区域的距离。
180.作为一种可选实施例,预测模块具体用于:
181.对于当前时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
182.对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;
183.根据当前时段中的最后一个子时段的隐状态向量,获得所述目标区域在当前时段的下一子时段的公共设施需求信息的预测结果。
184.作为一种可选实施例,预测模块还用于:对每个子时段的区域属性信息进行编码,得到每个子时段的编码向量;
185.预测模块根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量,包括:根据所述第一个子时段的编码向量,获得所述第一个子时段的隐状态向量;
186.预测模块根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量,包括:
187.根据所述子时段的编码向量以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量。
188.作为一种可选实施例,还包括模型训练模块,模型训练模块用于通过以下方式训练得到需求预测模型:
189.通过所述神经网络模型得到每个训练样本对应的预测结果;
190.根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失;
191.若满足训练结束条件,则将所述神经网络模型作为所述需求预测模型;若不满足训练结束条件,则基于训练损失对模型参数进行调整,并基于所述多个训练样本对调整后的模型继续训练,直至满足训练结束条件。
192.作为一种可选实施例,每个所述样本区域属性信息序列包括样本区域在样本时段的区域属性信息,所述样本时段包括连续的多个子时段;
193.模型训练模块用于:
194.对于样本时段中第一个子时段,根据所述第一个子时段的区域属性信息,获得所述第一个子时段的隐状态向量;
195.对于当前时段中的除所述第一个子时段之外的子时段,根据所述子时段的区域属性信息以及所述子时段的前一个子时段的隐状态向量,确定所述子时段的隐状态向量;对于样本时段中的至少一个子时段,根据所述至少一个子时段的隐状态向量,获得所述训练
样本对应的预测结果;
196.其中,所述训练样本对应的预测结果包括所述至少一个子时段中每个子时段对应的公共设施需求信息的预测结果。
197.作为一种可选实施例,模型训练模块根据各个训练样本的真实结果和预测结果之间的差异,确定训练损失,包括:
198.对于每个训练样本的预测结果中的每个子时段对应的预测结果,确定所述子时段对应的预测结果和真实结果的偏差,根据每个训练样本的各子时段对应的偏差的离散程度,确定所述训练损失。
199.作为一种可选实施例,每一子时段的公共设施需求信息为相应子时段相对于前一子时段的公共设施需求的变化量。
200.在一个可选实施例中提供了一种电子设备,如图10所示,图10所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本技术实施例的限定。
201.处理器4001可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
202.总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
203.存储器4003可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
204.存储器4003用于存储执行本技术实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
205.本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
206.本技术实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
207.为了验证本技术实施例的功能特性,使用3个省会城市的公共设施需求数据进行了实验。选取两类公共设施需求来预测——教育类(中小学)和医疗类(公立医院)。其中教育类设施在各城市为千量级,医疗类设施在各城市为十至百量级。这两类设施具有不同的数目和功能,作为公共设施的两种代表。
208.各城市按城市街道被划分为若干区域,其中a市共1918个区域、b市共3821个区域、c市共1906个区域。每个区域统计2019年11月至2021年7月共21个月的区域属性及公共设施需求数据。其中区域属性包括区域职、住人口及相应的年龄和性别分布、区域内各类poi分布。区域对公共设施需求体现为各月份到访每个公共设施的人数。
209.需求预测模型采用10个月的历史数据作为输入,预测下一个月的公共设施需求。需求预测模型中的densenet结构的深度为10层。
210.为了证明本技术实施例的性能表现,比较的基线算法为自回归预测方法以及随机森林。评价的指标选择均方根误差(rmse,rooted mean squared error)和通勤者共同部分占比(cpc,common part of commuters)。表1为本技术实施例对于医院需求的预测性能对比表,表2为本技术实施例对于学校需求的预测性能对比表。
[0211][0212]
表1医院需求的预测性能对比表
[0213][0214]
表2学校需求的预测性能对比表
[0215]
从表1和2中可以看出,对比最好的基线算法,本技术实施例能在rmse评价指标上达到30%的提升,在cpc指标上达到10%的提升。这意味着本方案可以大幅提升城市区域对公共设施需求的预测效果。
[0216]
本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除图示或文字描述以外的顺序实施。
[0217]
应该理解的是,虽然本技术实施例的流程图中通过箭头指示各个操作步骤,但是
这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本技术实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一子时段被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的子时段被执行。在执行子时段不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本技术实施例对此不限制。
[0218]
以上所述仅是本技术部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术的方案技术构思的前提下,采用基于本技术技术思想的其他类似实施手段,同样属于本技术实施例的保护范畴。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献