一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、计算机可读存储介质及计算机设备与流程

2023-04-01 18:31:45 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,具体涉及一种数据处理方法、装置、计算机可读存储介质及计算机设备。


背景技术:

2.对国家或地区的经济发展水平进行评估和监控,是政府工作的重要内容之一。对经济发展状况的准确评估,有助于政府作出更为良好的经济规划和决策。
3.目前,对区域经济发展水平的评估,还依赖于一年或五年一次的经济普查统计,这需要消耗大量的人力和时间,效率非常低下。


技术实现要素:

4.本技术实施例提供一种数据处理方法、装置、存储介质及计算机设备,该方法可以提高数据处理的效率,进而可以提高对目标区域的生产总值信息的计算效率。
5.本技术第一方面提供一种数据处理方法,方法包括:
6.获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,所述多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;
7.基于网格单元之间的位置关系以及所述至少两个维度的统计数据生成至少两个以所述多个网格单元为节点的图结构;
8.根据所述至少两个图结构构建图神经网络模型,并基于所述图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;
9.获取所述多个网格单元中预设数量个第一网格单元对应的第一生产总值信息,并根据所述预设数量个第一网格单元对应的第一特征向量以及所述第一生产总值信息训练预设回归模型,得到训练后的回归模型;
10.基于所述训练后的回归模型确定所述预设地理区域中的目标区域对应的目标生产总值信息。
11.相应的,本技术第二方面提供一种数据处理装置,装置包括:
12.获取单元,用于获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,所述多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;
13.生成单元,用于基于网格单元之间的位置关系以及所述至少两个维度的统计数据生成至少两个以所述多个网格单元为节点的图结构;
14.学习单元,用于根据所述至少两个图结构构建图神经网络模型,并基于所述图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;
15.训练单元,用于获取所述多个网格单元中预设数量个第一网格单元对应的第一生产总值信息,并根据所述预设数量个第一网格单元对应的第一特征向量以及所述第一生产
总值信息训练预设回归模型,得到训练后的回归模型;
16.计算单元,用于基于所述训练后的回归模型计算所述预设地理区域中的目标区域对应的目标生产总值信息。
17.在一些实施例中,所述生成单元,包括:
18.第一生成子单元,用于获取网格单元之间的位置关系数据,并根据所述位置关系数据生成网格单元之间的第一图结构;
19.第二生成子单元,用于从所述至少两个维度的统计数据中提取网格单元之间的功能属性关系数据,并根据所述功能属性关系数据生成网格单元之间的第二图结构;
20.第三生成子单元,用于从所述至少两个维度的统计数据中提取网格单元之间的交互关系数据,并根据所述交互关系数据生成网格单元之间的第三图结构;
21.所述学习单元,还用于:
22.根据所述第一图结构、所述第二图结构以及所述第三图结构构建图神经网络。
23.在一些实施例中,所述第一生成子单元,包括:
24.确定模块,用于根据所述位置关系数据确定网格单元之间的相邻关系;
25.生成模块,用于根据所述相邻关系生成相邻关系矩阵;
26.构建模块,用于以所述多个网格单元为节点,以所述相邻关系矩阵为边构建网格单元之间的第一图结构。
27.在一些实施例中,所述学习单元,包括:
28.学习子单元,用于基于预设的损失函数对所述图神经网络中包含的多个子图神经网络模型进行无监督学习训练,得到训练后的多个子图神经网络模型;
29.输入子单元,用于将所述每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据输入至所述训练后的多个子图神经网络模型,得到每一网格单元对应的多个子特征向量;
30.第一确定子单元,用于根据每一网格单元对应的多个子特征向量确定每一网格单元对应的特征向量。
31.在一些实施例中,所述确定子单元,包括:
32.获取模块,用于获取每一子特征向量对应的权重系数;
33.求和模块,用于基于所述每一子特征向量对应的权重系数对所述多个子特征向量进行加权求和,得到每一网格单元对应的特征向量。
34.在一些实施例中,所述获取单元,包括:
35.第一获取子单元,用于获取预设地理区域的第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据;
36.第一划分子单元,用于基于预设规则对所述地理区域进行划分,得到多个网格单元;
37.第二划分子单元,用于基于所述预设规则对所述第一遥感影像数据、所述第一人口流动数据、所述第一基础设施统计数据以及所述第一道路网络数据进行划分,得到每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据;
38.所述生成单元,还用于:
39.基于网格单元之间的位置关系以及每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据生成至少两个以所述多个网格单元为节点的图结构。
40.在一些实施例中,所述计算单元,包括:
41.第二获取子单元,用于获取测试数据集合,所述测试数据集合包括所述多个网格单元中第二预设数量个第二网格单元对应的第二生产总值信息;
42.测试子单元,用于采用所述测试数据集合对所述训练后的回归模型进行精度测试;
43.第一计算子单元,用于当所述精度测试的结果指标数值大于预设阈值时,基于所述训练后的回归模型计算所述预设地理区域中的目标区域对应的目标生产总值信息。
44.在一些实施例中,所述计算单元,包括:
45.第二确定子单元,用于在所述多个网格单元中确定与目标区域对应的多个第三网格单元并确定每一第三网格单元对应的第三特征向量;
46.第二计算子单元,用于将每一第三特征向量输入至所述训练后的回归模型,得到每一第三网格单元对应的第三生产总值信息,并基于所述第三生产总值信息计算所述目标区域的目标生产总值信息。
47.本技术第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本技术第一方面所提供的数据处理方法的步骤。
48.本技术第四方面提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本技术第一方面所提供的数据处理方法的步骤。
49.本技术第五方面提供一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行第一方面所提供的数据处理方法的步骤。
50.本技术实施例提供的数据处理方法,通过获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。以此,通过将地理区域划分为多个网格单元,并基于每个网格单元与生产总值信息关联的统计数据以及网格单元之间的位置关系构建图神经网络以对每一网格单元进行表征学习,再采用每个网格单元表征学习得到的向量与已知的标签数据训练回归模型,如此便可以采用训练后的回归模型自动对地理区域中每个网格单元对应的生产总值信息进行预测,提高了区域生产总值信息的预测效率,也就提升了对区域经济发
展水平进行评估的效率。
附图说明
51.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
52.图1是本技术中数据处理的一个场景示意图;
53.图2是本技术提供的数据处理方法的流程示意图;
54.图3是本技术提供的数据处理方法的另一流程示意图;
55.图4是本技术多视图图神经网络模型的结构示意图;
56.图5是本技术提供的数据处理装置的结构示意图;
57.图6是本技术提供的终端的结构示意图;
58.图7是本技术提供的服务器的结构示意图。
具体实施方式
59.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
60.本发明实施例提供一种数据处理方法、装置、计算机可读存储介质及计算机设备。其中,该数据处理方法可以使用于数据处理装置中。该数据处理装置可以集成在计算机设备中,该计算机设备可以是终端也可以是服务器。其中,终端可以为手机、平板电脑、笔记本电脑、智能电视、穿戴式智能设备、个人计算机(pc,personal computer)等设备。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
61.请参阅图1,为本技术提供的数据处理的一场景示意图;如图所示,当计算机设备a获取预设地理区域中每个网格单元对应的与生产总值信息关联的至少两个维度的统计数据,网格单元为按照预设规则对预设地理区域进行划分得到的子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
62.需要说明的是,图1所示的数据处理的场景示意图仅仅是一个示例,本技术实施例描述的数据处理场景是为了更加清楚地说明本技术的技术方案,并不构成对于本技术提供
的技术方案的限定。本领域普通技术人员可知,随着数据处理的演变和新业务场景的出现,本技术提供的技术方案对于类似的技术问题,同样适用。
63.基于上述实施场景以下分别进行详细说明。
64.本技术实施例将从数据处理装置的角度进行描述,该数据处理装置可以集成在计算机设备中。其中,计算机设备可以是终端,该终端可以为手机、平板电脑、笔记本电脑、智能电视、穿戴式智能设备、个人计算机(pc,personal computer)等设备。如图2所示,为本技术提供的数据处理方法的流程示意图,该方法包括:
65.步骤101,获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据。
66.其中,在相关技术中,对区域的经济发展水平进行评估,一般采用区域的国内生产总值(gross domestic product,gdp)作为评估指标来进行评价。gdp是一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是国民经济核算的核心指标,也是衡量一个国家或地区经济状况和发展水平的重要指标。在本技术实施例中,可以将gdp作为评估区域经济发展水平的指标对本技术提供的方案进行详细说明。一般情况下,政府部门为了作出更好的政策决策和发展规划,需要对国家或地区的生产总值数据进行定期的统计,而目前对生产总值数据的统计还依赖于人工的经济普查,统计效率十分低下。为此,本技术提供一种数据处理方法,可以提高对区域生产总值进行计算的效率,进而可以提升对经济发展水平进行评估的效率。下面对本技术提供的数据处理方法进行进一步详细描述。
67.首先,在对区域进行生产总值评估之前,先确定包含该区域的预设地理区域。例如,若需要对深圳市的经济发展水平进行评估时,可以确定预设地理区域为广东省,或者是包含深圳市的其他预设地理区域,例如全中国或者全球范围。一般情况下,确定一个比需要评估的区域稍大一些的预设地理区域即可,无需将预设地理区域设定过大。具体地,可以根据预设地理区域中与生产总值信息关联的统计数据方便统计为准来确定预设地理区域。
68.在确定了预设地理区域后,可以将预设地理区域按照预设的规则进行划分,得到多个网格单元,此处网格单元也就是一块块的地块单元。其中,对预设地理区域进行划分可以按照规则格网进行划分,得到多个形状相同的网格单元;也可以按照道路网络数据或者行政区划边界数据对预设地理区域进行划分,得到形状不规则的多个网格单元。其中,规则格网可以采用公里网格、六边形网格等;道路网络数据可以包含各层级道路,例如高速公路、国道、省道以及城市主干道等,可得到不规则但符合地理空间格局及土地功能分布的网格单元。
69.在将预设地理区域划分得到多个网格单元后,对每一网格单元与生产总值关联的统计数据进行获取。其中,与生产总值关联的统计数据包括但不限于卫星遥感影像数据、时空轨迹数据、感兴趣点(point of interest,poi)数据以及道路网络数据等。在本技术实施例中,可以获取上述至少两个维度的统计数据,以避免单一数据源估算不准确的情况。
70.在一些实施例中,获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,包括:
71.1、获取预设地理区域的第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据;
72.2、基于预设规则对地理区域进行划分,得到多个网格单元;
73.3、基于预设规则对第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据进行划分,得到每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据。
74.其中,在一些实施例中,当网格单元为以规则格网进行划分得到时,由于部分与生产总值信息关联的统计数据往往以行政区划进行统计,对单个规则格网中与生产总值信息关联的统计数据进行统计并不方便,此时可以获取整个预设地理区域的统计数据,再根据预设的划分规则对这些统计数据进行划分,得到每一网格单元对应的统计数据。其中,与生产总值关联的统计数据可以包含遥感影像数据、人口流动数据、基础设施统计数据以及道路网络数据。其中,遥感影像数据包括但不限于多谱影像、夜间灯光遥感影像等;人口流动数据包括但不限于基于手机定位的人口移动数据、公交交通流数据等;基础设施统计数据包括但不限于购物、美食、生活服务、医疗、教育等类别的基础设施的统计数据;道路网络数据包括但不限于道路交通设施建设密度、公交站点密度等数据。
75.那么具体地,可以先获取预设地理区域对应的第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据。然后,再基于预设的划分规则对预设地理区域对应的统计数据进行划分,得到每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据。
76.在一些实施例中,也可以直接对每一网格单元的上述与生产总值信息关联的至少两个维度的统计数据进行获取。
77.步骤102,基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构。
78.其中,在获取到每个网格单元对应的与生产总值信息关联的至少两个维度的统计数据之后,可以进一步根据每个网格单元对应的与生产总值信息关联的统计数据确定不同网格单元之间的联系。例如,可以根据不同网格单元对应的基础设施统计数据确定网格单元之间的功能属性相似关系。具体地,例如若两个网格单元中均具有较多的厂房,那么这两个网格单元的功能属性可能都是工业区;若两个网格单元中均具有较多的商超,那么这两个网格单元的功能属性可能都是住宅区。那么如果都是工业区或者都是住宅区的话,这两个网格单元的功能属性相似度就比较高,若两者属于不同的功能区,那么其功能属性相似度就较低。
79.在确定了每个网格单元之间的功能属性相似关系后,可以根据该功能属性相似关系生成功能属性相似关系图。除此之外,还可以根据网格单元之间的位置关系生成网格单元之间的位置关系图;也可以根据网格单元之间人员流动交互的情况生成空间交互图。在本技术实施例中,至少可以根据网格单元之间的位置关系生成位置关系图,以及可以根据至少两个维度的统计数据生成网格单元之间的另一个关系图,得到以多个网格单元为节点的至少两个图结构,至少两个图结构构成了一个多视图图结构。
80.在一些实施例中,基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构,包括:
81.1、获取网格单元之间的位置关系数据,并根据位置关系数据生成网格单元之间的第一图结构;
82.2、从至少两个维度的统计数据中提取网格单元之间的功能属性关系数据,并根据
功能属性关系数据生成网格单元之间的第二图结构;
83.3、从至少两个维度的统计数据中提取网格单元之间的交互关系数据,并根据交互关系数据生成网格单元之间的第三图结构。
84.其中,在本技术实施例中,可以对划分得到的多个网格单元之间的位置关系进行获取,其中,位置关系可以包括相邻关系和距离关系等。然后根据网格单元之间的位置关系生成以网格单元为节点,以位置关系为边的第一图结构,该第一图结构即为上述位置关系图。
85.然后,可以从每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据中提取出网格单元之间的功能属性关系数据。具体地,可以从每一网格单元对应的遥感影像数据、人口流动数据、基础设施统计数据以及道路网络数据中提取网格单元之间的功能属性关系,如前所述,具体可以根据每一网格单元对应的基础设施统计数据确定网格单元之间的功能属性关系数据。提取到网格单元之间的功能属性关系数据后,可以以网格单元为节点,以网格单元之间的功能属性关系为边生成第二图结构,该第二图结构即为上述功能属性相似关系图。
86.进一步地,可以从从每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据中提取出网格单元之间的交互关系数据,具体地,可以从每一网格单元对应的人口流动数据确定网格单元之间的交互关系数据。然后,可以以网格单元为节点,以网格单元之间的交互关系数据为边生成网格单元之间的第三结构图,该第三结构图即为上述空间交互图。
87.在一些实施例中,根据位置关系数据生成网格单元之间的第一图结构,包括:
88.1.1、根据位置关系数据确定网格单元之间的相邻关系;
89.1.2、根据相邻关系生成相邻关系矩阵;
90.1.3、以多个网格单元为节点,以相邻关系矩阵为边构建网格单元之间的第一图结构。
91.其中,在获取到网格单元之间的位置关系后,可以具体确定网格单元之间的相邻关系,即两个网格单元之间是否相邻。在确定了网格单元之间的相邻关系后,可以根据相邻关系生成相邻关系矩阵,或者称为邻接矩阵。进一步地,可以以多个网格单元为节点,以邻接矩阵表征节点之间的边集合,从而生成网格单元之间的第一图结构。
92.相应地,在一些实施例中,根据网格单元之间的相似关系,也可以生成相似矩阵,再以网格单元为节点以相似矩阵表征节点之间的边集合,生成网格单元之间的第二图结构。
93.同样地,在一些实施例中,根据网格单元之间的交互关系,也可以生成交互矩阵,再以网格单元为节点以交互矩阵表征节点之间的边集合,生成网格单元之间的第三图结构。
94.步骤103,根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量。
95.其中,在根据网格单元之间的位置关系以及每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据生成至少两个以前述多个网格单元为节点的图结构之后,可以基于这至少两个图结构构建图神经网络模型,具体可以构建得到一个多视图图神经网
络模型。其中,该多视图图神经网络模型可以为多个单独的图神经网络模型组成,每个图结构可以对应一个单独的图神经网络模型,此处单独的图神经网络模型也可以称为子图神经网络模型。
96.在一些实施例中,当根据网格单元之间的位置关系以及每一网格单元对应的与生产总值关联的统计数据生成三个图结构时,根据这三个图结构构建得到的图神经网络模型也就包含三个子图神经网络模型。其中,每个子图神经网络模型与一个图结构对应,此处子图神经网络模型可以为图卷积神经网络。图卷积神经网络将卷积运算从传统数据(例如图像数据)推广到图数据。其核心思想是学习一个函数映射,通过该函数映射图中的节点可以聚合它自己的特征以及它的邻居特征来生成节点的新表示,图卷积神经网络是许多复杂图神经网络模型的基础。
97.在根据至少两个图结构构建得到图神经网络模型后,对该图神经网络模型进行无监督训练,得到训练后的图神经网络模型。然后,再逐一将每个网格单元对应的特征输入至该图神经网络模型中,得到每一网格单元对应的特征向量。
98.在一些实施例中,基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量,包括:
99.1、基于预设的损失函数对图神经网络中包含的多个子图神经网络模型进行无监督学习训练,得到训练后的多个子图神经网络模型;
100.2、将每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据输入至训练后的多个子图神经网络模型,得到每一网格单元对应的多个子特征向量;
101.3、根据每一网格单元对应的多个子特征向量确定每一网格单元对应的特征向量。
102.其中,在构建得到图神经网络模型之后,可以设计对该图神经网络模型进行训练的损失函数。在本技术实施例中,图神经网络模型的损失函数可以由各类特征重构损失、不同网格单元对比损失以及不同模态分类损失按照一定的权重进行加权求和确定。
103.在确定了对图神经网络模型进行训练的损失函数后,基于该损失函数对图神经网络模型进行训练,得到训练后的图神经网络模型,训练后的图神经网络模型包含多个子图神经网络模型,此处子图神经网络模型为训练后的子图神经网络模型。对于任意目标子图神经网络模型,都可以确定每一网格单元经其处理后得到的子特征向量。那么,对于任意一个网格单元,可以确定其经每个训练后的多个子图神经网络输出的多个子特征向量,将该网格单元对应的多个子特征进行加权求和,便可以得到每一网格单元对应的特征向量。
104.在一些实施例中,根据每一网格单元对应的多个子特征向量确定每一网格单元对应的特征向量,包括:
105.3.1、获取每一子特征向量对应的权重系数;
106.3.2、基于所述每一子特征向量对应的权重系数对所述多个子特征向量进行加权求和,得到每一网格单元对应的特征向量。
107.其中,在获取到每个网格单元对应的多个子特征向量之后,可以进一步获取每个子特征向量对应的权重系数。具体地,可以根据每一图结构对应的数据与生产总值之间的关联关系确定每一子特征向量对应的权重系数。例如,当位置关系图、功能属性相似图以及空间交互图对生产总值的关联关系比例关系为2:3:5时,那么便可以确定位置关系图对应的子图神经网络模型的输出权重为20%,功能属性相似图对应的子图神经网络模型的输出
权重为30%,空间交互图对应的子图神经网络模型的输出权重为50%。如此进一步可以确定该三个子图神经网络模型输出的子特征向量对应的权重系数。在获取到每个子特征向量对应的权重系数后,可以进一步基于每个子特征向量对应的权重系数对多个子特征向量进行加权求和,得到每一网格单元对应的特征向量。
108.步骤104,获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型。
109.其中,在确定了每一网格单元对应的特征向量之后,从多个网格单元中确定第一预设数量个第一网格单元并对该第一预设数量个网格单元对应的第一生产总值信息进行获取。具体地,例如将预设地理区域划分得到10000个网格单元后,可以从该10000个网格单元中确定100个具有代表性的网格单元作为第一网格单元,然后对这100个第一网格单元的第一生产总值信息进行获取。其中,对这第一预设数量个第一网格单元的生产总值信息进行获取,可以根据这些网格单元对应的统计年鉴数据进行获取,也可以为对这些区域进行实地的人工统计进行获取。即这些第一网格单元对应的第一生产总值信息为这些第一网格单元的实际生产总值信息。进一步地,由于在步骤103中已经确定了每一网格单元对应的特征向量,那么便可以据此确定前述第一预设数量个第一网格单元对应的第一特征向量。进一步地,可以采用第一特征向量以及第一生产总值信息作为训练样本训练一个预设回归模型,得到训练后的回归模型。其中第一特征向量为预设回归模型的输入,第一生产总值信息为预设回归模型的输出对应的标签。
110.步骤105,基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
111.其中,在对预设回归模型进行训练得到训练后的回归模型后,可以将该训练后的回归模型部署到使用场景中进行生产总值预估。在本技术中,由于通过训练后的回归模型可以对预设地理区域中任一网格单元的生产总值信息进行计算,因此训练后的回归模型可以对预设地理区域内的目标区域进行目标生产总值信息的计算。具体地,例如预设地理区域为广东省时,则可以采用上述预设回归模型对广东省内任意目标区域的生产总值信息进行计算。
112.在一些实施例中,基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息,包括:
113.1、在多个网格单元中确定与目标区域对应的多个第三网格单元并确定每一第三网格单元对应的第三特征向量;
114.2、将每一第三特征向量输入至训练后的回归模型,得到每一第三网格单元对应的第三生产总值信息,并基于第三生产总值信息计算目标区域的目标生产总值信息。
115.其中,在使用训练后的回归模型对目标区域的生产总值信息进行计算时,可以先确定目标区域中包含的网格单元具体为哪些网格单元。然后再逐一对目标区域中包含的网格单元的生产总值信息进行获取,最终根据目标区域中包含的网格单元对应的生产总值信息计算得到目标区域的生产总值信息。具体地,例如预设地理区域为广东省,将广东省划分为10000网格单元,那么如果需要对中山市的生产总值信息进行计算,可以先从广东省对应的10000个网格单元中确定出中山市对应的区域中包含的多个目标网格单元,此处可以称
为第三网格单元。假设中山市包含了500个第三网格单元,那么便可以根据步骤103中确定的每一网格单元对应的特征向量中获取到该500个第三网格单元对应的第三特征向量。将这500个第三特征向量逐一输入至训练后的回归模型中,得到训练后的回归模型输出的500个第三生产总值信息,最后对这500个第三生产总值信息进行求和,便可以得到中山市的生产总值信息。
116.在一些实施例中,基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息,包括:
117.a、获取测试数据集合,测试数据集合包括多个网格单元中第二预设数量个第二网格单元对应的第二生产总值信息;
118.b、采用测试数据集合对训练后的回归模型进行精度测试;
119.c、当精度测试的结果指标数值大于预设阈值时,基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
120.在本技术实施例中,在对预设回归模型进行训练得到训练后的回归模型之后,可以采用测试数据集合对回归模型的精度进行测试。其中,测试数据集合可以为多个网格单元中与训练数据集中网格单元不同的网格单元及其对应的生产总值信息组成。例如前述对预设回归模型进行训练时,采用10000个网格单元中具有代表性的100个网格单元及其生产总值信息作为训练样本。那么在对训练后的回归模型进行精度检测时,可以采用这100个网格单元以外的其他网格单元,例如可以取50个。对这50个网格单元,分别获取其对应的特征向量以及网格单元对应的生产总值信息。这50个网格单元的生产总值信息可以根据这些网格单元对应的统计年鉴数据进行获取,也可以为对这些网格单元对应的区域进行实地的人工统计进行获取。
121.根据上述描述可知,本技术实施例提供的数据处理方法,通过获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。以此,通过将地理区域划分为多个网格单元,并基于每个网格单元与生产总值信息关联的统计数据以及网格单元之间的位置关系构建图神经网络以对每一网格单元进行表征学习,再采用每个网格单元表征学习得到的向量与已知的标签数据训练回归模型,如此便可以采用训练后的回归模型自动对地理区域中每个网格单元对应的生产总值信息进行预测,提高了区域生产总值信息的预测效率,也就提升了对区域经济发展水平进行评估的效率。
122.相应地,本技术实施例将从计算机设备的角度进一步对本技术提供的数据处理方法进行详细的描述,其中计算机设备可以为终端也可以为服务器。如图3所示,为本技术提供的数据处理方法的另一流程示意图,该方法包括:
123.步骤201,计算机设备将预设地理区域划分为多个地块单元。
124.其中,预设地理区域可以根据需要进行经济发展水平评估的目标区域来确定,预设地理区域与可以是包含目标区域的任意地理区域。具体地,当需要对广东省各市区的经济发展水平进行评估时,可以将预设地理区域确定为广东省,当然也可以将预设地理区域确定为中国或者全球。可以理解的是,预设地理区域确定得越大,那么可以进行经济水平评估的范围就越大,从而扩大了本技术提供的方法的适用范围;然而预设地理区域确定个得越大,也会导致需要获取以及处理的数据计算量增大,进而导致评估效率下降。
125.对区域的经济发展水平进行评估,可以采用一些区域经济发展的评价指标来进行评估,区域经济发展的评价指标包括但不限于gdp、财政收入、城镇居民可支配收入以及恩格尔系数等,在本技术实施例中,可以采用gdp作为对经济发展水平进行评估的指标为例进行详细介绍本技术提供的数据处理方法。
126.在确定了预设地理区域后,可以将该预设地理区域按照预设的规则进行划分,得到多个地块单元。其中,划分规则可以为按照规则格网、道路网络数据或者行政区划边界数据进行划分。可以理解的是,上述对预设地理区域进行地块划分的方法仅是示例,对预设地理区域还可以按照其他预设规则进行划分,此处不做限定。划分得到的多个地块单元可以采用地块单元集合进行表示:其中,ri代表第i个地块单元,n表示地块单元的总数量。
127.步骤202,计算机设备获取每个地块单元的遥感影像数据、时空轨迹数据、感兴趣点数据以及道路网络数据。
128.其中,在将预设地理区域划分为多个地块单元,得到地块单元集合之后,可以进一步对每个地块单元的遥感影像数据、时空轨迹数据、感兴趣点数据以及道路网络数据进行获取。其中,遥感影像数据可以为卫星遥感影像数据,具体可以包括多光谱影像以及夜间灯光遥感影像等。获取到遥感影像数据后,可以进一步提取影像中的光谱、纹理、形状等特征。时空轨迹数据,可以包括基于手机定位的人口移动数据、公交交通流数据等,可以将其统计到地块单元的尺度,如此便可以得到每个地块单元内的人群活动强度以及地块单元之间的人员交互强度。感兴趣点数据可以包括地块单元内的基础设施数据,包括但不限于购物中心、美食广场、生活服务中心、医疗机构、金融机构以及教育机构等。道路网络包括地块单元内道路设施的建设密度以及交通便利度。例如设施建设密度可以用道路建设密度、公交站点密度等指标表征,交通便利度可以用区域内的交通站点可达性衡量。
129.其中,上述遥感影响数据、时空轨迹数据、感兴趣点数据以及道路网络数据均为与地块的生产总值信息相关联的不同维度的统计数据,可以理解的是,与地块的生产总值信息相关联的统计数据可以包括除此以外的其他维度,此处仅为示例,不作为对本技术方案的限制。在本技术中,可以采用一个维度的统计数据,也可以采用多个维度的统计数据。当采用多个维度的统计数据时,可以避免单一数据源估算不准确的情况,从而可以提高对每个地块生产总值信息预估的准确性。
130.步骤203,计算机设备根据每个地块单元的遥感影像数据、时空轨迹数据、感兴趣点数据以及道路网络数据构建多视图图结构。
131.其中,在获取到每个地块单元的遥感影像数据、时空轨迹数据、感兴趣点数据以及道路网络数据之后,可以从这些统计数据中提取地块单元之间的关联关系。其中,地块单元之间的关联关系可以从多个维度进行评价,那么就可以得到多个维度的地块单元之间的关
联关系,然后再根据每个维度的关联关系构建由地块单元为节点的图结构,得到多个图结构,即构建得到多视图结构。
132.首先,可以根据对地块单元的划分情况确定地块之间的相邻关系,并根据地块之间的相邻关系构建空间邻接图,空间邻接图可以表示为:
133.g
adj
=(v,e
adj
)
134.其中,g
adj
表示空间邻接图;v表示空间邻接图的节点集合,对应于地块单元集合r;e
adj
表示空间邻接图的边集合,以邻接矩阵a
adj
表示,其中邻接矩阵a
adj
可以表达如下:
[0135][0136]
其中,表示邻接矩阵a
adj
第i行第j列的值,ri表示集合r中第i个元素,rj表示集合r中第j个元素。
[0137]
然后,可以根据每个地块单元的感兴趣点的统计数据,计算每两个地块单元之间的功能相似度,得到地块单元之间的功能相似关系。例如某地块为工业用地、住宅用地、商业用地等,功能越相似,两者之间的功能相似度越高。进一步地,可以根据地块单元之间的功能相似关系构建功能相似图:
[0138]gsim
=(v,e
sim
)
[0139]
其中,g
sim
表示相似关系图;v表示相似关系图的节点集合,对应于地块单元集合r;e
sim
表示相似关系图的边集合,以相似矩阵a
sim
表示,其中:
[0140][0141]
其中,表示相似矩阵a
sim
第i行第j列的值,ri为地块单元集合中第i个地块单元,rj为地块单元集合中第j个地块单元。sim(a,b)表示计算a,b两者的相似度,具体地,可以为计算两个地块单元的主要属性对应的词向量的余弦相似度。
[0142]
进一步地,还可以根据时空轨迹数据确定地块单元之间的交互关系,并根据交互关系构建空间交互图:
[0143]gflw
=(v,e
flw
)
[0144]
其中,g
flw
表示空间交互图;v表示空间交互图的节点集合,对应于地块单元集合r;e
flw
表示空间交互图的边集合,以交互矩阵a
flw
表示,其中:
[0145][0146]
其中,表示交互矩阵a
flw
第i行第j列的值,s
ij
表示地块单元ri和rj之间的交互强度,β为突出空间作用变化的膨胀因子。
[0147]
其中,空间邻接图、相似关系图以及空间交互图共同构成了多视图图结构g,其中:
[0148]
g={g
adj
,g
sim
,g
flw
}
[0149]
步骤204,计算机设备基于多视图图结构构建多视图图神经网络模型,并对多视图图神经网络模型进行训练,得到训练后的多视图图神经网络模型。
[0150]
其中,在基于获取的统计数据生成了多视图图结构g之后,可以进一步根据多视图图结构g构建多视图图神经网络(multi-view graph neuralnetwork,mv-gnn)g。其中多视
图图神经网络g也包含了多个单一视图图神经网络g1、g2以及g3。对于每一个单一视图图神经网络,其核心网络可以为图卷积神经网络(graph convolutional network,gcn),也可以是gcn的变体,如图变换神经网络(graph transformer network,gtn)。
[0151]
对于任意一个地块单元,可以将其统计数据进行合并并据此确定该地块的地块属性特征x,然后将x输入至每一单一视图图神经网络中,得到每一单一视图图神经网络输出的隐向量:
[0152]hk
=gk(x,ak)
[0153]
其中,hk为第k个单一视图图神经网络输出的特征向量,ak为第k个单一视图图神经网络对应视图的关系矩阵,具体地,ak∈{a
adj
,a
sim
,a
flw
}。在得到地块单元与每一单一试图图神经网络对应输出的隐向量后,可以通过跨视图融合模块得到该地块单元对应的全局隐向量:
[0154][0155]
其中,h为地块单元对应的全局隐向量,wk为第k个视图对应的权重,n为视图总数,此处n=3。
[0156]
然后,进一步设计对多试图图神经网络模型进行训练的损失函数,具体地,可以设计特征重构损失l
rec
,不同地块单元对比损失l
con
以及不同模态分类损失l
mod
等,并通过加权求和得到最后的损失:
[0157]
l=l
rec
α1l
con
α2l
mod
[0158]
其中,α1和α2为l
con
和l
mod
对应的权重。
[0159]
通过上述损失函数,对构建的多视图图神经网络模型进行训练,使得地块单元输出的隐向量之间的关系逐渐趋近于地块单元对应的特征x之间的关系,从而完成对多视图图神经网络模型的训练。
[0160]
如图4所示,为本技术多视图图神经网络模型的结构示意图。如图所示,多视图图神经网络的输入数据为每个地块单元的属性特征x,其中,属性特征x为根据每个地块单元的统计数据组合生成的,统计数据包括卫星影像数据、poi数据、时空轨迹数据以及路网数据。多视图图神经网络模型的学习目标是由特征重构损失、地块对比损失以及模态分类损失共同构成的损失函数来界定的。而多视图图神经网络具体结构是由三个图结构对应的三个单一视图gnn组成的,每一单一视图gnn对输入的网格单元的属性特征进行卷积处理都会都到一个对应的隐向量,再由跨视图融合模块将这些隐向量进行融合得到多视图图神经网络输出的特征向量。基于上述设定的损失函数对多视图图神经网络模型进行训练,确定损失函数最小时对应多视图图神经网络模型最优的模型参数,从而完成对多视图图神经网络的训练。
[0161]
步骤205,计算机设备基于训练后的多视图图神经网络模型确定每一地块单元对应的特征向量。
[0162]
其中,在完成对多视图图神经网络模型g的训练之后,即完成了对每个地块单元的表征学习,得到每个地块单元与每一单一视图图神经网络模型对应的子特征向量。
[0163]
然后,进一步基于每个地块单元与每一单一视图图神经网络模型对应的子特征向量以及每一单一视图图神经网络模型对应的权重系数计算得到每一地块单元经多视图图
神经网络模型输出的特征向量,从而得到每一地块单元对应的特征向量。
[0164]
步骤206,计算机设备获取地块单元集合中预设数量的地块单元对应的gop数据,并根据预设数量的地块单元对应的特征向量以及gdp数据训练预设回归模型,得到训练后的回归模型。
[0165]
其中,在确定了每个地块单元对应的特征向量之后,可以从地块单元集合中确定预设数量的第一地块单元。这些地块单元应该在预设地理区域中分布较为均匀,然后可以根据前述确定了每个地块单元对应的特征向量中确定这些第一地块单元对应的第一特征向量,得到预设数量的第一特征向量。
[0166]
然后,对这预设数量个地块单元的gdp数据进行获取,其中,可以从社会经济统计数据或者统计年鉴获取到该预设数量个地块单元的gdp数据,这些gdp数据组成数据集其中yi为第i个第一地块单元对应的gdp数据,n为预设数量,其中n<n。那么便可以得到每一第一特征向量对应的gdp数据,每一第一特征向量与其对应的gdp数据构成一组训练数据,总计得到n组训练数据的训练样本数据。然后采用该包含n组训练数据的训练样本数据对预设的回归模型进行训练。具体地,将每一第一特征向量作为模型的输入,将第一特征向量对应的gdp数据作为模型输出的标签对模型进行训练,得到训练后的回归模型。
[0167]
步骤207,计算机设备确定目标区域中包含的目标地块单元。
[0168]
其中,在对目标区域进行经济发展水平评估时,需要先对目标区域包含的目标地块单元进行确定。如前所述,由于预设地理区域为包含了目标区域的地理区域,因此目标区域一定可以由地块单元集合中的部分地块单元构成。那么在确定了需要进行经济发展水平评估的目标区域后,可以在预设地理区域中确定该目标区域,然后可以进一步确定该目标区域包含目标数量个的目标地块单元。具体例如将广东省划分为10000个地块单元,那么需要对深圳市进行经济发展水平评估时,可以先从这10000个地块单元中确定深圳市对应的800个目标地块单元。
[0169]
步骤208,计算机设备确定每一目标地块单元对应的目标特征向量。
[0170]
其中,在地块单元集合中确定了目标区域对应的目标数量个目标地块单元后,可以进一步确定每一目标地块单元对应的目标特征向量。其中,由于在步骤205中已经确定了每一地块单元对应的特征向量,那么此时只需从地块单元和特征向量的映射关系中确定与每一目标地块单元对应的目标特征向量,得到目标数量个目标特征向量。
[0171]
步骤209,计算机设备将目标特征向量输入至训练后的回归模型,得到输出的目标数量个gdp数值,并根据目标数量个gdp数值计算得到目标区域的目标gdp。
[0172]
其中,在确定了目标区域对应的目标数量个目标特征向量之后,可以将这些目标特征向量输入至训练后的回归模型中,得到回归模型输出的与每一目标特征向量对应的gdp数值,总计得到目标数量个gdp数值。进一步地,可以将这目标数量个gdp数值进行求和,便可以得到目标区域对应的目标gdp。然后,可以进一步根据目标区域的目标gdp对该目标区域的经济发展水平进行评估。
[0173]
根据上述描述可知,本技术实施例提供的数据处理方法,通过获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系
以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。以此,通过将地理区域划分为多个网格单元,并基于每个网格单元与生产总值信息关联的统计数据以及网格单元之间的位置关系构建图神经网络以对每一网格单元进行表征学习,再采用每个网格单元表征学习得到的向量与已知的标签数据训练回归模型,如此便可以采用训练后的回归模型自动对地理区域中每个网格单元对应的生产总值信息进行预测,提高了区域生产总值信息的预测效率,也就提升了对区域经济发展水平进行评估的效率。
[0174]
为了更好地实施以上方法,本发明实施例还提供一种数据处理装置,该数据处理装置可以集成在终端中。
[0175]
例如,如图5所示,为本技术实施例提供的数据处理装置的结构示意图,该数据处理装置可以包括获取单元301、生成单元302、学习单元303、训练单元304以及计算单元305,如下:
[0176]
获取单元301,用于获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;
[0177]
生成单元302,用于基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;
[0178]
学习单元303,用于根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;
[0179]
训练单元304,用于获取多个网格单元中预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;
[0180]
计算单元305,用于基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
[0181]
在一些实施例中,生成单元,包括:
[0182]
第一生成子单元,用于获取网格单元之间的位置关系数据,并根据位置关系数据生成网格单元之间的第一图结构;
[0183]
第二生成子单元,用于从至少两个维度的统计数据中提取网格单元之间的功能属性关系数据,并根据功能属性关系数据生成网格单元之间的第二图结构;
[0184]
第三生成子单元,用于从至少两个维度的统计数据中提取网格单元之间的交互关系数据,并根据交互关系数据生成网格单元之间的第三图结构;
[0185]
学习单元,还用于:
[0186]
根据第一图结构、第二图结构以及第三图结构构建图神经网络。
[0187]
在一些实施例中,第一生成子单元,包括:
[0188]
确定模块,用于根据位置关系数据确定网格单元之间的相邻关系;
[0189]
生成模块,用于根据相邻关系生成相邻关系矩阵;
[0190]
构建模块,用于以多个网格单元为节点,以相邻关系矩阵为边构建网格单元之间的第一图结构。
[0191]
在一些实施例中,学习单元,包括:
[0192]
学习子单元,用于基于预设的损失函数对图神经网络中包含的多个子图神经网络模型进行无监督学习训练,得到训练后的多个子图神经网络模型;
[0193]
输入子单元,用于将每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据输入至训练后的多个子图神经网络模型,得到每一网格单元对应的多个子特征向量;
[0194]
第一确定子单元,用于根据每一网格单元对应的多个子特征向量确定每一网格单元对应的特征向量。
[0195]
在一些实施例中,确定子单元,包括:
[0196]
获取模块,用于获取每一子特征向量对应的权重系数;
[0197]
求和模块,用于基于每一子特征向量对应的权重系数对多个子特征向量进行加权求和,得到每一网格单元对应的特征向量。
[0198]
在一些实施例中,获取单元,包括:
[0199]
第一获取子单元,用于获取预设地理区域的第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据;
[0200]
第一划分子单元,用于基于预设规则对地理区域进行划分,得到多个网格单元;
[0201]
第二划分子单元,用于基于预设规则对第一遥感影像数据、第一人口流动数据、第一基础设施统计数据以及第一道路网络数据进行划分,得到每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据;
[0202]
生成单元,还用于:
[0203]
基于网格单元之间的位置关系以及每一网格单元对应的第二遥感影像数据、第二人口流动数据、第二基础设施统计数据以及第二道路网络数据生成至少两个以多个网格单元为节点的图结构。
[0204]
在一些实施例中,计算单元,包括:
[0205]
第二获取子单元,用于获取测试数据集合,测试数据集合包括多个网格单元中第二预设数量个第二网格单元对应的第二生产总值信息;
[0206]
测试子单元,用于采用测试数据集合对训练后的回归模型进行精度测试;
[0207]
第一计算子单元,用于当精度测试的结果指标数值大于预设阈值时,基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
[0208]
在一些实施例中,计算单元,包括:
[0209]
第二确定子单元,用于在多个网格单元中确定与目标区域对应的多个第三网格单元并确定每一第三网格单元对应的第三特征向量;
[0210]
第二计算子单元,用于将每一第三特征向量输入至训练后的回归模型,得到每一第三网格单元对应的第三生产总值信息,并基于第三生产总值信息计算目标区域的目标生产总值信息。
[0211]
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作
为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
[0212]
根据上述描述可知,本技术实施例提供的数据处理方法,通过获取单元301获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;生成单元302基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;学习单元303根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;训练单元304获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;计算单元305基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。以此,通过将地理区域划分为多个网格单元,并基于每个网格单元与生产总值信息关联的统计数据以及网格单元之间的位置关系构建图神经网络以对每一网格单元进行表征学习,再采用每个网格单元表征学习得到的向量与已知的标签数据训练回归模型,如此便可以采用训练后的回归模型自动对地理区域中每个网格单元对应的生产总值信息进行预测,提高了区域生产总值信息的预测效率,也就提升了对区域经济发展水平进行评估的效率。
[0213]
本技术实施例还提供一种计算机设备,该计算机设备可以为终端,如图6所示,该终端可以包括射频(rf,radio frequency)电路401、包括有一个或一个以上计算机可读存储介质的存储器402、输入单元403、显示单元404、传感器405、音频电路406、无线保真(wifi,wireless fidelity)模块407、包括有一个或者一个以上处理核心的处理器408、以及电源409等部件。本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0214]
rf电路401可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器408处理;另外,将涉及上行的数据发送给基站。通常,rf电路401包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(sim,subscriber identity module)卡、收发信机、耦合器、低噪声放大器(lna,low noise amplifier)、双工器等。此外,rf电路401还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(gsm,global system of mobile communication)、通用分组无线服务(gprs,general packet radio service)、码分多址(cdma,code division multiple access)、宽带码分多址(wcdma,wideband code division multiple access)、长期演进(lte,long term evolution)、电子邮件、短消息服务(sms,short messaging service)等。
[0215]
存储器402可用于存储软件程序以及模块,处理器408通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及信息互动。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相
应地,存储器402还可以包括存储器控制器,以提供处理器408和输入单元403对存储器402的访问。
[0216]
输入单元403可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元403可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器408,并能接收处理器408发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元403还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0217]
显示单元404可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元404可包括显示面板,可选的,可以采用液晶显示器(lcd,liquid crystal display)、有机发光二极管(oled,organic light-emitting diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器408以确定触摸事件的类型,随后处理器408根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图6中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
[0218]
终端还可包括至少一种传感器405,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0219]
音频电路406、扬声器,传声器可提供用户与终端之间的音频接口。音频电路406可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路406接收后转换为音频数据,再将音频数据输出处理器408处理后,经rf电路401以发送给比如另一终端,或者将音频数据输出至存储器402以便进一步处理。音频电路406还可能包括耳塞插孔,以提供外设耳机与终端的通信。
[0220]
wifi属于短距离无线传输技术,终端通过wifi模块407可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了wifi模块407,但是可以理解的是,其并不属于终端的必要构成,完全可以根据需要在不改变发明的本质的范围内而省略。
[0221]
处理器408是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行终端的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器408可包括一个或多个处理核心;优选的,处理器408可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器408中。
[0222]
终端还包括给各个部件供电的电源409(比如电池),优选的,电源可以通过电源管理系统与处理器408逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源409还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0223]
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器408会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器408来运行存储在存储器402中的应用程序,从而实现各种功能:
[0224]
获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
[0225]
应当说明的是,本技术实施例提供的计算机设备与上文实施例中的方法属于同一构思,以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
[0226]
本技术实施例还提供一种计算机设备,该计算机设备可以为服务器,如图7所示,为本技术提供的计算机设备的结构示意图。具体来讲:
[0227]
该计算机设备可以包括一个或者一个以上处理核心的处理单元501、一个或一个以上存储介质的存储单元502、电源模块503和输入模块504等部件。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0228]
处理单元501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储单元502内的软件程序和/或模块,以及调用存储在存储单元502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理单元501可包括一个或多个处理核心;优选的,处理单元501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理单元501中。
[0229]
存储单元502可用于存储软件程序以及模块,处理单元501通过运行存储在存储单元502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储单元502可主要包
括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能以及网页访问等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储单元502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储单元502还可以包括存储器控制器,以提供处理单元501对存储单元502的访问。
[0230]
计算机设备还包括给各个部件供电的电源模块503,优选的,电源模块503可以通过电源管理系统与处理单元501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源模块503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0231]
该计算机设备还可包括输入模块504,该输入模块504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0232]
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理单元501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储单元502中,并由处理单元501来运行存储在存储单元502中的应用程序,从而实现各种功能,如下:
[0233]
获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
[0234]
应当说明的是,本技术实施例提供的计算机设备与上文实施例中的方法属于同一构思,以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
[0235]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0236]
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种方法中的步骤。例如,该指令可以执行如下步骤:
[0237]
获取多个网格单元中每一网格单元对应的与生产总值信息关联的至少两个维度的统计数据,多个网格单元为按照预设规则对预设地理区域进行划分得到的多个子区域;基于网格单元之间的位置关系以及至少两个维度的统计数据生成至少两个以多个网格单元为节点的图结构;根据至少两个图结构构建图神经网络模型,并基于图神经网络模型对每一网格单元进行表征学习,得到每一网格单元对应的特征向量;获取多个网格单元中第一预设数量个第一网格单元对应的第一生产总值信息,并根据预设数量个第一网格单元对
应的第一特征向量以及第一生产总值信息训练预设回归模型,得到训练后的回归模型;基于训练后的回归模型计算预设地理区域中的目标区域对应的目标生产总值信息。
[0238]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0239]
其中,该计算机可读存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0240]
由于该计算机可读存储介质中所存储的指令,可以执行本发明实施例所提供的任一种方法中的步骤,因此,可以实现本发明实施例所提供的任一种方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0241]
其中,根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图2或图3的各种可选实现方式中提供的方法。
[0242]
以上对本发明实施例所提供的一种数据处理方法、装置、计算机可读存储介质及计算机设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献