一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

产业链生成方法、装置、计算机设备和存储介质与流程

2023-01-02 20:20:32 来源:中国专利 TAG:


1.本技术涉及大数据技术领域,特别是涉及一种产业链生成方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.产业链的上下游能够反映不同行业之间的关联关系,为指导宏观经济生产和指导行业发展等提供了研究基础。
3.目前,现有产业链主要是通过人工手动建立可视化的产业链,然而这种手动建立产业链的方式需要依据专家经验进行产业链构建,往往需要花费大量的时间,因此,这种方式存在时效性较差的问题。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够提高产业链构建时效性的产业链生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种产业链生成方法。所述方法包括:根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度;根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度;根据所述各个目标产业的产业关联信息中的实体关系信息,确定所述各个目标产业之间的关系关联度;根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱。
6.在其中一个实施例中,根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度,包括:根据所述各个目标产业的产业电量数据,得到所述各个目标产业的历史电量增长率;根据所述各个目标产业的产业生产数据,得到所述各个目标产业的历史生产增长率;根据所述历史电量增长率和所述历史生产增长率,对所述各个目标产业进行聚类处理,得到所述各个目标产业的产业分类结果;根据所述各个目标产业的产业分类结果,得到所述各个目标产业之间的数据关联度。
7.在其中一个实施例中,根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度,包括:在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,获
取将所述第一目标产业的名称信息更新为所述第二目标产业的名称信息所需的文本更新次数;所述第一目标产业为所述各个目标产业中任意一个目标产业;所述第二目标产业为所述各个目标产业中除所述第一目标产业以外的任意一个目标产业;根据所述文本更新次数,得到所述第一目标产业的名称信息和所述第二目标产业的名称信息之间的距离;根据所述距离,得到所述第一目标产业和所述第二目标产业之间的名称关联度,作为所述各个目标产业之间的名称关联度。
8.在其中一个实施例中,根据所述各个目标产业的产业关联信息中的实体关系信息,确定所述各个目标产业之间的关系关联度,包括:对所述各个目标产业的产业关联信息进行实体关系提取处理,得到各个所述产业关联信息中的实体关系信息;根据产业关系字典库中的产业之间的上下游关系,对所述实体关系信息中的目标产业进行上游概率判断和下游概率判断,得到所述实体关系信息中的目标产业的上游概率和下游概率;根据所述实体关系信息中的目标产业的所述上游概率和所述下游概率,得到所述各个目标产业之间的关系关联度。
9.在其中一个实施例中,根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱,包括:根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,确定所述各个目标产业之间的产业关联概率;根据所述上游概率、所述下游概率和所述产业关联概率,确定所述各个目标产业对应的上下游产业;对所述各个目标产业对应的上下游产业进行可视化图形处理,得到所述产业链图谱。
10.在其中一个实施例中,在根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱之后,还包括:获取所述产业链图谱中各个目标产业在当前时间段的当前电量数据;根据所述各个目标产业的当前电量数据,得到所述各个目标产业的当前电量增长率;对所述各个目标产业的所述当前电量增长率和所述历史电量增长率进行同比评估和环比评估,得到所述各个目标产业的评估结果;在所述评估结果为异常的情况下,在所述产业链图谱中对所述评估结果对应的目标产业进行上下游更新,得到所述当前时间段的产业链图谱。
11.第二方面,本技术还提供了一种产业链生成装置。所述装置包括:第一关联度确定模块,用于根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度;第二关联度确定模块,用于根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度;第三关联度确定模块,用于根据所述各个目标产业的产业关联信息中的实体关系
信息,确定所述各个目标产业之间的关系关联度;产业链图谱生成模块,用于根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱。
12.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度;根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度;根据所述各个目标产业的产业关联信息中的实体关系信息,确定所述各个目标产业之间的关系关联度;根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱。
13.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度;根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度;根据所述各个目标产业的产业关联信息中的实体关系信息,确定所述各个目标产业之间的关系关联度;根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱。
14.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:根据各个目标产业的产业电量数据和产业生产数据,确定所述各个目标产业之间的数据关联度;根据所述各个目标产业的名称信息之间的距离,确定所述各个目标产业之间的名称关联度;根据所述各个目标产业的产业关联信息中的实体关系信息,确定所述各个目标产业之间的关系关联度;根据所述各个目标产业之间的所述数据关联度、所述名称关联度和所述关系关联度,生成所述各个目标产业对应的产业链图谱。
15.上述产业链生成方法、装置、计算机设备、存储介质和计算机程序产品,根据各个目标产业的产业电量数据和产业生产数据,确定各个目标产业之间的数据关联度;根据各个目标产业的名称信息之间的距离,确定各个目标产业之间的名称关联度;根据各个目标产业的产业关联信息中的实体关系信息,确定各个目标产业之间的关系关联度;根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱。采用本方法,通过各个目标产业的产业电量数据和产业生产数据来确定各个目标产
业之间的数据关联度,通过各个目标产业的产业关联信息来确定各个目标产业之间的关系关联度,并结合各个目标产业之间的名称关联度来综合生成产业链图谱,解决了传统技术中构建产业链的数据维度单一的问题,使得生成得到的产业链图谱能够更全面的展示出各个目标产业在经济因素、生产因素和文本因素等多方面因素上的关联,还无需依靠人工经验建立产业链图谱,有效地提高了生成得到的产业链图谱的时效性。
附图说明
16.图1为一个实施例中产业链生成方法的流程示意图;图2为一个实施例中产业链图谱的示意图;图3为一个实施例中得到当前时间段的产业链图谱步骤的流程示意图;图4为另一个实施例中产业链生成方法的流程示意图;图5为一个实施例中产业链生成装置的结构框图;图6为一个实施例中计算机设备的内部结构图。
具体实施方式
17.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
18.在一个实施例中,如图1所示,提供了一种产业链生成方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备。本实施例中,该方法包括以下步骤:步骤s101,根据各个目标产业的产业电量数据和产业生产数据,确定各个目标产业之间的数据关联度。
19.其中,产业电量数据是指描述目标产业的用电情况的数据;例如,产业电量数据包括但不限于是目标产业的实时用电量和历年的用电量;产业电量数据用于反映目标产业的一线生产因素。产业生产数据是指描述目标产业的生产经济的数据;例如,产业生产数据包括但不限于是目标产业的生产总值;产业生产数据反映目标产业的经济因素。
20.其中,数据关联度是指用于度量目标产业两两之间在生产因素和经济因素方面的关联程度的指标。目标产业是指用于构建产业链图谱的产业;目标产业的数量至少为两个。
21.具体地,若用户需要分析不同产业之间的关联关系,可以向终端发送产业链图谱查看请求,则终端可以从计量电网平台的计量自动化系统中,获得与产业链图谱查看请求关联的一个或多个目标产业的产业用电数据。在获取到的产业用电数据为结构化的数据库表形式的情况下,终端可以对该产业用电数据进行数据清洗和数据校验处理,得到处理后的产业用电数据。终端还可以对记载有产业生产数据的统计网站进行爬虫处理,以从该统计网站上获取到至少两个目标产业的产业生产数据;在获取到的产业生产数据为半结构化形式的情况下,将该半结构化形式的产业生产数据转换为结构化的产业生产数据,然后对该结构化的产业生产数据进行数据清洗和数据校验处理,得到处理后的产业生产数据。进
而终端根据各个目标产业的处理后的产业用电数据和处理后的产业生产数据,对至少两个目标产业进行聚类,得到至少两个目标产业的产业分类结果,根据至少两个目标产业在产业分类结果中类间或类内的距离的远近程度,来确定各个目标产业两两之间的数据关联度。
22.步骤s102,根据各个目标产业的名称信息之间的距离,确定各个目标产业之间的名称关联度。
23.其中,名称信息是指目标产业的产业名称。名称关联度是指度量目标产业两两之间在名称方面的关联程度的指标。
24.具体地,终端根据各个目标产业的名称信息,计算得到各个目标产业的名称信息之间的距离。各个目标产业的名称信息之间的距离越小,各个目标产业之间的名称关联度越大;反之,各个目标产业的名称信息之间的距离越大,各个目标产业之间的名称关联度越小。
25.步骤s103,根据各个目标产业的产业关联信息中的实体关系信息,确定各个目标产业之间的关系关联度。
26.其中,产业关联信息是可能包含有产业的上下游关系的文本数据。实体关系信息是指用于描述实体间(例如两个产业之间)的上下游关系的信息。关系关联度指度量目标产业两两之间在产业链中的上下游关系方面的关联程度的指标。
27.具体地,终端可以分别对与各个目标产业关联的行业年报、新闻报告、政策指南等文本进行文本提取处理,得到各个目标产业的产业关联信息;进而终端对各个目标产业的产业关联信息进行实体关系抽取处理,得到各个产业关联信息中的实体关系信息;根据各个实体关系信息之间的上游概率和下游概率,得到各个目标产业之间的关系关联度。
28.步骤s104,根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱。
29.其中,产业链图谱是指用于可视化展示产业链的上游和下游的图形数据。
30.具体地,终端各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个产业之间的产业关联度;其中,产业关联度是指综合了数据关联度、名称关联度和关系关联度,用于综合评价不同产业之间的关联程度的指标。进而终端根据各个产业之间的产业关联度,确定各个目标产业对应的上游产业和下游产业,然后对各个目标产业对应的上游产业和下游产业进行可视化处理,得到与上述步骤s101中的产业链图谱查看请求对应的产业链图谱。终端在生成产业链图谱后,还可以展示产业链图谱,以供用户实时查看产业链图谱。
31.上述产业链生成方法中,根据各个目标产业的产业电量数据和产业生产数据,确定各个目标产业之间的数据关联度;根据各个目标产业的名称信息之间的距离,确定各个目标产业之间的名称关联度;根据各个目标产业的产业关联信息中的实体关系信息,确定各个目标产业之间的关系关联度;根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱。采用本方法,通过各个目标产业的产业电量数据和产业生产数据来确定各个目标产业之间的数据关联度,通过各个目标产业的产业关联信息来确定各个目标产业之间的关系关联度,并结合各个目标产业之间的名称关联度来综合生成产业链图谱,解决了传统技术中构建产业链的数据维度单一的问题,使得生成
得到的产业链图谱能够更全面的展示出各个目标产业之间在经济因素、生产因素等多方面因素上的关联,还无需依靠人工经验来建立产业链图谱,有效地提高了生成得到的产业链图谱的时效性。
32.在一个实施例中,上述步骤s101,根据各个目标产业的产业电量数据和产业生产数据,确定各个目标产业之间的数据关联度,具体包括如下内容:根据各个目标产业的产业电量数据,得到各个目标产业的历史电量增长率;根据各个目标产业的产业生产数据,得到各个目标产业的历史生产增长率;根据历史电量增长率和历史生产增长率,对各个目标产业进行聚类处理,得到各个目标产业的产业分类结果;根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度。
33.其中,历史电量增长率是指描述目标产业的电量数据在历史时间段的增长情况的数据;历史电量增长率包括但不限于是历史电量环比增长率和历史电量同比增长率。历史生产增长率是指描述目标产业的生产数据在历史时间段的增长情况的数据;历史生产增长率包括但不限于是历史生产环比增长率和历史生产同比增长率。
34.具体地,终端根据各个目标产业的历史产业电量数据,得到各个目标产业的历史电量环比增长率和历史电量同比增长率;根据各个目标产业的历史产业生产数据,得到各个目标产业的历史生产环比增长率和历史生产同比增长率;进而终端对各个目标产业的历史电量环比增长率、历史电量同比增长率、历史生产环比增长率和历史生产同比增长率进行聚类处理,可以是对各个目标产业的历史电量环比增长率、历史电量同比增长率、历史生产环比增长率和历史生产同比增长率进行k均值(k-means)聚类处理,则终端得到各个目标产业的产业分类结果。终端根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度,可以是首先为各个目标产业之间设置相同的初始数据关联度,然后对处于同一产业分类中的两两目标产业之间的初始数据关联度进行增加,对处于不同产业分类中的两两目标产业之间的初始数据关联度进行减少,得到两两目标产业之间的更新后数据关联度;接着获取处于同一产业分类中的目标产业两两之间的距离,按照距离从大到小的顺序,对处于同一产业分类中的目标产业两两之间的更新后数据关联度进行递增,得到目标产业两两之间的数据关联度,即处于同一产业分类中的目标产业两两之间的距离越小,目标产业两两之间的数据关联度越大。
35.本实施例中,通过对各个目标产业的历史电量增长率和历史生产增长率进行聚类处理,得到各个目标产业的产业分类结果;进而根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度,结合目标产业的历史电量增长率和历史生产增长率,来分析出目标产业之间的数据关联度,能够挖掘出产业链的上下游产业在电量和生产方面的规律,使得生成得到的产业链图谱能够更全面、更精细化的展示出各个目标产业之间在经济因素、生产因素等多方面因素上的关联。
36.在一个实施例中,上述步骤s102,根据各个目标产业的名称信息之间的距离,确定各个目标产业之间的名称关联度,具体包括如下内容:在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,获取将第一目标产业的名称信息更新为第二目标产业的名称信息所需的文本更新次数;第一目标产业为各个目标产业中任意一个目标产业;第二目标产业为各个目标产业中除第一目标产业以外的任意一个目标产业;根据文本更新次数,得到第一目标产业的名称信息和第二目标产业的名称信息之间的距离;根据距
离,得到第一目标产业和第二目标产业之间的名称关联度,作为各个目标产业之间的名称关联度。
37.其中,文本更新次数是指按照第二目标产业的名称信息对将第一目标产业的名称信息进行更新处理,更新处理最小所需次数。
38.具体地,终端将所有的目标产业中任意一个目标产业作为第一目标产业,同时将所有的目标产业中除第一目标产业以外的任意一个目标产业作为第二目标产业;进而检测获取到的第一目标产业的产业名称和获取到的第二目标产业的产业名称是否相同;在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,终端按照第二目标产业的名称信息中的每个字符,对第一目标产业的名称信息中与第二目标产业的名称信息不同的字符进行字符转换,其中,第一目标产业的名称信息中与第二目标产业的名称信息相同的字符无需进行字符转换,得到将第一目标产业的名称信息完全更新为第二目标产业的名称信息最小所需的字符转换次数,将字符转换次数作为文本更新次数。
39.进一步地,终端按照文本更新次数从小到大的顺序,对第一目标产业的名称信息和第二目标产业的名称信息之间的初始距离进行递增,得到第一目标产业的名称信息和第二目标产业的名称信息之间的距离,即第一目标产业的名称信息和第二目标产业的名称信息之间的文本更新次数越少,第一目标产业的名称信息和第二目标产业的名称信息之间的距离越近。终端按照第一目标产业的名称信息和第二目标产业的名称信息之间的距离从大到小的顺序,对第一目标产业和第二目标产业之间的初始名称关联度进行递增,得到第一目标产业和第二目标产业之间的名称关联度,即第一目标产业的名称信息和第二目标产业的名称信息之间的距离越小,第一目标产业和第二目标产业之间的名称关联度越大,各个目标产业之间的名称关联度。
40.举例说明,假设目标产业a的名称信息是黑色金属矿采选业,目标产业b的名称信息是黑色金属冶炼与压延加工业,目标产业c的名称信息是热力生产和供应业;若是将目标产业a的名称信息转换为目标产业b的名称信息,则需将目标产业a的“矿采选”转换为“冶炼与压延加工”,最少需要对7个字符进行字符转换,因此,目标产业b的名称信息与目标产业a的名称信息之间的距离为7;若是将目标产业c的名称信息转换为目标产业b的名称信息,则需将目标产业c中的“热力生产和供应”转换为“黑色金属冶炼与压延加工”,最少需要对11个字符进行字符转换,因此,目标产业b的名称信息与目标产业c的名称信息之间的距离为11,所以目标产业b与目标产业a之间的名称关联度,大于目标产业b与目标产业c之间的名称关联度。
41.在本实施例中,在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,获取将第一目标产业的名称信息更新为第二目标产业的名称信息最小所需的文本更新次数;进而根据文本更新次数,得到第一目标产业的名称信息和第二目标产业的名称信息之间的距离;根据距离,得到第一目标产业和第二目标产业之间的名称关联度,作为各个目标产业之间的名称关联度,依据相近产业在名称上也较为相似的特性,获取到了各个目标产业之间的名称关联度,从而后续能够利用名称关联度来确定各个目标产业之间的产业关联度,有利于提高生成的产业链图谱的准确性。
42.在一个实施例中,上述步骤s103,根据各个目标产业的产业关联信息中的实体关系信息,确定各个目标产业之间的关系关联度,具体包括如下内容:对各个目标产业的产业
关联信息进行实体关系提取处理,得到各个产业关联信息中的实体关系信息;根据产业关系字典库中的产业之间的上下游关系,对实体关系信息中的目标产业进行上游概率判断和下游概率判断,得到实体关系信息中的目标产业的上游概率和下游概率;根据实体关系信息中的目标产业的上游概率和下游概率,得到各个目标产业之间的关系关联度。
43.其中,产业关系字典库是指根据常规的产业之间的上下游关系构建得到的字典库。上游概率是指产业位于产业链中的上游的概率。下游概率是指产业位于产业链中的下游的概率。
44.具体地,终端对各个目标产业的产业关联信息进行实体提取处理,得到各个产业关联信息中的实体产业信息;进而终端对实体产业信息进行实体关系提取处理,可以是对实体产业信息进行基于规则的实体关系提取,则终端得到实体关系信息。终端根据产业关系字典库中产业之间的上下游关系,对实体关系信息中的目标产业进行上游概率判断,得到实体关系信息中的目标产业的上游概率,对实体关系信息中的目标产业进行下游概率判断,得到实体关系信息中的目标产业的下游概率;根据实体关系信息中的目标产业的上游概率和下游概率,可以是综合实体关系信息中两个目标产业的上游概率和下游概率,来得到目标产业两两之间的关系关联度。
45.举例说明,假设获取到的产业关联信息“新闻报道印尼2021全年出口煤炭4亿吨,其中有超过1.8亿吨销往中国,占到总出口量61%以上,占中国总进口煤炭的75%。事件主要涉及关联煤炭开采和洗选业,致使1-3月期间能耗指标增长234mw/万元,同比3%;次级关联行业电力、热力生产和供应业,致使1-3月期间能耗指标增长164mw/万元,同比5%”,则可以对该产业关联信息进行实体提取处理,得到实体产业信息为“煤炭开采和洗选业”和“行业电力、热力生产和供应业”,且“煤炭开采和洗选业”和“行业电力、热力生产和供应业”之间存在实体关系,根据产业关系字典库中产业之间的上下游关系,对“煤炭开采和洗选业”和“行业电力、热力生产和供应业”进行上游概率判断和下游概率判断,得到“行业电力、热力生产和供应业”的下游概率高于“煤炭开采和洗选业”,同时“煤炭开采和洗选业”的上游概率高于“行业电力、热力生产和供应业”,即可认为“行业电力、热力生产和供应业”有较大概率是“煤炭开采和洗选业”的下游。
46.在本实施例中,通过根据产业关系字典库中的产业之间的上下游关系,对各个目标产业的产业关联信息中提取出的实体关系信息中的目标产业进行上游概率判断和下游概率判断,得到实体关系信息中的目标产业的上游概率和下游概率;进而根据实体关系信息中的目标产业的上游概率和下游概率,得到各个目标产业之间的关系关联度,无需专家等人员依靠人工经验判断各个目标产业的上下游关系,能够从产业关联信息中科学的提取出各个产业之间的关系关联度,有效地提高了产业链图谱的生成效率。
47.在一个实施例中,上述步骤s104,根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱,具体包括如下内容:根据各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个目标产业之间的产业关联概率;根据上游概率、下游概率和产业关联概率,确定各个目标产业对应的上下游产业;对各个目标产业对应的上下游产业进行可视化图形处理,得到产业链图谱。
48.其中,产业关联概率是指描述两个目标产业之间存在关联的概率。
49.具体地,终端综合各个目标产业之间的数据关联度、名称关联度和关系关联度,可
以是对各个目标产业之间的数据关联度、名称关联度和关系关联度进行加权,还可以是仅依据数据关联度、名称关联度和关系关联度中任意一个单方面的关联度,则终端各个目标产业之间的产业关联概率;终端对各个目标产业之间的产业关联概率、上游概率和下游概率进行矩阵处理,得到关联度矩阵;根据关联度矩阵,确定各个目标产业对应的上下游产业;对各个目标产业对应的上下游产业进行可视化图形处理,可以是利用图形数据库构建各个目标产业的可视化节点,并按照各个目标产业对应的上下游产业,对可视化节点进行连接,得到产业链图谱;例如,利用neo4j(一种nosql图形数据库)构建各个目标产业的可视化节点,并按照各个目标产业对应的上下游产业,对可视化节点进行连接,得到产业链图谱,产业链图谱的示意图如图2所示。
50.在本实施例中,通过各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个目标产业之间的产业关联概率;进而根据上游概率、下游概率和产业关联概率,确定各个目标产业对应的上下游产业;对各个目标产业对应的上下游产业进行可视化图形处理,得到产业链图谱,使得获取到的产业链图谱能够反映出各个目标产业之间的数据关联度、名称关联度和关系关联度,提高了获取到的产业链图谱的关系面,还无需依靠人工经验建立产业链图谱,有效地提高了产业链图谱的生成效率。
51.在一个实施例中,如图3所示,在根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱之后,还包括:步骤s301,获取产业链图谱中各个目标产业在当前时间段的当前电量数据。
52.步骤s302,根据各个目标产业的当前电量数据,得到各个目标产业的当前电量增长率。
53.步骤s303,对各个目标产业的当前电量增长率和历史电量增长率进行同比评估和环比评估,得到各个目标产业的评估结果。
54.步骤s304,在评估结果为异常的情况下,在产业链图谱中对评估结果对应的目标产业进行上下游更新,得到当前时间段的产业链图谱。
55.其中,当前电量增长率是指描述目标产业的电量数据在历史时间段的增长情况的数据。当前电量增长率包括但不限于是当前电量环比增长率和当前电量环比增长率。
56.具体地,终端在上述步骤s104中生成得到产业链图谱之后,终端获取产业链图谱中各个目标产业在当前时间段的当前电量数据,然后根据各个目标产业的当前电量数据和在历史时间段的产业电量数据,计算得到各个目标产业在当前时间段的当前电量环比增长率和当前电量环比增长率。终端对各个目标产业的当前电量环比增长率和历史电量环比增长率进行环比评估,得到各个目标产业的电量环比评估结果;对各个目标产业的当前电量同比增长率和历史电量同比增长率进行同比评估,得到各个目标产业的电量同比评估结果;终端综合电量环比评估结果和电量环比评估结果得到各个目标产业的评估结果,或者根据电量环比评估结果或电量环比评估结果中任意一个评估结果,确定各个目标产业的评估结果;在评估结果为异常的情况下,在产业链图谱中对评估结果为异常的目标产业进行上下游更新,得到当前时间段更新后的产业链图谱。
57.在本实施例中,根据产业链图谱中各个目标产业在当前时间段的当前电量数据,得到各个目标产业的当前电量增长率;进而对各个目标产业的当前电量增长率和历史电量增长率进行同比评估和环比评估,得到各个目标产业的评估结果;在评估结果为异常的情
况下,在产业链图谱中对评估结果对应的目标产业进行上下游更新,得到当前时间段的产业链图谱,能够及时发现产业链图谱中存在电量波动异常的产业,实现了对产业链图谱的实时筛查和自动更新,从而进一步地提高了产业链图谱的时效性,还能提高产业链图谱的准确性。
58.在一个实施例中,如图4所示,提供了另一种产业链生成方法,以该方法应用于终端为例进行说明,包括以下步骤:步骤s401,根据各个目标产业的产业电量数据,得到各个目标产业的历史电量增长率;根据各个目标产业的产业生产数据,得到各个目标产业的历史生产增长率。
59.步骤s402,根据历史电量增长率和历史生产增长率,对各个目标产业进行聚类处理,得到各个目标产业的产业分类结果;根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度。
60.步骤s403,在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,获取将第一目标产业的名称信息更新为第二目标产业的名称信息所需的文本更新次数。
61.其中,第一目标产业为各个目标产业中任意一个目标产业;第二目标产业为各个目标产业中除第一目标产业以外的任意一个目标产业。
62.步骤s404,根据文本更新次数,得到第一目标产业的名称信息和第二目标产业的名称信息之间的距离;根据距离,得到第一目标产业和第二目标产业之间的名称关联度,作为各个目标产业之间的名称关联度。
63.步骤s405,对各个目标产业的产业关联信息进行实体关系提取处理,得到各个产业关联信息中的实体关系信息。
64.步骤s406,根据产业关系字典库中的产业之间的上下游关系,对实体关系信息中的目标产业进行上游概率判断和下游概率判断,得到实体关系信息中的目标产业的上游概率和下游概率。
65.步骤s407,根据实体关系信息中的目标产业的上游概率和下游概率,得到各个目标产业之间的关系关联度。
66.步骤s408,根据各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个目标产业之间的产业关联概率;根据上游概率、下游概率和产业关联概率,确定各个目标产业对应的上下游产业。
67.步骤s409,对各个目标产业对应的上下游产业进行可视化图形处理,得到产业链图谱。
68.上述产业链生成方法,能够实现以下有益效果:通过各个目标产业的产业电量数据和产业生产数据来确定各个目标产业之间的数据关联度,通过各个目标产业的产业关联信息来确定各个目标产业之间的关系关联度,并结合各个目标产业之间的名称关联度来综合生成产业链图谱,解决了传统技术中构建产业链的数据维度单一的问题,使得生成得到的产业链图谱能够更全面的展示出各个目标产业在经济因素、生产因素和文本因素等多方面因素上的关联,还无需依靠人工经验建立产业链图谱,有效地提高了生成得到的产业链图谱的时效性。
69.为了更清晰阐明本公开实施例提供的产业链生成方法,以下以一个具体的实施例
对上述产业链生成方法进行具体说明。提供了又一种产业链生成方法,可以应用于终端,具体包括如下内容:第一是数据获取环节:从计量自动化系统获取实时的产业电量数据,包括133类典型产业的用电量,复工复产情况等;从统计局网站通过爬虫获取133类典型产业的产业生产数据;从行业年报、新闻报告、政策指南等文本中获取133类典型产业133类典型产业的产业关联信息。
70.第二是数据处理环节:1)从计量自动化系统中获得的产业电量数据为结构化库表数据,对产业电量数据进行数据清洗和数据校验,得到处理后的产业电量数据,以确保处理后的产业电量数据的质量;通过neo4j图形数据库中的neo4j-import模块将处理后的产业电量数据转换为产业链图谱中的实体。2)从统计局网站获得的产业生产数据为半结构化数据,将产业生产数据转化为结构化形式产业生产数据,然后对产业生产数据进行数据清洗和数据校验,得到处理后的产业生产数据,以确保处理后的产业生产数据的质量;通过neo4j图形数据库中的neo4j-import模块将处理后的产业生产数据转换为产业链图谱中的实体。3)对产业关联信息进行产业特征提取处理,得到产业关联信息中的产业特征信息;根据产业关系字典库,对产业特征信息进行实体产业匹配,得到产业特征信息对应的实体产业信息。
71.第三是综合产业关联度计算环节:1)终端根据各个目标产业的历史产业电量数据,得到各个目标产业的历史电量环比增长率和历史电量同比增长率;根据各个目标产业的历史产业生产数据,得到各个目标产业的历史生产环比增长率和历史生产同比增长率;对各个目标产业的历史电量环比增长率、历史电量同比增长率、历史生产环比增长率和历史生产同比增长率进行k均值聚类,则终端得到各个目标产业的产业分类结果;终端根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度。2)根据获取到的各个目标产业的名称信息,确定将一个目标产业的名称信息转换为另一个目标产业的名称信息所需的最小文本更新次数,根据所需的最小文本更新次数,计算得到各个目标产业的名称信息之间的距离。根据距离计算得到这两个产业之间的名称关联度。3)对各个目标产业的产业关联信息进行实体关系提取处理,得到各个产业关联信息中的实体关系信息;根据实体关系信息中的目标产业的上游概率和下游概率,得到各个目标产业之间的关系关联度。
72.第四是产业链生成环节:根据各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个目标产业之间的产业关联概率;对各个目标产业之间的产业关联概率、上游概率和下游概率进行矩阵处理,得到关联度矩阵,作为综合产业关联度;根据综合产业关联度确定各个目标产业对应的上下游产业;利用neo4j(一种nosql图形数据库)构建各个目标产业的可视化节点,并按照各个目标产业对应的上下游产业,对可视化节点进行连接,得到产业链图谱。
73.在本实施例中,通过各个目标产业的产业电量数据和产业生产数据来确定各个目标产业之间的数据关联度,通过各个目标产业的产业关联信息来确定各个目标产业之间的关系关联度,并结合各个目标产业之间的名称关联度来综合生成产业链图谱,解决了传统技术中构建产业链的数据维度单一的问题,使得生成得到的产业链图谱能够更全面的展示出各个目标产业在经济因素、生产因素和文本因素等多方面因素上的关联,还无需依靠人工经验建立产业链图谱,有效地提高了生成得到的产业链图谱的时效性。
74.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
75.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的产业链生成方法的产业链生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个产业链生成装置实施例中的具体限定可以参见上文中对于产业链生成方法的限定,在此不再赘述。
76.在一个实施例中,如图5所示,提供了一种产业链生成装置500,包括:第一关联度确定模块501、第二关联度确定模块502、第三关联度确定模块503和产业链图谱生成模块504,其中:第一关联度确定模块501,用于根据各个目标产业的产业电量数据和产业生产数据,确定各个目标产业之间的数据关联度。
77.第二关联度确定模块502,用于根据各个目标产业的名称信息之间的距离,确定各个目标产业之间的名称关联度。
78.第三关联度确定模块503,用于根据各个目标产业的产业关联信息中的实体关系信息,确定各个目标产业之间的关系关联度。
79.产业链图谱生成模块504,用于根据各个目标产业之间的数据关联度、名称关联度和关系关联度,生成各个目标产业对应的产业链图谱。
80.在一个实施例中,第一关联度确定模块501,还用于根据各个目标产业的产业电量数据,得到各个目标产业的历史电量增长率;根据各个目标产业的产业生产数据,得到各个目标产业的历史生产增长率;根据历史电量增长率和历史生产增长率,对各个目标产业进行聚类处理,得到各个目标产业的产业分类结果;根据各个目标产业的产业分类结果,得到各个目标产业之间的数据关联度。
81.在一个实施例中,第二关联度确定模块502,还用于在检测到第一目标产业的名称信息与第二目标产业的名称信息不同的情况下,获取将第一目标产业的名称信息更新为第二目标产业的名称信息所需的文本更新次数;第一目标产业为各个目标产业中任意一个目标产业;第二目标产业为各个目标产业中除第一目标产业以外的任意一个目标产业;根据文本更新次数,得到第一目标产业的名称信息和第二目标产业的名称信息之间的距离;根据距离,得到第一目标产业和第二目标产业之间的名称关联度,作为各个目标产业之间的名称关联度。
82.在一个实施例中,第三关联度确定模块503,还用于对各个目标产业的产业关联信息进行实体关系提取处理,得到各个产业关联信息中的实体关系信息;根据产业关系字典库中的产业之间的上下游关系,对实体关系信息中的目标产业进行上游概率判断和下游概率判断,得到实体关系信息中的目标产业的上游概率和下游概率;根据实体关系信息中的目标产业的上游概率和下游概率,得到各个目标产业之间的关系关联度。
83.在一个实施例中,产业链图谱生成模块504,还用于根据各个目标产业之间的数据关联度、名称关联度和关系关联度,确定各个目标产业之间的产业关联概率;根据上游概率、下游概率和产业关联概率,确定各个目标产业对应的上下游产业;对各个目标产业对应的上下游产业进行可视化图形处理,得到产业链图谱。
84.在一个实施例中,产业链生成装置500还包括产业链更新模块,用于获取产业链图谱中各个目标产业在当前时间段的当前电量数据;根据各个目标产业的当前电量数据,得到各个目标产业的当前电量增长率;对各个目标产业的当前电量增长率和历史电量增长率进行同比评估和环比评估,得到各个目标产业的评估结果;在评估结果为异常的情况下,在产业链图谱中对评估结果对应的目标产业进行上下游更新,得到当前时间段的产业链图谱。
85.上述产业链生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
86.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种产业链生成方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
87.本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
88.在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
89.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
90.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
91.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
92.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
93.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
94.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献