通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法与流程

2021-11-20 04:28:00 来源：中国专利 TAG：

1.本发明涉及公共管理技术领域，特别是涉及一种通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法。

背景技术：

2.随着社会信息化的普及，政府信息化建设规模不断扩大。如何逐步减少其中大量存在的“信息孤岛”建设就成为降低财政支出、提高建设绩效的关键问题，而有效提高项目实施前的评价科学性问题就变得十分重要。
3.国办发(2017)39号《政务信息资源共享管理暂行办法》、(2019)57号《国家政务信息化项目建设管理办法》中明确要求：“按照以共享为原则，不共享为例外的总体原则建设部门政务信息系统，切实避免各自为政、自成体系、重复投资、重复建设”。上述规定是当今政务信息化建设相关管理活动的依据。
4.但是，历史上电子政务项目管理既貌似有规可循，又本质上面临决策信息碎片化和信息不对称问题。管理者受限于不同政府部门历史项目数据的碎片性与复杂性，加之缺乏科学、高效的评价手段支持，使得人工发现新项目中的问题困难；被管理的政府部门存在惯性思维和“条块分割”的行政体制壁垒等实际问题，导致申建项目中的政策符合性问题依然大量出现。
5.对电子政务项目的理解需要管理政策知识、管理对象知识、技术系统知识以及部门建设历史情况等多种类的复杂知识支撑,对这类项目评价的工作是一个需要通过知识补充、知识关联来揭示政府部门内、项目中所存在的隐性问题的知识综合利用过程，而利用知识图谱，实现针对问题的知识关联推理并可视化结果以实现客观、高效的决策支持服务无疑是一种经典的应用服务场景。

技术实现要素：

6.本发明的目的是针对现有电子政务项目中存在的重复投资、重复建设的问题，而提供的一种通过基于领域知识图谱进行知识关联推理与结果可视化以支持电子政务项目管理的辅助决策方法。
7.为实现本发明的目的所采用的技术方案是：
8.基于领域知识图谱进行知识关联推理与结果可视化以支持电子政务项目管理的辅助决策方法，包括以下步骤：
9.步骤一，电子政务领域本体数据模型的构建：以七步法和循环获取法为基础，利用七步法创建实例后，采用本体评估迭代至七步法前端的方式，实现双向本体建模；
10.步骤二，建立电子政务领域知识图谱：
11.对结构化数据进行整合，对半结构化数据和非结构化数据进行知识抽取和知识扩充，得到初步知识表示后，利用已有知识进行实体链接，得到标准知识表示，利用标准知识
修订步骤一的数据模型，得到实例和实例之间的关系，将此规范后得到标准三元组数据，利用标准三元组数据创建电子政务领域知识图谱；
12.步骤三，以电子政务领域知识图谱为基础，将知识推理与可视化相结合，从已有信息中推理深层信息以可视化的方式呈现，辅助政务信息化项目建设管理。
13.在上述技术方案中，所述步骤一中，电子政务领域本体数据模型的构建方法如下：
14.步骤1，定义本体概念：
15.政府部门类：省市级政府下属的部门；
16.政务职能类：省市级政府下属部门的政务职能；
17.电子政务系统类：政府部门申报、建设的各种电子政务系统；
18.数据资源类：电子政务系统中采集、调用的数据资源；
19.主题类：为了表示政务系统对于职能履行的细节性信息，增添主题类；
20.政务子职能类:政务子职能及所管理的对象与管理权责，政务子职能类为政务职能类的子类；
21.电子政务子系统类:电子政务系统包含的子系统与功能点描述，电子政务子系统类为电子政务系统类的子类；
22.步骤2，确定类属性：通过对每个类别的数据及对决策场景的分析，设置重要或者出现次数较多的属性:
23.政府部门类：下属部门id，下属部门名称；
24.政务职能类：职能id，职能名称；
25.电子政务系统类：主题权重，建设时间、升级时间、申报资金、审批资金；
26.数据资源类：数据名，数据描述，数据类型，数据大小，信息项，数据来源，分享类型；
27.主题类：主题词及主题权重；
28.政务子职能类:子职能名称、管理对象名称，管理权责描述；
29.电子政务子系统类:子系统名称，子系统描述，功能点名称，功能点描述；
30.步骤3，确定对象关系：
31.duty_of包含职能：政府部门与政务职能之间的关系；
32.system_of包含系统：政府部门与电子政务系统之间的关系；
33.function_of包含子系统：电子政务系统和电子政务子系统之间的父子类关系；
34.belong_to属于：政务职能和电子政务子系统之间的关系，政务子职能和电子政务子系统之间的关系；
35.source_of包含数据资源：电子政务系统和数据资源之间的关系；
36.tipic_of部门包含的主题：政府部门和主题之间的关系；
37.s_tipic_of系统包含的主题：电子政务系统和主题之间的关系；
38.sub_of政务职能与政务子职能之间父子类关系；
39.步骤4，确定类的等级关系同步骤3确定对象间关系；
40.步骤5，创建实例：从结构化数据、半结构化数据以及非结构化数据中抽取知识，将得到的三元组数据归到建立的本体上，就是创建的实例；
41.步骤6，本体评估：专家经验人为干预进行本体评估；
42.步骤7，迭代，对缺漏的本体进行人为补充。
43.在上述技术方案中，所述步骤二中数据来源如下：
44.结构化数据来自政务信息化项目申报材料中可获取的信息，包括系统名称、子系统名、系统申报单位、申报时间、升级改造时间、所需数据资源、申报资金、历史相关投资信息；从省级网信部门的数据共享交换平台数据库中获取的申建部门的共享数据资源目录信息；
45.半结构化数据来自政府政务网站上抓取的信息，包括政府部门名称、权责清单；
46.非结构化数据是文本数据，来自政务信息系统建设申报材料中项目摘要文本中所抽取的核心内容。
47.在上述技术方案中，对结构化数据进行整合是是把电子政务系统相关数据和共享数据资源极性收集、整理、清洗，转换后形成一个新数据源；
48.对半结构化数据和非结构化数据进行处理时，采用基于集成模型的政务子职能命名实体识别方法实现知识抽取，利用基于职能语义的领域知识图谱关系抽取算法，结合政府职能与政务信息系统层次化的特点获取电子政务子系统与政务职能之间的关系，基于lda主题模型的知识扩充进行半结构化数据的知识抽取。
49.在上述技术方案中，基于职能语义的领域知识图谱关系抽取算法是通过以下步骤实现的，电子政务系统的子系统依据功能进行定义和划分，基本可划分为“政务职能建设子系统”及“软件功能实现子系统”两类，子系统名称均为短文本且为多个词语的组合，根据词语在子系统中的表达意思的差异，又可将子系统名称中的描述词主要划分成子系统功能描述词、功能执行方式词、软件描述词、功能对象四类，子系统功能描述词:子系统名称中描述和软件实际功能相关的词语，功能执行方式词:实现某功能的方式；软件描述词：与软件概念相关词汇；功能对象：某功能所从属的部门；由于子系统功能描述词基本为名词及动名词，通过分词后的词性筛选，可从由多个词语组成的子系统名称中获取子系统功能描述部分，为了解决细粒度分词对子系统名称中政务含义的破坏，通过排列的方式极大程度的恢复出子系统名称中所有的潜在语义，利用两类子系统与政务职能之间语义相似度的差异及子系统的命名规律，提出基于职能语义的电子政务知识图谱的关系抽取算法，采用directional skip-gram算法训练好大规模近义词词向量进行文本相似度的计算，最后对所有排列的结果进行词向量相似度的计算，选取对应相似度最高的职能词构成子系统及职能间的三元组数据。
50.在上述技术方案中，所述步骤二中，利用标准三元组数据创建电子政务领域知识图谱时，将标准三元组数据存入到neo4j图数据库，利用cypher语言对neo4j图数据库执行crud操作,将这些三元组链接并存入图数据库neo4j中，得到电子政务领域知识图谱。
51.在上述技术方案中，在步骤二中得到标准知识表示后进行知识推理，根据步骤一的数据模型和标准三元组数据，依据推理规则进行知识发现，即获取新的知识或者结论，再加入电子政务领域知识图谱；
52.知识推理采用基于tbox和abox的推理机制，根据电子政务系统、电子政务子系统、政务职能和子职能之间的关系和类的从属关系，构建如下推理规则即可获取电子政务系统以及电子政务系统与政务职能之间的关系：
[0053][0054]
其中a为某政务职能变量，duty_system(a,system)为某职能a及拥有该职能的所有电子政务系统之间的关系；由于subduty和duty及subsystem和system是父子类关系，为了简化表示，所以这里用表示他们的sub_of和function_of关系；为所有职能a下的电子政务系统各职能上的系统数量统计；
[0055][0056]
其中，b为某一部门变量，duty_system(system).system为b部门所有职能下的电子政务系统。
[0057]
在上述技术方案中，所述步骤三中，可视化内容包括重复系统饼状图、基于职能建设率、数据资源共享率及资金审批率的政务系统三维雷达图，基于职能建设率、数据资源共享率及资金审批率的政务系统三维散点图，反应政务部门关系的信息化网络关系图。
[0058]
在上述技术方案中，构建重复系统饼状图时，
[0059]
某电子政务系统i与另一电子政务系统j的重复率p
i,j
定义如下：
[0060][0061][0062][0063]
t
i,j
＝w
i
.w
j
[0064]
其中，f
i,j
为系统i同j的重复职能子系统建设率，f
i,j
为系统i中和系统j属于同一职能的子系统数量，f
i
为系统i中所有用于职能建设的子系统数量，只选取用于职能建设的子系统进行分析，d
i,j
为系统i同j的使用的数据资源重复率，d
i,j
为系统i中和系统j重复数据资源数量，d
i
为系统i所用的所有数据资源数量，t
i,j
为系统i同j的主题相似率，w
i
、w
j
分别为系统i和j的主题权重向量；
[0065][0066]
其中，s y s it为要进行比较的电子政务系统实体i，belong_to(function_of(i,subsystem),duty).duty为电子政务系统i所拥有的政务职能，similar_duty(i,j).i为f
i,j
；
[0067]
d
i,j
可由下述推理规则得到：
[0068]
其中，source_of(i,sharingdata).sharingdata为电子政务系统i所拥有的数据资源，为d
i,j
；
[0069]
w
i
、w
j
通过获取主题实体的属性即可得到。
[0070]
在上述技术方案中，构建政务系统三维雷达图和三维散点图时，
[0071]
定义政务职能建设率p
f
：
[0072]
f
duty
为某电子政务系统中所包含的实现职能功能的子系统数量，f
all
为某电子政务系统中所有的子系统数量；
[0073]
利用电子政务领域知识图谱进行如下推理，可获得拥有职能-子系统关系的某系统w中的子系统，对其进行统计即可获得f
duty
[0074][0075]
定义数据资源共享率p
d
：
[0076]
d
share
表示该系统中和其他系统有共享关系的数据资源，d
all
代表该系统中所有的
数据资源；
[0077]
基于知识图谱进行推理，可知某政务系统w中和其他系统拥有数据共享关系的数据资源，对该数据资源进行统计可知d
share
[0078][0079]
定义资金审批率p
m
：
[0080]
其中，m
a
为审批资金，m
s
为申报资金，通过知识图谱中电子政务系统的属性即可获得m
a
及m
s
；
[0081]
政务部门关系可视化时，定义各部门的主题可表示为topic＝{t1,t2,t3...t
n
}主题向量可用主题词表示为t＝{t1,t2,t3...t
n
}，主题词的权重向量为w＝{w1,w2,w3...w
n
}
[0082]
通过主题词和主题词的权重向量可得知两个部门间的主题相似度矩阵，主题相似度计算公式定义如下：
[0083][0084]
其中s
t,t'
为主题t和t'的相似度，similar(t
i
,t'
j
)为主题词之间的相似度，利用余弦相似度进行计算，公式如下：
[0085][0086]
通过设定阈值统计主题相似度矩阵中大于阈值的主题个数确定两部门之间的关联关系，公式如下：
[0087][0088]
将s
t,t'
设为网络关系图中的边的权重，就可以得到信息化网络关系图。
[0089]
与现有技术相比，本发明的有益效果是：
[0090]
1.电子政务领域知识图谱的创建清晰地定义了电子政务领域重要概念间已有的知识事实与关联，并为机器辅助决策奠定了基础，对于电子政务项目评价与管理的研究与新技术应用具有重要的基础支撑价值。
[0091]
2.本发明的应用结果证明，应用该方案不仅可以大幅度节约财政的政务信息化建设投资，而且可以促进区域电子政务信息化建设向着规范化和科学化的水平大幅度进步。
[0092]
3.本发明针对决策场景分别采用二维(柱形、饼状)、三维(雷达、散点、网络关系)的推理结果可视化方案，可以有效呈现出政府部门、政务职能、政务信息系统、政务数据资源间的复杂关联关系，大幅度提升了决策效率与决策科学性。
附图说明
[0093]
图1是电子政务领域本体数据模型的构建方法流程图。
[0094]
图2是电子政务领域本体建模图。
[0095]
图3是电子政务领域知识图谱的构建方法流程图。
[0096]
图4是数据源介绍图。
[0097]
图5是集成模型图。
[0098]
图6是基于职能语义的电子政务知识图谱的关系抽取算法流程图。
[0099]
图7是电子政务领域知识图谱的截取部分示意图。
[0100]
图8是基于知识推理的电子政务可视分析流程图。
[0101]
图9是tbox和abox上推理机制的逻辑语法。
[0102]
图10是电子政务领域知识图谱的部分图。
[0103]
图11是图10对应的echarts图。
[0104]
图12是重复系统饼状图。
[0105]
图13是政务系统“三维”雷达图。
[0106]
图14是政务系统“三维”散点图。
[0107]
图15是信息化网络关系图。
具体实施方式
[0108]
以下结合具体实施实例对本发明作进一步详细说明。应当理解，此处所描述的具体实施实例仅仅用以解释本发明，并不用于限定本发明。
[0109]
实施例1
[0110]
通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法，包括以下步骤：
[0111]
步骤一，电子政务领域本体数据模型的构建，如图1所示：
[0112]
以七步法和循环获取法为基础，利用七步法创建实例后，采用本体评估迭代至七步法前端的方式，实现双向本体建模：
[0113]
在七步法中，
[0114]
①
定义本体概念，如图2所示：
[0115]
政府部门类(department)：省市级政府下属的部门。
[0116]
政务职能类(duty)：省市级政府下属各部门的政务职能。
[0117]
电子政务系统类(system)：政府部门申报、建设的电子政务系统。
[0118]
数据资源类(sharingdata)：电子政务系统中采集、调用的数据资源。
[0119]
主题类(topic)：为了表示政务系统对于职能履行的细节性信息，增添主题类。
[0120]
政务子职能类:政务职能所包含的子职能、管理的对象与管理权责(政务职能类的子类)；
[0121]
电子政务子系统类:电子政务系统包含的子系统与功能点描述(电子政务系统类的子类)；
[0122]
②
确定类属性：通过对每个类别的数据及对决策场景的分析，设置重要或者出现次数较多的属性:
[0123]
政府部门类：下属部门id,下属部门名称；
[0124]
政务职能类：职能id，职能名称；
[0125]
电子政务系统类：主题权重，建设时间、升级时间、申报资金、审批资金；
[0126]
数据资源类：数据名，数据描述，数据类型，数据大小，信息项，数据来源，分享类型；
[0127]
主题类：主题词及主题权重；
[0128]
政务子职能类:子职能名称、管理对象名称，管理权责描述；
[0129]
电子政务子系统类:子系统名称，子系统描述，功能点名称，功能点描述；
[0130]
③
确定对象关系：如图2所示，显示了电子政务领域本体及本体间关系
[0131]
duty_of(包含职能)：政府部门与政务职能之间的关系；
[0132]
system_of(包含系统)：政府部门与电子政务系统之间的关系；
[0133]
function_of(包含子系统)：电子政务系统和电子政务子系统之间的父子类关系；
[0134]
belong_to(属于)：政务职能和电子政务子系统之间的关系，政务子职能和电子政务子系统之间的关系；
[0135]
source_of(包含数据资源)：电子政务系统和数据资源之间的关系。
[0136]
tipic_of(部门包含的主题)：政府部门和主题之间的关系。
[0137]
s_tipic_of(系统包含的主题)：电子政务系统和主题之间的关系。
[0138]
sub_of政务职能与政务子职能之间父子类关系。
[0139]
④
确定类的等级关系同
③
确定对象间关系。
[0140]
⑤
创建实例：
[0141]
从结构化数据、半结构化数据以及非结构化数据中抽取知识，将得到的三元组数据归到建立的本体上，就是创建的实例；
[0142]
⑥
本体评估：专家经验人为干预进行本体评估；
[0143]
⑦
迭代，对缺漏的本体进行人为补充。
[0144]
步骤二：建立电子政务领域知识图谱，如图3所示，显示了本发明电子政务领域知识图谱的创建全过程：如图4所示，显示了本发明的数据来源，数据源支持与数据预处理
[0145]
结构化数据来自：政务信息化项目申报材料中可获取的信息，包括系统名称、子系统名、系统申报单位、申报时间、升级改造时间、所需数据资源、申报资金、历史相关投资等信息；从省级网信部门的数据共享交换平台数据库中可获取申建部门的共享数据资源目录信息；
[0146]
半结构化数据来自：政府政务网站上抓取的信息，主要包括政府部门名称、权责清单等；
[0147]
非结构化数据是文本数据，主要来自政务信息系统建设申报材料中项目摘要文本中所抽取的核心内容。
[0148]
s1，对结构化数据进行整合：是把在不同数据源的数据(此处为电子政务系统相关数据和共享数据资源)收集、整理、清洗，转换后形成一个新的数据源。
[0149]
按照如下s2和s3对数据进行知识抽取：
[0150]
s2，采用基于集成模型的政务子职能命名实体识别方法实现知识抽取，如图5所示的集成模型，显示了本发明中基于集成模型的政务子职能命名实体识别方法实现知识抽取
的过程。
[0151]
运用命名实体标注，在《国家政务服务平台服务事项基本目录与实施清单》的9大类政务职能定义(行政许可、行政处罚、行政强制、行政征收、行政给付、行政奖励、行政确认、行政裁决、行政检查)中抽取命名实体，并利用投票法集成四种常用的命名实体方法,如图5所示，x1为输入的半结构化数据，隐马尔可夫模型(hmm)、条件随机场(crf)、bilstm、bilstm-crf，结合职能描述的特点分别分析其对于政务子职能实体识别的效果用于实体识别,比其中的单一方法具有更好的结果。
[0152]
s3，基于职能语义的电子政务知识图谱的关系抽取算法
[0153]
基于职能语义的领域知识图谱关系抽取算法利用政府职能与政务信息系统层次化的特点获取电子政务子系统与政务职能之间的关系，并由此关系直接或间接建立起电子政务系统与政务职能之间的关系。算法利用政务子系统命名特征，以中文分词及dsg算法所预训练的词向量相似度为基础，融入排列思想解决细粒度分词所造成的语义缺失及歧义关系的问题，有效地抽取出了电子政务子系统与政务职能间的关系。
[0154]
基于职能语义的电子政务知识图谱的关系抽取算法流程图如图6所示，电子政务系统的子系统依据功能进行定义和划分，基本可划分为“政务职能建设子系统”及“软件功能实现子系统”两类。子系统名称均为短文本且为多个词语的组合，根据词语在子系统中的表达意思的差异，又可将子系统名称中的描述词主要划分成子系统功能描述词、功能执行方式词、软件描述词、功能对象四类。子系统功能描述词:子系统名称中描述和软件实际功能相关的词语。功能执行方式词:实现某功能的方式；软件描述词：与软件概念相关词汇；功能对象：某功能所从属的部门；由于子系统功能描述词基本为名词及动名词，通过分词后的词性筛选，可从由多个词语组成的子系统名称中获取子系统功能描述部分。为了解决细粒度分词对子系统名称中政务含义的破坏，通过排列的方式极大程度的恢复出子系统名称中所有的潜在语义。利用两类子系统与政务职能之间语义相似度的差异及子系统的命名规律，提出基于职能语义的电子政务知识图谱的关系抽取算法，采用directional skip-gram(dsg)算法训练好大规模近义词词向量进行文本相似度的计算，最后对所有排列的结果进行词向量相似度的计算，选取对应相似度最高的职能词构成子系统及职能间的三元组，在关系抽取的同时消除歧义。
[0155]
s4，基于lda主题模型的知识扩充
[0156]
抽取半结构化数据(项目申报书的项目概述(电子政务系统简介))作为数据源，进行数据清洗，去除停用词、去除非法字符，去除常用软件描述词，之后计算每个部门的文档集的困惑度。当困惑度达到最小时，可以确定主题数。通过训练每一个政务部门的lda主题模型，可得出每一个部门所对应的主题、主题词及主题词的权重向量，将各部门的主题储存为知识图谱中的主题实体，对应的主题词和主题词的权重向量存为主题的属性。
[0157]
综合s1中的数据整合、s2和s3中的知识抽取、以及s4中的知识扩充，得到初步知识表示。
[0158]
s5，利用已有知识(专家知识)进行实体链接后，得到标准知识表示(三元组数据)。在进行实体链接操作时，是利用已有知识对抽取的初步三元组数据进行处理，得到标准三元组数据，然后加入到电子政务领域知识图谱中。实体链接中的关键是实体消歧，目的是将有歧义的命名性指称项映射到实际所指的实体概念上去，主要用于解决一个命名实体的指
称项对应了多个实体概念的“一词多义”现象。
[0159]
基本解决方案是通过手工构建规则完成消歧工作，或通过构建实体的特征向量，基于向量的相似性进行去重、去近似处理，从而完成实体的消歧工作。由于手工消歧的方式费事费力，因而基于词向量相似度进行消歧及链接更为适合本发明。
[0160]
实体链接后得到标准知识，利用标准知识修订步骤一的数据模型，得到实例和实例之间的关系，将此规范后得到标准三元组数据(标准知识最终表示形态是标准三元组数据)。
[0161]
s6，创建电子政务领域知识图谱
[0162]
经过上述处理后得到规范化的三元组，将这些三元组存入到neo4j图数据库，利用cypher语言对neo4j图数据库执行crud操作,将这些三元组链接并存入图数据库neo4j中，就得到了电子政务领域知识图谱，如图7所示。
[0163]
在步骤s5中得到标准知识表示后进行知识推理，就是根据步骤一的数据模型和标准三元组数据，依据推理规则(人为经验)进行知识发现，即获取新的知识或者结论，再加入电子政务领域知识图谱。步骤三，逻辑推理与二维及三维可视化方法
[0164]
如图8所示，以电子政务领域知识图谱为基础，将知识推理与可视化相结合，从已有信息中推理深层信息以可视化的方式呈现，经过人与可视化界面的交互分析获取新的知识及结论并且帮助知识图谱的更新，知识可作为新的数据重新进行可视分析的流程。
[0165]
逻辑推理如图9所示，tbox和abox上的推理机制：在tbox术语集和abox断言集的基础上，通过语法构建语义，形成的推理规则，逻辑语法如图9(表)。tbox术语集:是有关概念和角色的蕴含公理集合，声明概念或角色间的包含关系。其中，定义用于引入概念以及关系的名称，包含用于声明具有包含关系的公理。abox断言集:是有关个体的实例断言集合，断言包括声明个体是某概念的实例，以及个体之间的二元关系。abox断言包含概念断言和关系断言，概念断言用来表示一个对象是否属于某个概念，关系断言表示两个对象是否满足特定关系。概念和概念,关系和概念之间可以组成更复杂的概念:交并非存在量词和全称量词
[0166]
按推理规则执行后，得到的知识图谱的一部分，如图10所示。该图对应的echarts图如图11所示，即利用推理逻辑后形成的二维可视化分析结果。
[0167]
根据电子政务系统、电子政务子系统、政务职能和子职能之间的关系和类的从属关系，构建如下推理规则即可获取电子政务系统以及电子政务系统与政务职能之间的关系：
[0168][0169]
其中a为某政务职能变量，duty_system(a,system)为某职能a及拥有该职能的所有电子政务系统之间的关系；由于subduty和duty及subsystem和system是父子类关系，为了简化表示，所以这里用表示他们的sub_of和function_of关系；
为所有职能a下的电子政务系统各职能上的系统数量统计。
[0170][0171]
其中，b为某一部门变量，duty_system(system).system为b部门所有职能下的电子政务系统。
[0172]
每一职能下的政务系统建设量可以有效地反映出该职能的建设情况，是发现”重复投资问题”的重要依据。将推理后得到的数据进行统计并以二维图呈现，加入时间因素，可更加有效地对比出年度职能建设情况及年度间职能建设上的变化。
[0173]
重复系统可视化如图12的重复系统饼状图所示，显示了本发明中利用推理逻辑后形成的二维可视化分析结果。每个分区的大小代表该项目和不同项目重复比率的大小。
[0174]
直接指向政务系统实体的实体有主题、子系统及共享数据资源，因此，分析新建或已有的某一项目与其他项目的重复度可以从这三个角度出发，综合考虑系统所服务的职能、所使用的数据资源来分析和其他系统的重复比率。
[0175]
某系统i与另一系统j的重复率p
i,j
定义如下：
[0176][0177][0178][0179]
t
i,j
＝w
i
.w
j
[0180]
其中，f
i,j
为系统i同j的重复职能子系统建设率，f
i,j
为系统i中和系统j属于同一职能的子系统数量，f
i
为系统i中所有用于职能建设的子系统数量，由于普通操作类的子系统如登录子系统、用户管理子系统等对于真正的政务系统评估不具有太多意义，因此只选取用于职能建设的子系统进行分析。d
i,j
为系统i同j的使用的数据资源重复率，d
i,j
为系统i中和系统j重复数据资源数量，d
i
为系统i所用的所有数据资源数量。t
i,j
为系统i同j的主题相似率，w
i
、w
j
分别为系统i和j的主题权重向量。
[0181]
基于领域知识图谱，f
i,j
可由下述推理规则得到：
[0182][0183]
其中，s y s it为要进行比较的电子政务系统实体i，belong_to(function_of(i,subsystem),duty).duty为电子政务系统i所拥有的政务职能，similar_duty(i,j).i为f
i,j
。
[0184]
d
i,j
可由下述推理规则得到：
[0185]
其中，source_of(i,sharingdata).sharingdata为电子政务系统i所拥有的数据资源，为d
i，j
。
[0186]
w
i
、w
j
通过获取主题实体的属性即可得到。
[0187]
在计算了p
i,j
的基础上，就能对所要分析的系统i的所有具有重复可能的系统进行排查。
[0188]
电子政务系统的逻辑推理与“三维”可视分析方法：
[0189]
采用政务系统的职能建设率、数据资源共享率以及政务系统的资金审批率三个指标对电子政务系统进行三维可视化，就可以进一步明晰上述问题，使得对于项目的重复建设程度具有更加客观的决策依据。针对可视化目标，如下选取了可立体展示的三维散点图以及可以直观展示维度间关系的雷达图进行可视化，以满足管理者对部门电子政务系统全貌中与申报项目的关联关系评判。如图13和图14所示，图13展示单一或少量项目的“三维”情况，图14展示一个部门或多个部门的电子政务系统分布状况，三个坐标轴为分别代表政务系统的职能建设率、数据资源共享率及资金审批率，每一个点代表一个系统，用不同颜色区分出从属的部门。下图中的政务系统的政务职能建设率p
f
、数据资源共享率p
d
、资金审批率p
m
分别进行下述定义。
[0190]
政务职能建设率p
f
[0191]
根据本文前述的本体概念，电子政务系统分为“政务职能建设子系统”及“软件功能实现子系统”两类，每个政务系统按照这两类不同子系统的不同比例的组合形成一个完整的系统，但其中服务于政府职能建设的只有“政务职能建设子系统”，而其它子系统都只
是为了辅助核心功能而存在；另外，当今的软件系统均采用集成式开发环境实现，其基础功能子系统(如用户管理、登录等)都拥有大量的开源资源且可模块化地使用，几乎不再产生开发价值。因此，在评价电子政务系统的有效性时，不能以子系统的数量、规模作为评价要素，而是应该按照《关于开展国家电子政务工程项目绩效评价工作的意见》(发改高技【2015】200号)从职能建设的有效性角度进行评价。为了衡量“政务职能建设子系统”在电子政务系统中的占比，定义政务系统的职能建设率p
f
如下:
[0192][0193]
f
duty
为某电子政务系统中所包含的实现职能功能的子系统数量，f
all
为某电子政务系统中所有的子系统数量。
[0194]
利用电子政务领域知识图谱进行如下推理，可获得拥有职能-子系统关系的某系统w中的子系统，对其进行统计即可获得f
duty
[0195][0196]
数据资源共享率p
d
[0197]
在当今政务信息系统普遍使用“政务云”平台的背景下，电子政务系统间的关系也可以用他们之间共享利用的数据资源来表示。一个政务系统所产生的的数据资源如果可以被较多的政务系统需要，说明该系统的建设价值就越高；一个政务系统所利用的共享数据资源类别越多，说明其不重复采集数据的建设规范度越好。为呈现系统的数据资源利用特征，将某系统的数据资源共享率p
d
定义如下:
[0198][0199]
其中，d
share
表示该系统中和其他系统有共享关系的数据资源，d
all
代表该系统中所有的数据资源。通过此指标可以有效地表示出电子政务系统中所采集、使用的数据的价值。
[0200]
基于知识图谱进行推理，可知某政务系统w中和其他系统拥有数据共享关系的数据资源，对该数据资源进行统计可知d
share
[0201][0202]
资金审批率p
m
[0203]
依赖调阅与查询历史申报数据来识别政府部门政务信息系统的政务职能多频次、短时间的重复建设这一隐性问题一直具有很大难度。为辅助管理者更好地识别此类隐性问题，设计资金审批率可有效地可视化出一个项目政务职能建设的历史资金使用情况。经过项目数据的积累，该指标更可反映出政府部门的信息化管理水平，并为后续的审计工作奠
定坚实的基础。资金审批率p
m
定义如下：
[0204][0205]
其中，m
a
为审批资金，m
s
为申报资金，通过知识图谱中电子政务系统的属性即可获得m
a
及m
s
。
[0206]
利用上述三个维度的指标可以有效地可视化出部门电子政务系统的职能高效、资源共享的信息化建设管理水平。以平面雷达图(radar)的方式展示单一或少量项目的“三维”情况。以三维散点图(3d scattering)的可视化方式展示一个部门或多个部门的电子政务系统分布状况，三个坐标轴分别代表政务系统的职能建设率、数据资源共享率及资金审批率，每一个点代表一个系统，用不同颜色区分出从属的部门；与此同时，三维散点图可以任意角度旋转，从不同的视角去看整体项目的分布情况，也可以选择一个或多个部门去了解系统的“三维”建设情况。
[0207]
(8)政务部门关系可视化方法
[0208]
电子政务领域知识图谱的创建还可以借助政府各部门的系统建设主题分析部门之间的信息系统关系并将其可视化，辅助管理者从更高的层级审视政府部门间的建设合理性问题，从而有效支持管理者决策。
[0209]
本成果定义各部门的主题可表示为topic＝{t1,t2,t3...t
n
}主题向量可用主题词表示为t＝{t1,t2,t3...t
n
}，主题词的权重向量为w＝{w1,w2,w3...w
n
}。
[0210]
通过主题词和主题词的权重向量可得知两个部门间的主题相似度矩阵，主题相似度计算公式定义如下：
[0211][0212]
其中s
t,t'
为主题t和t'的相似度，similar(t
i
,t'
j
)为主题词之间的相似度，利用余弦相似度进行计算，公式如下：
[0213][0214]
通过设定阈值统计主题相似度矩阵中大于阈值的主题个数确定两部门之间的关联关系，公式如下：
[0215][0216]
在此基础上，对省级政府所有部门的关系进行可视化，将s
t,t'
设为网络关系图中的边的权重，就可以得到信息化网络关系图，如图15所示，通过lda模型得到的各部门对应的主题词和主题词的权重向量，可计算出部门间的主题相似度矩阵，设定阈值统计主题相似度矩阵中大于阈值的主题个数确定两部门之间的关联关系，在此基础上，对省市的所有部门的关系进行可视化，得到信息化网络关系图。其中各个部门节点的大小由政务系统的数量决定，通过交互可以展示出两个部门之间的关系权重。还可以通过缩小所需了解的部
门的范围，更加清晰地了解部门之间的关系。
[0217]
本发明利用创建电子政务领域知识图谱的方法实现知识关联，通过补充完善决策知识，实现知识推理与可视化问题的方式支持电子政务项目审批决策。本发明依靠半自动化实现，需要政府信息化历史项目数据的支持。本成果的代码实现环境为window10操作系统和python3.6代码环境、mysql数据库存储初始及中间数据、neo4j用于知识图谱的存储、echarts进行可视界面的搭建。本成果形成的各类功能还支持常用编程语言环境(java、c 等)来调用实现或根据本成果的逻辑实现。
[0218]
以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法与流程

相关文献

最热文献