一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种城市领域知识图谱可信评估方法及系统与流程

2021-12-14 23:37:00 来源:中国专利 TAG:


1.本发明涉及知识图谱领域,具体涉及一种城市领域知识图谱可信评估方法及系统。


背景技术:

2.知识图谱通过知识三元组来描述现实世界中的事实,在构建知识图谱的过程中,难以避免地会引入噪声,而已有的知识图谱系统缺乏对知识的可信性评估和保障,这会给知识图谱应用带来潜在的损害。城市中存在着对知识可信性要求差异显著的多样化应用场景,例如城市景点推荐、城市发展决策、城市疫情监测等,为了能够给城市中多样化的应用场景提供可信的知识服务,知识图谱中知识的可信性评估与保障成为需要解决的关键问题。目前,国内外关于知识可信性的研究还处于起步阶段,尚无知识可信属性模型、知识可信评估方法、知识可信分级评估的标准或者规范。现有技术中,一些方法利用表示学习来将知识三元组表示为低维度的向量,通过向量距离还检测知识图谱中的噪声,这些方法可以在一定程度上对知识图谱进行去噪,但是没有量化知识的可信度。


技术实现要素:

3.针对现有技术中存在的缺陷,本发明的目的在于提供一种城市领域知识图谱可信评估方法及系统,能够量化知识或知识模型的可信性,保障了城市领域知识模型的质量,满足了不同领域不同用户的知识需求。
4.为实现上述目的,本发明采用的技术方案如下:
5.一种城市领域知识图谱可信评估方法,包括:
6.s100、从领域知识可信证据模型获取知识获取阶段、知识推理阶段和知识验证阶段的可信证据;
7.s200、基于获取的可信证据以及领域知识可信属性模型中可信属性特征值的计算方法,计算知识实体和知识模型的可信属性特征值,所述可信属性包括可靠性、正确性、时效性、安全性和可访问性;
8.s300、基于所述知识实体的可信属性特征值计算所述知识实体的可信度,或者基于所述知识模型的可信属性特征值计算所述知识模型的可信度;
9.s400、基于所述知识实体或所述知识模型的可信度,以及所述知识模型的生命周期所具有的可信证据对知识实体的可信度的支持程度,对所述知识实体或所述知识模型划分可信等级。
10.进一步,如上所述的系统,s200中,所述知识实体包括知识概念、知识实例、知识属性和知识关系,计算所述知识实体的可信属性特征值,包括:
11.(1)度量知识实体的可靠性:通过下式计算第k个知识实体的可靠性特征值r:
12.13.β=max(e
ds
)*max(e
dt
)

min(e
ds
)*min(e
df
),
14.其中,e
ds
为数据来源证据,e
df
为数据类型证据,e
dt
为数据时间证据,β为归一化因子,n为数据来源的个数;
15.(2)度量知识实体的正确性:通过下式计算第k个知识实体的正确性特征值c:
16.c=a1e
dq
a2(e
ra
*e
rr
) a3max(e
uv
,e
tr
),
17.e
dq
=(1

e
dd
)*(1

e
dr
)*e
dc
e
cp
*e
ch
*e
em
e
te
*e
ec

18.其中,e
dq
为数据质量证据,e
uv
为用户访问证据,e
ra
为推理算法性能证据,e
rr
为推理结果证据,e
tr
为第三方验证报告证据,a1,a2,a3分别为知识获取阶段、知识推理阶段和知识验证阶段的权重,默认均取值1/3,e
dd
为数据缺失率证据,e
dr
为数据冗余率证据,e
dc
为概念匹配置信度证据,e
cp
为概念抽取证据,e
ch
为概念层级关系证据,e
em
为元素融合匹配概率,e
te
为三元组成立置信度证据,e
ec
为抽取算法置信度证据;
19.(3)度量知识实体的时效性:通过下式计算第k个知识实体的时效性特征值t:
20.t=max(e
dt
,e
ee
),
21.其中,e
dt
为数据时间证据,e
ee
为专家编辑证据;
22.(4)度量知识实体的安全性:通过下式计算第k个知识实体的安全性特征值s:
23.s=1

e
rd
*(1

e
uf
),
24.其中,e
rd
为风险程度证据,e
uf
为用户反馈证据;
25.(5)度量知识实体的可访问性:通过下式计算第k个知识实体的可访问性特征值a:
26.a=max(e
dm
),
27.其中,e
dm
为所属领域证据。
28.进一步,如上所述的系统,s200中,所述知识模型包括一个或多个知识实体,计算所述知识模型的可信属性特征值,包括:
29.(1)度量知识模型的可靠性:通过下式计算知识模型的可靠性特征值r':
[0030][0031]
其中,k为知识实体的个数,r
i
为第i个知识实体的可靠性特征值;
[0032]
(2)度量知识模型的正确性:通过下式计算知识模型的正确性特征值c':
[0033][0034]
其中,k为知识实体的个数,c
i
为第i个知识实体的正确性特征值;
[0035]
(3)度量知识模型的时效性:通过下式计算知识模型的时效性特征值t':
[0036]
t'=min(t1,t2,...,t
k
),
[0037]
其中,k为知识实体的个数,c
k
为第k个知识实体的时效性特征值;
[0038]
(4)度量知识模型的安全性:通过下式计算知识模型的安全性特征值s':
[0039]
s'=min(s1,s2,...,s
k
),
[0040]
其中,k为知识实体的个数,s
k
为第k个知识实体的安全性特征值;
[0041]
(5)度量知识模型的可访问性:通过下式计算知识模型的可访问性特征值h:
[0042]
h={m|a
m
≥θ,m=1,2,...,k}
[0043]
其中,θ为可访问性阈值,k为知识实体的个数,a
m
为第m个知识实体的可访问性特
征值。
[0044]
进一步,如上所述的系统,s300包括:
[0045]
通过下式计算所述知识实体的可信度kt:
[0046]
kt=α
r
r α
c
c α
t
t α
s
s α
a
a,
[0047]
α
r
α
c
α
t
α
s
α
a
=1,
[0048]
其中,α
r
为所述知识实体的可靠性特征值r的权重,α
c
为所述知识实体的正确性特征值c的权重,α
t
为所述知识实体的时效性特征值t的权重,α
s
为所述知识实体的安全性特征值s的权重,α
a
为所述知识实体的可访问性特征值a的权重。
[0049]
进一步,如上所述的系统,s300还包括:
[0050]
在计算所述知识实体的可信度时,根据用户需求进行可信属性权重配置和可信证据配置,默认配置下,五种可信属性的权重均为0.2,所有的可信证据全部用于知识可信评估。
[0051]
进一步,如上所述的系统,s300包括:
[0052]
通过下式计算所述知识模型的可信度c
r

[0053]
c
r
=α1r' α2c' α3t' α4s' α5a',
[0054]
α1 α2 α3 α4 α5=1,
[0055]
其中,α1为所述知识模型的可靠性特征值r'的权重,α2为所述知识模型的正确性特征值c'的权重,α3为所述知识模型的时效性特征值t'的权重,α4为所述知识模型的安全性特征值s'的权重,α5为所述知识模型的可访问性特征值h的权重。
[0056]
进一步,如上所述的系统,s300还包括:
[0057]
对所述知识模型的可信度进行迭代增量式计算,其中,计算新增和删除的知识实体<1,2,...,k>的可信属性特征值<r
k
,c
k
,t
k
,s
k
,a
k
>,包括:
[0058]
(1)度量新增和删除知识实体的可靠性:通过下式计算新增和删除知识实体的可靠性特征值:
[0059][0060]
其中,n为原有的知识实体数量,r为原有知识实体的平均可靠性,r’为新增知识实体的平均可靠性,r
i
为第i个知识实体的可靠性特征值;
[0061]
(2)度量新增和删除知识实体的正确性:通过下式计算新增和删除知识实体的正确性特征值:
[0062][0063]
其中,n为原有的知识实体数量,c为原有知识实体的平均正确性,c’为新增知识实体的平均正确性,c
i
为第i个知识实体的正确性特征值;
[0064]
(3)度量新增和删除知识实体的时效性:通过下式计算新增和删除知识实体的时效性特征值:
[0065]
t=min(t,t'),t'=min(t1,t2,...,t
k
),
[0066]
其中,t为原有知识模型的时效性,t’为新增知识实体的最小时效性,t
k
为第k个新增知识实体的时效性;
[0067]
(4)度量新增和删除知识实体的安全性:通过下式计算新增和删除知识实体的安全性特征值:
[0068]
s=min(s,s'),s'=min(s1,s2,...,s
k
),
[0069]
其中,s为原有知识模型的安全性,s’为新增知识实体的最小安全性,s
k
为第k个新增知识实体的安全性特征值;
[0070]
(5)度量新增和删除知识实体的可访问性:通过下式计算新增知识实体的可访问性特征值:
[0071]
h={m|a
m
≥θ,m=1,2,...,k},
[0072]
通过下式计算删除知识实体的可访问性特征值:
[0073]
h={m|a
m
≤θ,m=1,2,...,k},
[0074]
其中,θ为可访问性阈值,k为知识实体的个数,a
m
为第m个删除知识实体的可访问性特征值。
[0075]
进一步,如上所述的系统,s400包括:
[0076]
将知识可信分为五个等级,分别为:未知级、存在级、证实级、实用级和评估级,按照规则对知识实体的可信等级进行划分,包括:
[0077]
1)若知识实体的证据缺失率大于80%,又非常识和公理,或计算的可信度小于0.2,则将知识实体的可信等级定义为未知级;
[0078]
2)若存在知识可信性的证据,计算的可信度小于0.5,但没有可以验证的可信属性,则将知识实体的可信等级定义为未知级;
[0079]
3)若知识实体的可信属性中有可验证的可信证据,且存在可信属性特征值大于0.5,则将知识实体的可信等级定义为实用级;
[0080]
4)若在满足证实级的条件基础上,知识实体的证据中还包含已成功应用案例的证据,则将知识实体的可信等级定义为实用级;
[0081]
5)若知识实体的证据中还包含已通过独立权威验证、分析机构的可信分析的证据,则将知识实体的可信等级定义为评估级。
[0082]
一种城市领域知识图谱可信评估系统,包括:
[0083]
证据获取模块,用于从领域知识可信证据模型获取知识获取阶段、知识推理阶段和知识验证阶段的可信证据;
[0084]
第一计算模块,用于基于获取的可信证据以及领域知识可信属性模型中可信属性特征值的计算方法,计算知识实体和知识模型的可信属性特征值,所述可信属性包括可靠性、正确性、时效性、安全性和可访问性;
[0085]
第二计算模块,用于基于所述知识实体的可信属性特征值计算所述知识实体的可信度,或者基于所述知识模型的可信属性特征值计算所述知识模型的可信度;
[0086]
等级划分模块,用于基于所述知识实体或所述知识模型的可信度,以及所述知识模型的生命周期所具有的可信证据对知识实体的可信度的支持程度,对所述知识实体或所述知识模型划分可信等级。
[0087]
进一步,如上所述的系统,所述知识实体包括知识概念、知识实例、知识属性和知
识关系,计算所述知识实体的可信属性特征值,包括:
[0088]
(1)度量知识实体的可靠性:通过下式计算第k个知识实体的可靠性特征值r:
[0089][0090]
β=max(e
ds
)*max(e
dt
)

min(e
ds
)*min(e
df
),
[0091]
其中,e
ds
为数据来源证据,e
df
为数据类型证据,e
dt
为数据时间证据,β为归一化因子,n为数据来源的个数;
[0092]
(2)度量知识实体的正确性:通过下式计算第k个知识实体的正确性特征值c:
[0093]
c=a1e
dq
a2(e
ra
*e
rr
) a3max(e
uv
,e
tr
),
[0094]
e
dq
=(1

e
dd
)*(1

e
dr
)*e
dc
e
cp
*e
ch
*e
em
e
te
*e
ec

[0095]
其中,e
dq
为数据质量证据,e
uv
为用户访问证据,e
ra
为推理算法性能证据,e
rr
为推理结果证据,e
tr
为第三方验证报告证据,a1,a2,a3分别为知识获取阶段、知识推理阶段和知识验证阶段的权重,默认均取值1/3,e
dd
为数据缺失率证据,e
dr
为数据冗余率证据,e
dc
为概念匹配置信度证据,e
cp
为概念抽取证据,e
ch
为概念层级关系证据,e
em
为元素融合匹配概率,e
te
为三元组成立置信度证据,e
ec
为抽取算法置信度证据;
[0096]
(3)度量知识实体的时效性:通过下式计算第k个知识实体的时效性特征值t:
[0097]
t=max(e
dt
,e
ee
),
[0098]
其中,e
dt
为数据时间证据,e
ee
为专家编辑证据;
[0099]
(4)度量知识实体的安全性:通过下式计算第k个知识实体的安全性特征值s:
[0100]
s=1

e
rd
*(1

e
uf
),
[0101]
其中,e
rd
为风险程度证据,e
uf
为用户反馈证据;
[0102]
(5)度量知识实体的可访问性:通过下式计算第k个知识实体的可访问性特征值a:
[0103]
a=max(e
dm
),
[0104]
其中,e
dm
为所属领域证据。
[0105]
本发明的有益效果在于:本发明利用知识可信属性模型对知识的可信性内涵进行拆分,然后利用可信属性模型来收集知识完整生命周期中的可信相关的数据和信息作为可信证据来评估知识可信属性值,然后综合知识的可信属性值得到知识的可信度,能够全面、多维度地量化评估知识图谱中知识的可信度。
附图说明
[0106]
图1为本发明实施例中提供的一种多视角的城市领域知识图谱可信评估方法的流程示意图;
[0107]
图2为本发明实施例中提供的一种多视角的城市领域知识图谱可信评估方法的框架图;
[0108]
图3为本发明实施例中提供的领域知识可信属性模型的示意图;
[0109]
图4为本发明实施例中提供的领域知识可信证据模型的示意图;
[0110]
图5为本发明实施例中提供的可信评估方法配置界面示意图;
[0111]
图6为本发明实施例中提供的可信分级模型示意图;
[0112]
图7为本发明实施例中提供的一种多视角的城市领域知识图谱可信评估系统的结
构示意图。
具体实施方式
[0113]
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述。
[0114]
本发明实施例提供了一种多视角的城市领域知识图谱可信评估方法,如图1

2所示,该方法包括:
[0115]
s100、从领域知识可信证据模型获取知识获取阶段、知识推理阶段和知识验证阶段的可信证据。
[0116]
图3为领域知识可信证据模型的示意图,领域知识可信证据模型定义了支持知识可信性评估的证据集合,是知识可信性评估的数据来源。我们将知识生命周期划分为三个阶段:知识获取阶段、知识推理阶段和知识验证阶段,从各阶段采集知识可信性相关的证据。可信证据模型记录了知识生命周期中产生的证据名称和类别,为领域知识模型知识可信性评估与保障提供依据。
[0117]
s200、基于获取的可信证据以及领域知识可信属性模型中可信属性特征值的计算方法,计算知识实体和知识模型的可信属性特征值,可信属性包括可靠性、正确性、时效性、安全性和可访问性。
[0118]
图4为领域知识可信属性模型的示意图,根据领域知识模型知识可信性度量方法中定义的可信属性模型中可信属性特征值的计算方法,利用证据模型所采集的证据计算知识实体的五种可信属性,然后利用知识的可信属性通过统计的方法计算知识图谱模型的五种可信属性。
[0119]
s200中,知识实体包括知识概念、知识实例、知识属性和知识关系,计算知识实体的可信属性特征值,包括:
[0120]
(1)度量知识实体的可靠性:通过下式计算第k个知识实体的可靠性特征值r:
[0121][0122]
β=max(e
ds
)*max(e
dt
)

min(e
ds
)*min(e
df
),
[0123]
其中,e
ds
为数据来源证据,e
df
为数据类型证据,e
dt
为数据时间证据,β为归一化因子,n为数据来源的个数。
[0124]
(2)度量知识实体的正确性:通过下式计算第k个知识实体的正确性特征值c:
[0125]
c=a1e
dq
a2(e
ra
*e
rr
) a3max(e
uv
,e
tr
),
[0126]
e
dq
=(1

e
dd
)*(1

e
dr
)*e
dc
e
cp
*e
ch
*e
em
e
te
*e
ec

[0127]
其中,e
dq
为数据质量证据,e
uv
为用户访问证据,e
ra
为推理算法性能证据,e
rr
为推理结果证据,e
tr
为第三方验证报告证据,a1,a2,a3分别为知识获取阶段、知识推理阶段和知识验证阶段的权重,默认均取值1/3,e
dd
为数据缺失率证据,e
dr
为数据冗余率证据,e
dc
为概念匹配置信度证据,e
cp
为概念抽取证据,e
ch
为概念层级关系证据,e
em
为元素融合匹配概率,e
te
为三元组成立置信度证据,e
ec
为抽取算法置信度证据。
[0128]
知识实体的正确性可通过第三方权威机构进行分析验证,判断知识实体是否正确,并出具第三方验证报告。当第三方验证报告证据存在时,通过了第三方机构的检验,则
正确性置为1,即知识实体是正确的;没有通过第三方验证时正确性置为0,表示该知识实体是错误的。智慧城市领域知识图谱模型中,存在大量未经过第三方机构权威检验的知识实体,缺少第三方验证报告,因此本文将该证据值则默认置为0.5。
[0129]
(3)度量知识实体的时效性:通过下式计算第k个知识实体的时效性特征值t:
[0130]
t=max(e
dt
,e
ee
),
[0131]
其中,e
dt
为数据时间证据,e
ee
为专家编辑证据。
[0132]
时效性t主要由数据时间证据和专家操作时间证据共同评估得到。对于常识或公理等知识,t=1,常识或公理需要通过人机交互获得,主要由专家、群智任务参与者和用户反馈获得。
[0133]
(4)度量知识实体的安全性:通过下式计算第k个知识实体的安全性特征值s:
[0134]
s=1

e
rd
*(1

e
uf
),
[0135]
其中,e
rd
为风险程度证据,e
uf
为用户反馈证据。
[0136]
(5)度量知识实体的可访问性:通过下式计算第k个知识实体的可访问性特征值a:
[0137]
a=max(e
dm
),
[0138]
其中,e
dm
为所属领域证据。
[0139]
s200中,知识模型包括一个或多个知识实体,计算知识模型的可信属性特征值,包括:
[0140]
(1)度量知识模型的可靠性:通过下式计算知识模型的可靠性特征值r':
[0141][0142]
其中,k为知识实体的个数,r
i
为第i个知识实体的可靠性特征值;
[0143]
(2)度量知识模型的正确性:通过下式计算知识模型的正确性特征值c':
[0144][0145]
其中,k为知识实体的个数,c
i
为第i个知识实体的正确性特征值;
[0146]
(3)度量知识模型的时效性:通过下式计算知识模型的时效性特征值t':
[0147]
t'=min(t1,t2,...,t
k
),
[0148]
其中,k为知识实体的个数,c
k
为第k个知识实体的时效性特征值;
[0149]
(4)度量知识模型的安全性:通过下式计算知识模型的安全性特征值s':
[0150]
s'=min(s1,s2,...,s
k
),
[0151]
其中,k为知识实体的个数,s
k
为第k个知识实体的安全性特征值;
[0152]
(5)度量知识模型的可访问性:通过下式计算知识模型的可访问性特征值h:
[0153]
h={m|a
m
≥θ,m=1,2,...,k}
[0154]
其中,θ为可访问性阈值,k为知识实体的个数,a
m
为第m个知识实体的可访问性特征值。
[0155]
s300、基于知识实体的可信属性特征值计算知识实体的可信度,或者基于知识模型的可信属性特征值计算知识模型的可信度。
[0156]
s300包括:
[0157]
通过下式计算知识实体的可信度kt:
[0158]
kt=α
r
r α
c
c α
t
t α
s
s α
a
a,
[0159]
α
r
α
c
α
t
α
s
α
a
=1,
[0160]
其中,α
r
为可靠性r的权重,α
c
为正确性c的权重,α
t
为时效性t的权重,α
s
为安全性s的权重,α
a
为可访问性a的权重。
[0161]
在面向具体应用场景时,五种可信属性的权重可由用户按照自身的需求进行配置,如图5所示,系统提供了知识可信性计算配置功能,用户可根据需求进行两个层次的设置:1)可信属性权重配置,不同领域对于知识可信属性的关注点不同,例如人们对于天气气象更关注知识的时效性,而对于医疗领域,人们更加注重知识的正确性。2)可信证据配置,用户可根据需求选择参与知识可信性评估的可信证据,未被选择的可信证据不会参与知识的可信性评估。默认配置下,五种可信属性的权重为0.2,所有的可信证据全部用于知识可信评估。可定制的知识可信评估方法使计算出来的知识可信性能够更好的满足对应应用场景的需求。
[0162]
s300包括:
[0163]
通过下式计算知识模型的可信度c
r

[0164]
c
r
=α1r' α2c' α3t' α4s' α5a',
[0165]
α1 α2 α3 α4 α5=1,
[0166]
其中,α1为可靠性r'的权重,α2为正确性c'的权重,α3为时效性t'的权重,α4为安全性s'的权重,α5为可访问性h的权重。
[0167]
知识可信属性模型中五种可信属性的权重,由用户决定,默认情况下,五种可信属性的权重为0.2。由于领域知识模型的不断更新演化,局部模型或者整体模型会越来越庞大复杂,如果每次领域知识模型发生改变后都重新计算知识模型的可信度,不但会浪费计算资源,还会影响领域知识模型的可用性。因此,需要进行迭代增量式的知识模型可信度计算。
[0168]
对知识模型的可信度进行迭代增量式计算,其中,计算新增和删除的知识实体<1,2,...,k>的可信属性特征值<r
k
,c
k
,t
k
,s
k
,a
k
>,包括:
[0169]
(1)度量新增和删除知识实体的可靠性:通过下式计算新增和删除知识实体的可靠性特征值:
[0170][0171]
其中,n为原有的知识实体数量,r为原有知识实体的平均可靠性,r’为新增知识实体的平均可靠性,r
i
为第i个知识实体的可靠性特征值;
[0172]
(2)度量新增和删除知识实体的正确性:通过下式计算新增和删除知识实体的正确性特征值:
[0173][0174]
其中,n为原有的知识实体数量,c为原有知识实体的平均正确性,c’为新增知识实体的平均正确性,c
i
为第i个知识实体的正确性特征值;
[0175]
(3)度量新增和删除知识实体的时效性:通过下式计算新增和删除知识实体的时效性特征值:
[0176]
t=min(t,t'),t'=min(t1,t2,...,t
k
),
[0177]
其中,t为原有知识模型的时效性,t’为新增知识实体的最小时效性,t
k
为第k个新增知识实体的时效性;
[0178]
(4)度量新增和删除知识实体的安全性:通过下式计算新增和删除知识实体的安全性特征值:
[0179]
s=min(s,s'),s'=min(s1,s2,...,s
k
),
[0180]
其中,s为原有知识模型的安全性,s’为新增知识实体的最小安全性,s
k
为第k个新增知识实体的安全性特征值;
[0181]
(5)度量新增和删除知识实体的可访问性:通过下式计算新增知识实体的可访问性特征值:
[0182]
h={m|a
m
≥θ,m=1,2,...,k},
[0183]
通过下式计算删除知识实体的可访问性特征值:
[0184]
h={m|a
m
≤θ,m=1,2,...,k},
[0185]
其中,θ为可访问性阈值,k为知识实体的个数,a
m
为第m个删除知识实体的可访问性特征值。
[0186]
s400、基于知识实体或知识模型对用户所期望的可信属性的满足程度,以及知识模型的生命周期所具有的可信证据对知识实体的可信度的支持程度,对知识实体或知识模型划分可信等级。
[0187]
s400包括:
[0188]
将知识可信分为五个等级,分别为:未知级、存在级、证实级、实用级和评估级,按照规则对知识实体的可信等级进行划分,包括:
[0189]
1)若知识实体的证据缺失率大于80%,又非常识和公理,或计算的可信度小于0.2,则将知识实体的可信等级定义为未知级;
[0190]
2)若存在知识可信性的证据,计算的可信度小于0.5,但没有可以验证的可信属性,则将知识实体的可信等级定义为未知级;
[0191]
3)若知识实体的可信属性中有可验证的可信证据,且存在可信属性特征值大于0.5,则将知识实体的可信等级定义为实用级;
[0192]
4)若在满足证实级的条件基础上,知识实体的证据中还包含已成功应用案例的证据,则将知识实体的可信等级定义为实用级;
[0193]
5)若知识实体的证据中还包含已通过独立权威验证、分析机构的可信分析的证据,则将知识实体的可信等级定义为评估级。
[0194]
如图6所示,对知识实体或知识模型划分可信等级的可信分级模型示意图。知识可信等级是一个知识可信性的量化标度。依据知识或知识模型对用户所期望的可信属性的满足程度,以及知识模型生命周期所具有的可信证据对知识可信性的支持程度。借鉴软件可信的可信分级标准,根据满足的程度和可信评估值划分不同的等级。将知识可信分为5个等级,分别命名为:未知级、存在级、证实级、实用级和评估级。按照规则对知识的可信等级进行划分:1)关于知识可信性的证据很少,证据缺失率大于80%,又非常识和公理,或计算的
可信度小于0.2,知识的可信等级定义为未知级;2)存在知识可信性的证据,计算的可信度小于0.5,但没有可以验证的可信属性,知识的可信等级定义为未知级。3)知识实体的可信属性中有可验证的可信证据,且存在可信属性特征值大于0.5,知识实体的可信等级定义为实用级。4)在满足证实级的条件基础上,知识实体的证据中还包含已成功应用案例的证据,知识实体的可信等级定义为实用级。5)知识实体的证据中还包含已通过独立权威验证、分析机构的可信分析的证据,知识实体的可信等级定义为评估级。
[0195]
采用本发明实施例的方法,利用知识可信属性模型对知识的可信性内涵进行拆分,然后利用可信属性模型来收集知识完整生命周期中的可信相关的数据和信息作为可信证据来评估知识可信属性值,然后综合知识的可信属性值得到知识的可信度,能够全面地,多维度地量化评估知识图谱中知识的可信度。
[0196]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0197]
根据本发明实施例的另一个方面,还提供了一种城市领域知识图谱可信评估系统,如图7所示,包括:
[0198]
证据获取模块100,用于从领域知识可信证据模型获取知识获取阶段、知识推理阶段和知识验证阶段的可信证据;
[0199]
第一计算模块200,用于基于获取的可信证据以及领域知识可信属性模型中可信属性特征值的计算方法,计算知识实体和知识模型的可信属性特征值,可信属性包括可靠性、正确性、时效性、安全性和可访问性;
[0200]
第二计算模块300,用于基于知识实体的可信属性特征值计算知识实体的可信度,或者基于知识模型的可信属性特征值计算知识模型的可信度;
[0201]
等级划分模块400,用于基于知识实体或知识模型的可信度,以及知识模型的生命周期所具有的可信证据对知识实体的可信度的支持程度,对知识实体或知识模型划分可信等级。
[0202]
需要说明的是,本发明的一种城市领域知识图谱可信评估系统与前述的一种城市领域知识图谱可信评估方法属于同一发明构思,具体实施方式不再赘述。
[0203]
采用本发明实施例的系统,利用知识可信属性模型对知识的可信性内涵进行拆分,然后利用可信属性模型来收集知识完整生命周期中的可信相关的数据和信息作为可信证据来评估知识可信属性值,然后综合知识的可信属性值得到知识的可信度,能够全面地,多维度地量化评估知识图谱中知识的可信度。
[0204]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献