一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于DIKW的专利智能辅助审查方法及系统与流程

2021-10-24 06:07:00 来源:中国专利 TAG:审查 辅助 专利 智能 方法

一种基于dikw的专利智能辅助审查方法及系统
技术领域
1.本发明涉及dikw图谱技术领域,尤其涉及一种基于dikw的专利智能辅助审查方法及系统。


背景技术:

2.dikw是关于数据、信息、知识和智慧的体系,它解释了四种元素之间的关系。其也在信息科学和知识管理领域中一直被讨论。它是最基本的,最广泛认可的和最理所当然的模型之一,dikw图谱架构包括数据图谱、信息图谱和知识图谱。
3.数据图谱(data graph)是各种数据结构,如栈、队列等。其可以记录对象的频度属性,如时间频度、空间频度和结构频度等,然后通过计算它们的综合频度以服务信息图谱和知识图谱的信息清洗和语义计算。
4.信息图谱(information graph)用于存储专利内容资源间的各种交互关系,如产品组件之间的组合、产品设计的步骤等,并通过有向图的形式可视化展示。
5.知识图谱(knowledge graph)是用于记录规则的有向图,能够被用来进行各种语义计算。
6.专利文献cn111988339a公开一种基于dikw模型的网络攻击路径发现、提取和关联的方法,属于网络安全技术领域。是为了解决传统网络检测方法只能发现孤立的攻击事件和判断单个攻击事件的威胁程度,缺少对攻击事件信息提取分析能力和对攻击态势整体判断能力的问题。对网络攻击信息进行总结形成知识图谱,通过采集的网络行为数据d与知识k库进行比对匹配,对匹配到的网络行为数据d进行扩展、去重与合并,得到的攻击信息i进入对应的智慧模型w,判定信息i和关联信息是否满足智慧模型w中的逻辑关系,是则生成攻击事件链条,否则对攻击信息i进行存盘。适用于传统互联网,工业互联网、移动互联网和物联网等网络安全领域。
7.专利文献cn111858960a公开一种面向本质计算的跨dikw图谱的虚拟社区资源处理方法、装置、设备及可读存储介质,该方法包括:利用虚拟社区的网络类型资源,建立dikw图谱;dikw图谱中包括数据图谱、信息图谱和知识图谱;对dikw图谱中的数据、信息和知识进行相互转换,并利用转换结果更新dikw图谱,直到dikw图谱达到动态平衡;从dikw图谱中提取目标客户端的交互关系元组,并利用交互关系元组确定出目标客户端的亲密交流关系客户端;结合交互关系元组和亲密交流关系客户端,确定目标客户端的特征标签;从虚拟社区中确定出与特征标签对应的目标资源,并将目标资源分配给目标客户端。该本方法能够实现个性化分配资源,能够满足用户的个性化需求。
8.专利文献cn112232082a公开一种面向本质计算的多模态dikw内容多语义分析方法,该方法包括以下步骤:s1、获取类型资源进行语义识别,根据识别结果判断是否存在多语义,所述类型资源包括数据资源ddikw、信息资源idikw和知识资源kdikw;s2、存在多语义时,分析多语义形成原因;s3、基于多语义形成原因,采用相应策略将原类型资源转换为新的类型资源,获取最终语义识别结果。本发明可以帮助人工智能系统提高语言文本识别效
率,并提高识别结果准确率。
9.在发明专利的智能辅助审查过程中,不可或缺的是对现有发明技术的检索需求,如何找到审查员想要的现有技术在审查中是非常重要的,目前现有技术中并未发现将dikw图谱用于专利审查的搜索技术,因此,将dikw图谱用于专利审查的搜索分析依然是本领域技术人员的研究方向。


技术实现要素:

10.本发明的目的在于提供一种基于dikw的专利智能辅助审查方法及系统,在审查检索过程中,针对具有正向和负向趋势的问题提供渐进式搜索方法,通过多次渐进式搜索来提高资源的可信度,在渐进式搜索过程中,将消除具有歧义倾向和虚假信息的资源,避免针对无限和复杂问题的死循环,从而提供一个高精度的搜索结果。
11.本发明是通过以下技术方案实现的:本发明第一方面提供了一种基于dikw的专利智能辅助审查方法,包括下列步骤:
12.基于基础数据,构建dikw图谱,其中所述基础数据至少包括专利数据库中的专利数据,所述dikw图谱至少包括数据图谱、信息图谱以及知识图谱;
13.确定用户投入以及用户搜索需求;
14.根据用户搜索需求,遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
15.对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
16.基于所述资源置信度,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索。
17.可选的,所述用户投入至少包括用户为了获得搜索结果所付出的时间以及金钱代价。
18.可选的,遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,包括:
19.依次计算数据图谱、信息图谱以及知识图谱的搜索效率;
20.若所述数据图谱的搜索效率大于所述信息图谱以及知识图谱的搜索效率,则通过所述数据图谱搜索与所述用户搜索需求相匹配的搜索结果;
21.若所述数据图谱的搜索效率大于所述信息图谱的搜索效率,且所述数据图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
22.若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率大于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
23.若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述信息图谱搜索与所述用户搜索需求相匹配的搜索结果。
24.可选的,对所述正向搜索结果以及负向搜索结果进行递进搜索,包括:
25.计算具有正趋势的正向搜索结果权重weight
p
和具有负趋势的负向搜索结果权重weight
n
,其具体的计算方式为:正向搜索结果权重其负向搜索结果权重其中resource
p
代表正向搜索结果,resource
n
代表负向搜索结果,所述resource
t
代表所有资源的量;
26.根据得到的正负双向搜索结果所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱,其中正向/反向递进搜索需要花费的时间通过下式进行计算:t
(p/n)
=t*weight
(p/n)
,而正向/反向递进搜索需要花费的金钱通过下式进行计算:m
(p/n)
=m*weight
(p/n)
,其中t
(p/n)
表示正向与反向搜索分别要花费的时间,m
(p/n)
表示正向与反向搜索分别要花费的金钱,p/n表示正或反;
27.将正向/反向递进搜索需要花费的时间以及金钱与用户投入进行对比,进而确定正负双向搜索分别要递进搜索的次数。
28.可选的,计算每次搜索结果的资源置信度,包括:
29.计算信息熵其中表示逐次搜索中的某个因素在时间t
k
中获得的资源的熵,p
i
表示每种类型答案的概率;
30.计算一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵其中
31.基于下式计算搜索结果的资源置信度
32.可选的,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,包括:
33.若则将正向搜索结果作为高置信度结果返回给用户;
34.或则将负向搜索结果作为高置信度结果返回给用户;
35.其中,τ为阈值。
36.可选的,所述方法还包括,若用户对所述高置信度的搜索结果不满意,重新设定确定用户投入以及用户搜索需求,从而获得新的高置信度搜索结果。
37.本发明第二方面提供了基于dikw的专利智能辅助审查系统,其包括:
38.dikw图谱生成模块,用于根据基础数据,生成至少包括数据图谱、信息图谱以及知识图谱在内的dikw图谱;
39.用户需求输入模块,用于输入用户投入以及用户搜索需求;
40.第一搜索模块,根据用户搜索需求,遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
41.第二搜索模块,用于将所述正向搜索结果以及负向搜索结果进行递进搜索,并计
算每次搜索结果的资源置信度;
42.结果输出模块,用于判断双向搜索结果的资源置信度的正负比是否在阈值区间内,并且输出置信度高的搜索结果。
43.与现有技术相比,本发明达到的有益效果如下:
44.本发明提供的一种基于dikw的专利智能辅助审查方法及系统,针对具有正向和负向趋势的问题提供渐进式搜索方法,通过多次渐进式搜索来提高资源的可信度,在渐进式搜索过程中,将消除具有歧义倾向和虚假信息的资源,避免针对无限和复杂问题的死循环,从而提供一个高精度的搜索结果。
附图说明
45.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
46.图1为本发明提供的一种基于dikw的专利智能辅助审查方法的流程图;
47.图2为本发明提供的一种基于dikw的搜索效率计算方法的流程图;
48.图3为本发明提供的一种对正向搜索结果以及负向搜索结果进行递进搜索的搜索方法的流程图;
49.图4为本发明实施例提供的基于dikw的专利智能辅助审查系统示意图。
具体实施方式
50.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
51.参见图1,本发明第一方面提供了一种基于dikw的专利智能辅助审查方法,包括下列步骤:
52.步骤s1、基于基础数据,构建dikw图谱,其中所述基础数据至少包括专利数据库中的专利数据,所述dikw图谱至少包括数据图谱、信息图谱以及知识图谱;
53.步骤s2、确定用户投入以及用户搜索需求;
54.步骤s3、根据用户搜索需求,遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
55.步骤s4、对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
56.步骤s5、基于所述资源置信度,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索。
57.进一步的,在步骤s1中,dikw图谱由服务器根据国知局专利数据库中的所有内容
建立,也可以由中文文献数据库或英文文献数据库建立,其中中文文献数据库或英文文献数据库至少包括中国知网文献数据库、万方文献数据库、中国国家图书馆文献数据库中的一种或多种。
58.具体的,其数据资源可以理解为结构化的资源,例如发明人,申请号,代理人等;信息资源可以理解为非结构化的资源,例如摘要或说明书中或文献中的特定句子等;信息图谱可以理解为专利内容资源间的各种交互关系,例如如产品组件之间的组合、产品设计的步骤等,而知识图谱可以理解为客观存在的限定规则,例如权利要求的限定项数等。
59.在步骤s2中,其用户投入至少包括用户为了获得搜索结果所付出的时间以及金钱代价,而用户搜索需求可以为专利中的发明人的信息、申请号、代理人、摘要、技术方案等,即用户根据自身需求输入的关键字进行搜索,资源总量为资源的集合。
60.当用户输入的是申请号时,直接将申请号在数据图谱中遍历,直接就能找到;当用户输入的是句子时,在信息图谱中遍历相似的句子结构、步骤、过程等;当用户输入的是规则时,跟在信息图谱中遍历的情形一样,不过搜索的是规则信息;在专利检索中,有些内容可以理解为信息,也可以理解为知识,数据信息知识都是可以相互转化的。
61.关于构建dikw图谱的相关内容,可以参见申请人同日申请的专利申请文件,其发明名称为“基于dikw图谱的专利智能辅助答复方法及系统”,而关于dikw的其他相关内容可以参见申请人同日申请的另外两篇专利申请文件,发明名称分别为“一种基于dikw的专利智能申请方法及系统”,“一种基于dikw的专利内容检索方法及系统”。
62.参见图2,本技术还公开了一种搜索效率计算方法,用于计算数据图谱、信息图谱以及知识图谱的搜索效率,其步骤s3还包括下列子步骤:
63.步骤一:根据用户搜索的需求确定搜索目标集合,包括资源类型和资源总量;
64.步骤二:计算在dikw图谱各层上的搜索资源代价:
65.searchcost=(λ*α*scale(graph
dik
) (1

λ)*β*reasoningcost)*|initial_res|
66.reasoningcost=n
cost
e
cost
67.其中scale表示图谱的规模,即节点数和边的个数,graph
dik
代表dikw图谱中的dikw资源,reasoningcost表示知识推理代价,λ表示图谱上存在答案的概率,α和β表示直接搜索代价和推理代价占搜索代价的权重,n
cost
表示推理出新节点的代价,e
cost
表示推理出新关系的代价;
68.步骤三、计算在数据图谱、信息图谱以及知识图谱上搜索目标资源的效率:
[0069][0070]
其中|resource|表示在该层图谱上搜索到的资源量。
[0071]
进一步的,本技术还公开了一种搜索方法,用于遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,其包括下列步骤:
[0072]
步骤一、若数据图谱的搜索效率大于所述信息图谱以及知识图谱的搜索效率,则通过所述数据图谱搜索与所述用户搜索需求相匹配的搜索结果;
[0073]
步骤二、若所述数据图谱的搜索效率大于所述信息图谱的搜索效率,且所述数据图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
[0074]
步骤三、若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率大于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
[0075]
步骤四、若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述信息图谱搜索与所述用户搜索需求相匹配的搜索结果。
[0076]
参见图3,本技术实施例提供的对所述正向搜索结果以及负向搜索结果进行递进搜索的搜索方法,步骤s4还包括下列子步骤:
[0077]
计算具有正趋势的正向搜索结果权重weight
p
和具有负趋势的负向搜索结果权重weight
n
,其具体的计算方式为:正向搜索结果权重其负向搜索结果权重其中resource
p
代表正向搜索结果,resource
n
代表负向搜索结果,所述resource
t
代表所有资源的量;
[0078]
根据得到的正负双向搜索结果所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱。
[0079]
在本技术的实施方式中,其正向/反向递进搜索需要花费的时间通过下式进行计算:t
(p/n)
=t*weight
(p/n)
,其中t=s_times*s_items*pert_item,s_times表示由用户投资预设的渐进式搜索时间,s_items表示每次搜索的项目数量,pert_item表示每个项目的搜索时间
[0080]
同理,正向/反向递进搜索需要花费的金钱通过下式进行计算:m
(p/n)
=m*weight
(p/n)

[0081]
其中t
(p/n)
表示正向与反向搜索分别要花费的时间,m
(p/n)
表示正向与反向搜索分别要花费的金钱,p/n表示正或反;
[0082]
将正向/反向递进搜索需要花费的时间以及金钱与用户投入进行对比,若多次搜索所花费的总时间以及总金钱超过了用户的投入,则重新选择新的搜索次数,直到多次搜索所花费的总时间以及总金钱无限逼近用户的投入,进而确定正负双向搜索分别要递进搜索的次数。
[0083]
更进一步的,在步骤s5中,计算每次搜索结果的资源置信度,包括:
[0084]
计算信息熵其中表示逐次搜索中的某个因素在时间t
k
中获得的资源的熵,p
i
表示每种类型答案的概率;
[0085]
计算一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵其中资源的时效性t
t
是资源终止传播的时间,t
c
是当前搜索者搜索资源的时间,t
s
是资源开始出现的时间;
[0086]
基于下式计算搜索结果的资源置信度
[0087]
可选的,在本技术的实施例中,判断双向搜索结果的资源置信度的正负比是否在
阈值区间内,包括:
[0088]
若则将正向搜索结果作为高置信度结果返回给用户;
[0089]
或则将负向搜索结果作为高置信度结果返回给用户;
[0090]
其中,τ为阈值,优选的,所述阈值取为1,即当时,则将正向搜索结果作为高置信度结果返回给用户,当则将负向搜索结果作为高置信度结果返回给用户.
[0091]
可选的,在本技术的一个可选实施方式中,所述方法还包括,若用户对所述高置信度的搜索结果不满意,重新设定确定用户投入以及用户搜索需求,并重复步骤s1

s5,从而获得新的高置信度搜索结果,其高置信度的搜索结果即作为检索结果呈现给审查员,帮助审查员快速、精确的找到现有技术。
[0092]
参见图4,本发明第二方面提供了基于dikw的专利智能辅助审查系统,其包括:
[0093]
dikw图谱生成模块501,用于根据基础数据,生成至少包括数据图谱、信息图谱以及知识图谱在内的dikw图谱;
[0094]
用户需求输入模块502,用于输入用户投入以及用户搜索需求;
[0095]
第一搜索模块503,根据用户搜索需求,遍历所述dikw图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
[0096]
第二搜索模块504,用于将所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
[0097]
结果输出模块505,用于判断双向搜索结果的资源置信度的正负比是否在阈值区间内,并且输出置信度高的搜索结果。
[0098]
需要说明的是,本发明实施例提供的基于dikw的专利智能辅助审查系统与前述实施例所述的基于dikw的专利智能辅助审查方法属于相同的技术构思,其具体实施过程可参照前述实施例中对方法步骤的说明,在此不再赘述。
[0099]
应当理解,以上基于dikw的专利智能辅助审查系统包括的单元仅为根据该装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的基于dikw的专利智能辅助审查系统所实现的功能与上述实施例提供的基于dikw的专利智能辅助审查方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例中已做详细描述,此处不再详细描述。
[0100]
另外,本发明还包括服务器,其服务器包括:
[0101]
一个或多个处理器;
[0102]
存储装置,其上存储有一个或多个程序;
[0103]
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上文所述的基于dikw的专利智能辅助审查方法,或者,运行如上文所述的基于dikw的专利智能辅助审查系统。
[0104]
需要说明的是:本发明实施例提供的基于dikw的专利智能辅助审查方法的先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0105]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0106]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0107]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜