一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于行业知识图谱的搜索方法、装置、设备和存储介质与流程

2022-05-06 07:04:47 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,具体而言,涉及一种基于行业知识图谱的搜索方法、装置、设备和存储介质。


背景技术:

2.用户在进行搜索时,如果采用网上的普通的搜索工具进行搜索时,搜索到的结果中往往掺杂广告等无关信息,难以检索到相关度比较高的搜索结果,并且搜索结果排列杂乱无章,影响用户体验。


技术实现要素:

3.本技术的主要目的在于提供一种基于行业知识图谱的搜索方法、装置、设备和存储介质,以解决上述问题。
4.为了实现上述目的,根据本技术的一个方面,提供了一种基于行业知识图谱的搜索方法,应用于服务器,包括:
5.接收客户端输入的行业搜索关键词;
6.根据预先建立的知识图谱,对所述行业搜索关键词进行搜索,得到对应的搜索结果;
7.将所述搜索结果推送到所述客户端,在所述客户端的显示界面上显示所述搜索结果;
8.所述搜索结果包括:搜索结果列表;所述行业搜索关键词相关的知识图谱;
9.所述行业搜索关键词相关的行业关键词推荐列表;与所述行业搜索关键词相关的行业期刊文章推荐列表。
10.在一种实施方式中,客户端的显示界面上设置有年份选择列表;
11.响应于点击的任意的一个年份,搜索与所述年份相关的搜索结果;
12.将所述搜索结果推送给所述客户端,以使所述客户端显示与所述年份相关的搜索结果;
13.客户端的显示界面上设置有业务体系列表;
14.所述业务体系列表包括:基建、电网、营销、人资、财务、生成、管理;
15.响应于用于点击的任意的一个业务,搜索与所述业务相关的搜索结果;
16.将所述搜索结果推送给所述客户端,以使所述客户端显示与所述业务相关的搜索结果。
17.在一种实施方式中,响应于用户在客户端的显示页面上点击的时间,对所述搜索结果列表中的内容按照时间的顺序进行排序;
18.响应于用户在客户端的显示页面上点击的相关度,对所述搜索结果列表中的内容按照相关度的顺序进行排序。
19.在一种实施方式中,响应于用户在客户端的显示页面上对所述行业搜索关键词相
关的知识图谱的点击,显示所述行业搜索关键词相关的知识图谱。
20.在一种实施方式中,预先建立知识图谱,包括:
21.基于知识图谱业务体系构建知识图谱脚本;
22.当接收到xml数据后将所述xml数据放入指定目录,所述xml数据为图书;
23.通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象;
24.当所述bookdata对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联;
25.其中,所述业务体系是通过电力资源信息拆分得到的,具体包括岗位体系、设备体系、基建体系、科技体系、营销体系、电网体系、法律体系。
26.在一种实施方式中,通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象,具体为:
27.当所述xml数据放入指定目录后,所述知识图谱脚本根据所述xml数据文件的path路径以及类型进行处理与解析;
28.若所述xml数据文件类型为需要解压的格式,所述知识图谱脚本将所述xml数据文件解压到所述指定目录后,将所述xml数据文件根据所述path路径进行解析;
29.若所述xml数据文件类型为不需要解压的格式,则所述xml数据文件直接根据所述path路径进行解析。
30.在一种实施方式中,将所述xml数据文件根据所述path路径进行解析,具体为:
31.通过所述知识图谱脚本读取文件夹下自定义的文件名称;
32.通过读取计算机文件输入流中的数据形成document对象后,使用xpath进行每一行数据的读取,最终形成所述bookdata对象;
33.当所述bookdata对象中的数据解析完成后,所述xml数据文件解析完成。
34.为了实现上述目的,根据本技术的另一方面,提供了一种基于行业知识图谱的搜索装置,应用于服务器,该方法包括:
35.接收模块,用于接收客户端输入的行业搜索关键词;
36.搜索模块,用于根据预先建立的知识图谱,对所述行业搜索关键词进行搜索,得到对应的搜索结果;
37.推送模块,用于将所述搜索结果推送到所述客户端,在所述客户端的显示界面上显示所述搜索结果;
38.所述搜索结果包括:搜索结果列表;所述行业搜索关键词相关的知识图谱;
39.所述行业搜索关键词相关的行业关键词推荐列表;与所述行业搜索关键词相关的行业期刊文章推荐列表。
40.在一种实施方式中,客户端的显示界面上设置有年份选择列表;
41.搜索模块还用于,响应于点击的任意的一个年份,搜索与所述年份相关的搜索结果;
42.推送模块还用于,将所述搜索结果推送给所述客户端,以使所述客户端显示与所述年份相关的搜索结果;
43.客户端的显示界面上设置有业务体系列表;
44.所述业务体系列表包括:基建、电网、营销、人资、财务、生成、管理;
45.搜索模块还用于,响应于用于点击的任意的一个业务,搜索与所述业务相关的搜索结果;
46.推送模块还用于,将所述搜索结果推送给所述客户端,以使所述客户端显示与所述业务相关的搜索结果。
47.在一种实施方式中,还包括排序模块,用于响应于用户在客户端的显示页面上点击的时间,对所述搜索结果列表中的内容按照时间的顺序进行排序;
48.或者,响应于用户在客户端的显示页面上点击的相关度,对所述搜索结果列表中的内容按照相关度的顺序进行排序。
49.在一种实施方式中,搜索模块还用于,响应于用户在客户端的显示页面上对所述行业搜索关键词相关的知识图谱的点击,搜索所述知识图谱,并把所述知识图谱发送到所述客户端。
50.在一种实施方式中,还包括知识图谱建立模块,用于预先建立知识图谱;具体用于,基于知识图谱业务体系构建知识图谱脚本;
51.当接收到xml数据后将所述xml数据放入指定目录,所述xml数据为图书;
52.通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象;
53.当所述bookdata对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联;
54.其中,所述业务体系是通过电力资源信息拆分得到的,具体包括岗位体系、设备体系、基建体系、科技体系、营销体系、电网体系、法律体系。
55.在一种实施方式中,知识图谱建立模块还用于,通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象,具体为:
56.当所述xml数据放入指定目录后,所述知识图谱脚本根据所述xml数据文件的path路径以及类型进行处理与解析;
57.若所述xml数据文件类型为需要解压的格式,所述知识图谱脚本将所述xml数据文件解压到所述指定目录后,将所述xml数据文件根据所述path路径进行解析;
58.若所述xml数据文件类型为不需要解压的格式,则所述xml数据文件直接根据所述path路径进行解析。
59.在一种实施方式中,知识图谱建立模块还用于,通过所述知识图谱脚本读取文件夹下自定义的文件名称;
60.通过读取计算机文件输入流中的数据形成document对象后,使用xpath进行每一行数据的读取,最终形成所述bookdata对象;
61.当所述bookdata对象中的数据解析完成后,所述xml数据文件解析完成。
62.为了实现上述目的,根据本技术的第三方面,提供了一种电子设备;包括至少一个处理器和至少一个存储器;所述存储器用于存储一个或多个程序指令;所述处理器,用于运行一个或多个程序指令,用以执行上述任一项所述的步骤。
63.根据本技术的第四方面,提供了一种计算机可读存储介质,计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述任意一项所述的步骤。
64.本发明的上述的技术方案,用户界面上显示的搜索结果包括:搜索结果列表;行业
搜索关键词相关的知识图谱;行业搜索关键词相关的行业关键词推荐列表;行业搜索关键词相关的行业期刊文章推荐列表。本技术的显示界面上显示的内容丰富,方便了用户多样化需求,由于采用了知识图谱进行搜索,搜索结果准确性更改,提高了搜索的效果。
附图说明
65.构成本技术的一部分的附图用来提供对本技术的进一步理解,使得本技术的其它特征、目的和优点变得更明显。本技术的示意性实施例附图及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
66.图1是根据本技术实施例的一种基于行业知识图谱的搜索方法的流程图;
67.图2是根据本技术实施例的一种搜索结果列表的界面示意图;
68.图3a是根据本技术实施例的一种界面的示意图;
69.图3b是根据本技术实施例的另一种界面的示意图;
70.图3c是根据本技术实施例的另一种界面的示意图;
71.图3d是根据本技术实施例的另一种界面的示意图;
72.图4是根据本技术实施例的一种行业知识图谱的结构示意图;
73.图5是根据本技术实施例的一种建立知识图谱的方法的流程图;
74.图6是根据本技术实施例的一种建立知识图谱的装置的结构示意图;
75.图7是根据本技术实施例的一种建立知识图谱的设备的结构示意图。
具体实施方式
76.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
77.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
78.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
79.本技术提出了一种基于行业知识图谱的搜索方法,应用于服务器,参见附图1所示的一种基于行业知识图谱的搜索方法的流程图;该方法包括:
80.步骤s102,接收客户端输入的行业搜索关键词;
81.示例性的,行业搜索关键词为,变电,变压器,母线,断路器等。
82.步骤s104,根据预先建立的知识图谱,对所述行业搜索关键词进行搜索,得到对应的搜索结果;
83.其中,知识图谱为电力行业知识图谱。
84.步骤s106,将所述搜索结果推送到所述客户端,在所述客户端的显示界面上显示所述搜索结果;
85.所述搜索结果包括:搜索结果列表;行业搜索关键词相关的知识图谱;行业搜索关键词相关的行业关键词推荐列表;与行业搜索关键词相关的行业期刊文章推荐列表。
86.示例性的,参见附图2所示的一种搜索结果列表的界面示意图;在该界面中,搜索结果列表设置在界面的中部;
87.行业搜索关键词相关的知识图谱,设置在界面的右上方;
88.行业搜索关键词相关的行业关键词推荐列表,设置在界面的左上方;
89.与所述行业搜索关键词相关的行业期刊文章推荐列表,设置在界面的右下方。
90.本发明的技术方案,根据预先建立的知识图谱,对行业搜索关键词进行搜索,得到对应的搜索结果;所述搜索结果包括:搜索结果列表;所述行业搜索关键词相关的知识图谱;所述行业搜索关键词相关的行业关键词推荐列表;与所述行业搜索关键词相关的行业期刊文章推荐列表。本发明通过知识图谱,可以更有效的搜索到行业内的相关结果,通过在显示界面上显示多种推荐列表,可以更好的给用户感官的体验。
91.在一种实施方式中,客户端的显示界面上设置有年份选择列表;响应于点击的任意的一个年份,搜索与所述年份相关的搜索结果;将所述搜索结果推送给所述客户端,以使所述客户端显示与所述年份相关的搜索结果。
92.示例性的,参见附图3a所示的一种界面的示意图;在该页面中,显示有年份列表,用户在年份列表中选择任意的一个年份后,在搜索结果列表中显示该年份的检索结果。
93.客户端的年份显示列表中的年份从2009到2018;用户可以点击任意的一个选项。如果用户点击2013年后,则搜索结果列表中的内容显示2013年的相关内容。
94.客户端的显示界面上设置有业务体系列表;所述业务体系列表包括:基建、电网、营销、人资、财务、生成、管理;响应于用于点击的任意的一个业务,搜索与所述业务相关的搜索结果;将所述搜索结果推送给所述客户端,以使所述客户端显示与所述业务相关的搜索结果。
95.示例性的,参见附图3a,在业务体系列表中,显示了每一个业务体系的数量。用户可以选中每一个自己感兴趣的业务体系按钮,相应的,在搜索结果列表中,显示选中的业务体系的相关内容。比如,如果用户选中了基建按钮,则显示与基建相关的内容。
96.在一种实施方式中,响应于用户在客户端的显示页面上点击的时间,对所述搜索结果列表中的内容按照时间的顺序进行排序;
97.示例性的,参见附图3a,搜索结果列表中设置有时间排序的按钮,用户可以点击箭头来对时间进行排序,排序包括两种排序方式,按照时间从近及远排序,以及按照时间从远及近排序。
98.响应于用户在客户端的显示页面上点击的相关度,对所述搜索结果列表中的内容按照相关度的顺序进行排序。
99.示例性的,参见附图3a,搜索结果列表中的检索结果包括多个不同的文章。可以按照相关度从高到低,或者从低到高的顺序进行排序。
100.关键词推荐列表中,关键词包括变电所,变电工程,变送电,变配电,变电站,设备
安全,大容量电能。
101.在相关推荐列表中,包括一些电力行业内的标准,比如:
102.t/csee 0003—2016变压器智能组件地电位升高防护性能检测技术规范;
103.《1000kv高压电器(gis、hgis、隔离开关、避雷器)施工及验收规范,gb50836-2013》。
104.参见附图3b所示的另一种界面的示意图;该页面显示了一种标准文章。
105.参见附图3c所示的另一种界面的示意图;该页面显示了变电站词条详情。
106.参见附图3d所示的另一种界面的示意图;该页面显示了一种图书详情。
107.在一种实施方式中,响应于用户在客户端的显示页面上点击的时间,对所述搜索结果列表中的内容按照时间的顺序进行排序;或者,响应于用户在客户端的显示页面上点击的相关度,对所述搜索结果列表中的内容按照相关度的顺序进行排序。
108.示例性的,参见附图2中,用户在显示界面上点击相关度后,搜索结果列表中的内容可以按照相关度从上到下的顺序进行排序,把相关度最高的检索结果排在首位。
109.在另一种方式中,用户在显示界面上点击时间后,搜索结果列表中的内容可以按照时间从上到下的顺序进行排序,把时间最近的检索结果排在首位。
110.在一种实施方式中,响应于用户在客户端的显示页面上对所述行业搜索关键词相关的知识图谱的点击,显示所述知识图谱的相关知识。
111.示例性的,参见附图3a,在用户客户端的页面的右上侧显示知识图谱。该知识图谱为变电站的知识图谱,用户点击后,该知识图谱会放大,显示变电站相关的知识。
112.参见附图4所示的一种知识图谱的示意图;与变电站有关的知识为,变电站安全手册,李锺书,张梦洁,南京市,南瑞集团。当用户搜索变电站后,会直接搜索到相关的知识。
113.在一种实施方式中,参见附图5所示的一种建立知识图谱的方法的流程图;该方法包括以下的步骤:
114.步骤s502,基于知识图谱业务体系构建知识图谱脚本;
115.具体的,根据电力行业各大领域资源相关纸质知识积累建模构建知识图谱全局知识分类体系,从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱。依赖于电力行业七大业务体系构建知识图谱脚本,知识图谱业务体系是通过电力资源信息拆分得到的,具体包括岗位体系、设备体系、基建体系、科技体系、营销体系、电网体系、法律体系。本技术的知识图谱的构建是从各大领域资源管理的使用教材、使用部分、使用章节、使用模块、相关工种等角度多维度构建而成的。本技术的知识图谱系统能够更深层的分析挖掘电力行业资源管理知识价值,提升各个领域资源管理智能化水平,实现人力资源管理不同知识数据的融合应用。
116.步骤s504,当接收到xml数据后将所述xml数据放入指定目录,所述xml数据为图书;
117.具体的,当接收到图书xml数据后,首先需要将准备好的图书xml数据放入指定目录,比如放入共享服务器:/upload文件夹下。一本完整的图书数据内会包含以下目录:chapter(章节)、cover(封面)、epub(电子版)、mobi(电子版)、pdf、source(来源)以及xml文件。
118.步骤s506,通过所述知识图谱脚本将xml数据文件进行处理与解析后形成
bookdata对象;
119.具体的,当图书xml数据已经存放到到自定义的文件夹并整理过后,知识图谱脚本会根据xml数据文件的path路径以及类型来进行处理和解析,最后形成最终形成bookdata(自定义对象名称)对象。
120.为了对xml数据文件进行处理,在一些实施例中,通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象,具体为:
121.当所述xml数据放入指定目录后,所述知识图谱脚本根据所述xml数据文件的path路径以及类型进行处理与解析;
122.若所述xml数据文件类型为需要解压的格式,所述知识图谱脚本将所述xml数据文件解压到所述指定目录后,将所述xml数据文件根据所述path路径进行解析;
123.若所述xml数据文件类型为不需要解压的格式,则所述xml数据文件直接根据所述path路径进行解析。
124.具体的,当所述xml数据放入指定目录后,所述知识图谱脚本根据所述xml数据文件的path路径以及类型进行处理与解析。若所述xml数据文件类型为需要解压的格式,如果是zip格式,脚本将会自动使用zipfile读取并解压到指定目录,之后将xml数据文件根据所述path路径进行解析;若所述xml数据文件类型为不需要解压的格式,则所述xml数据文件直接根据所述path路径进行文件解析。
125.为了对xml数据文件进行解析,在一些实施例中,将所述xml数据文件根据所述path路径进行解析,具体为:
126.通过所述知识图谱脚本读取文件夹下自定义的文件名称;
127.通过读取计算机文件输入流中的数据形成document对象后,使用xpath进行每一行数据的读取,最终形成所述bookdata对象;
128.当所述bookdata对象中的数据解析完成后,所述xml数据文件解析完成。
129.具体的,知识图谱脚本会先读取整个文件夹下面的filelist(服务器上定义的文件名称-自定义),再进行循环解析,解析文件的过程将saxreader(技术读取流)和fileinputstream(计算机文件输入流)文件流配合使用,使用saxreader的read方法读取fileinputstream流中的数据形成document(计算机文献)对象,然后使用xpath(java读取技术)进行每一行数据的读取;例如:图书标题、目录,部分以及章节等等。最终形成bookdata(自定义对象名称)对象。当所述bookdata对象中的数据解析完成后,所述xml数据文件解析的流程完成。
130.步骤s508,当所述bookdata对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联。
131.通过上述方法,能够基于知识图谱脚本,实现xml数据的解析和入图操作,使得操作简单并减少知识入图存储的繁琐程度,最终形成可信度较高并且可支撑的电力行业企业内的人员管理手段。
132.具体的,当所述bookdata对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联。通过知识图谱脚本做xml数据解析和入图操作,能够减少知识入图存储的繁琐程度,并且知识图谱脚本针对不同的业务做分类编写,使得使用场景更加清晰明了;本知识图谱脚本单独
在系统之外执行,加快了入图速率,不需要知识融合和d2r映射的算法判断等操作;知识图谱脚本业务性较强,调整和新增等操作更加简单。
133.为了准确确定各实体之间的关联关系,在一些实施例中,基于所述知识图谱业务体系,对所述知识图谱中存在的实体、关系、属性进行定义;
134.基于定义后的所述实体、关系、属性确定所述数据中实体类型、实体基本属性、实体与实体间的关系。
135.具体的,基于所述知识图谱业务体系,根据提供的数据以及应用的需求对知识图谱中的数据进行定义,明确知识图谱中的实体、关系、以及各实体及关系的属性。基于定义后的所述实体、关系、属性确定xml数据以及bookdata对象中的数据中实体类型、实体基本属性、实体与实体间的关系。知识图谱中的知识以(头实体、关系、尾实体)以及(实体、属性、属性值)的形式存在。
136.为了获取数据间的相互关系,在一些实施例中,获取教材、部分、章节、模块、工种、岗位等实体基本属性,包括统一书号、中图分类号、图书分类、isbn号等;获取教材、部分、章节、模块、工种、岗位等实体间的关系,包括部分、相关词条知识等。
137.为了提供一种电力行业企业内的人员管理手段,在一些实施例中,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联,具体为:
138.通过所述知识图谱的接口将所述图书的实体添加进知识图谱,根据图书的title和abs与词条进行匹配并使用java8中的filter进行过滤,建立所述图书与所述词条间的关联关系;
139.从所述bookdata中获取部分和章节数据,并将所述部分和章节数据中的实体添加进所述知识图谱后,通过所述title与词条的匹配或/和语义、字词相似度的匹配建立相对应的关联关系。
140.具体的,先通过http方式请求知识图谱系统接口请求词条下所有实体信息,循环bookdata并为它补充剩余字段,例如:封面,pdfpath等等;会将cover目录下面的封面上传到fastdfs(分布式存储系统)上,最终将返回的path路径填充。接下来请求知识图谱系统的addentity(知识图谱的api)将所述图书的实体添加进知识图谱,下一步根据图书的title和abs和词条进行匹配,使用java8中的filter进行过滤,从而建立图书与词条的关联关系(知识图谱系统的addrelation方法-api)。接下来从bookdata中获取到部分和章节的数据,建立部分和章节的实体数据,再通过title与词条或者属性的匹配的适配比(语义/字词相似度)建立相应的关联关系。
141.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
142.根据本发明实施例,本发明提供了一种基于行业知识图谱的搜索装置,参见附图6所示的一种基于行业知识图谱的搜索装置的结构示意图;该装置包括:
143.接收模块61,用于接收客户端输入的行业搜索关键词;
144.搜索模块62,用于根据预先建立的知识图谱,对所述行业搜索关键词进行搜索,得到对应的搜索结果;
145.推送模块63,用于将所述搜索结果推送到所述客户端,在所述客户端的显示界面上显示所述搜索结果;
146.所述搜索结果包括:搜索结果列表;所述行业搜索关键词相关的知识图谱;
147.所述行业搜索关键词相关的行业关键词推荐列表;与所述行业搜索关键词相关的行业期刊文章推荐列表。
148.在一种实施方式中,客户端的显示界面上设置有年份选择列表;
149.搜索模块62还用于,响应于点击的任意的一个年份,搜索与所述年份相关的搜索结果;
150.推送模块63还用于,将所述搜索结果推送给所述客户端,以使所述客户端显示与所述年份相关的搜索结果;
151.客户端的显示界面上设置有业务体系列表;
152.所述业务体系列表包括:基建、电网、营销、人资、财务、生成、管理;
153.搜索模块62还用于,响应于用于点击的任意的一个业务,搜索与所述业务相关的搜索结果;
154.推送模块63还用于,将所述搜索结果推送给所述客户端,以使所述客户端显示与所述业务相关的搜索结果。
155.在一种实施方式中,还包括排序模块64,用于响应于用户在客户端的显示页面上点击的时间,对所述搜索结果列表中的内容按照时间的顺序进行排序;
156.或者,响应于用户在客户端的显示页面上点击的相关度,对所述搜索结果列表中的内容按照相关度的顺序进行排序。
157.在一种实施方式中,搜索模块52还用于,响应于用户在客户端的显示页面上对所述行业搜索关键词相关的知识图谱的点击,搜索所述知识图谱,并把所述知识图谱发送到所述客户端。
158.在一种实施方式中,还包括知识图谱建立模块55,用于预先建立知识图谱;具体用于,基于知识图谱业务体系构建知识图谱脚本;
159.当接收到xml数据后将所述xml数据放入指定目录,所述xml数据为图书;
160.通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象;
161.当所述bookdata对象中的数据解析完成后,将所述数据中的实体添加进知识图谱后进行语义、字词相似度的匹配,以使具有相同特征的所述实体进行相互关联;
162.其中,所述业务体系是通过电力资源信息拆分得到的,具体包括岗位体系、设备体系、基建体系、科技体系、营销体系、电网体系、法律体系。
163.在一种实施方式中,知识图谱建立模块55还用于,通过所述知识图谱脚本将xml数据文件进行处理与解析后形成bookdata对象,具体为:
164.当所述xml数据放入指定目录后,所述知识图谱脚本根据所述xml数据文件的path路径以及类型进行处理与解析;
165.若所述xml数据文件类型为需要解压的格式,所述知识图谱脚本将所述xml数据文件解压到所述指定目录后,将所述xml数据文件根据所述path路径进行解析;
166.若所述xml数据文件类型为不需要解压的格式,则所述xml数据文件直接根据所述path路径进行解析。
167.在一种实施方式中,知识图谱建立模块55还用于,通过所述知识图谱脚本读取文件夹下自定义的文件名称;
168.通过读取计算机文件输入流中的数据形成document对象后,使用xpath进行每一行数据的读取,最终形成所述bookdata对象;
169.当所述bookdata对象中的数据解析完成后,所述xml数据文件解析完成。
170.根据本技术的第三方面,提供了一种电子设备,参见附图6所示的一种电子设备的结构示意图;该电子设备包括至少一个处理器61和至少一个存储器62;所述存储器62用于存储一个或多个程序指令;所述处理器61,用于运行一个或多个程序指令,用以执行上述任意一项的方法。
171.第四方面,本技术还提出了一种计算机可读存储介质,计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述任一项所述的方法。
172.可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
173.存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
174.其中,非易失性存储器可以是只读存储器(read-only memory,简称rom)、可编程只读存储器(programmable rom,简称prom)、可擦除可编程只读存储器(erasable prom,简称eprom)、电可擦除可编程只读存储器(electrically eprom,简称eeprom)或闪存。
175.易失性存储器可以是随机存取存储器(random access memory,简称ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,简称sram)、动态随机存取存储器(dynamic ram,简称dram)、同步动态随机存取存储器(synchronous dram,简称sdram)、双倍数据速率同步动态随机存取存储器(double data ratesdram,简称ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,简称esdram)、同步连接动态随机存取存储器(synchlink dram,简称sldram)和直接内存总线随机存取存储器(directrambus ram,简称drram)。
176.本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
177.本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
178.显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储
在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
179.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献