一种基于知识图谱的案例实践学习平台及其构建方法与流程

2022-09-03 15:39:02 来源：中国专利 TAG：

1.本发明涉及实践学习领域，特别涉及一种基于知识图谱的案例实践学习平台及其构建方法。

背景技术：

2.传统教育尤其是工科类实践教学中，对于结构复杂、操作性强的科目存在局限性，书本知识过度依赖学生自我想象和理解，而多媒体教学在交互性上较差，教学的资料内容和展现形式相对单一，难以形成有效的学习知识体系。
3.另外，由于教学场地、教学资金投入以及教学与实践环境差别等条件的限制，高等院校在工科类实践教学时受到了很大制约。企业具有实践环境，但是由于生产需求、资金成本、车间条件等条件的限制，也不能够在实践中进行有效的学习，形成完善的知识体系，技术人才培养时受到了很大制约。知识学习与实践学习的壁垒难以打破，人才缺失成为阻碍智能制造相关技术推广运用的重要瓶颈。
4.有鉴于此，实有必要提供一种新的技术方案以解决上述问题。

技术实现要素：

5.本技术的一个目的在于提供一种基于知识图谱的案例实践学习平台及其构建方法，能够将学习资源数据进行搜集整理，并以知识图谱的方式进行展示，使学习者能够根据解决项目实践问题进行系统化学习，打破了知识学习与实践学习的壁垒，提高了学习效率，降低了人才培养成本。
6.一种基于知识图谱的案例实践学习平台，包括：
7.数据采集模块，用于获取学习资源数据；
8.信息抽取模块，用于对获取的学习资源数据进行实体抽取和关系抽取；
9.知识融合模块，用于对抽取后的学习资源数据进行筛选和清晰化处理，并将筛选和清晰化处理后的学习资源数据存储至数据库；
10.知识图谱模块，用于对学习资源数据进行关联，形成整体的知识学习框架；
11.数据访问模块，用于对学习资源数据中的知识点进行编码以及进行实体关系定义，将所需的学习资源数据由数据库中调取并添加至知识图谱节点；
12.知识展示模块，用于将关联好学习资源数据的知识图谱模块以结构化、系统化的形式进行展示。
13.优选的，所述信息抽取模块包括实体抽取单元和关系抽取单元。
14.优选的，所述案例实践学习平台以b/s模式进行开发，通过浏览器以前端应用单元和后端应用单元的形式进行展示。
15.本发明还公开一种基于知识图谱的案例实践学习平台构建方法，包括：
16.构建项目案例的知识图谱；
17.进行学习资源数据采集；
18.将采集到的学习资源数据进行信息抽取，抽取出待构建项目案例知识体系中的实体及实体对之间的具体关系；
19.将抽取后的学习资源数据进行筛选和清晰化处理；
20.对学习资源数据中的知识点进行编码；
21.对学习资源数据中的知识点进行实体关系定义；
22.将学习资源数据添加至知识图谱节点，并支持在前端应用单元以结构化的图谱形式对知识点进行系统、完整地展示。
23.优选的，所述进行学习资源数据采集包括：
24.确定待构建项目案例知识体系，选择学科的知识范围；
25.根据所选择的项目案例知识体系选取本地资源路径和/或网站地址作为数据源的获取地址；
26.采取人工和/或自动的方式对待构建项目案例知识体系中需要获取的学习资源数据进行标注；
27.使用网络爬虫技术进行网络学习资源数据收集，使用人工数据收集的方式进行本地学习资源数据收集。
28.优选的，所述将采集到的学习资源进行信息抽取，抽取出待构建项目案例知识体系中的实体及实体对之间的具体关系包括：
29.基于案例实践学习平台的实体类型和平台提供不同的课程粒度信息，通过爬取网页获得相应的实体；
30.在半自动方法生成的规则基础上利用语法树来实现信息的抽取以及利用本体技术构建待构建领域本体，实现文本的信息抽取。
31.优选的，所述对学习资源数据中的知识点进行实体关系定义中，所述知识点中的实体关系包括包含关系、上下位关系、相关关系、相等关系和先修后继关系。
32.优选的，所述对学习资源数据中的知识点进行编码中，采用复合编码方式编码；所述复合编码的码段包括学段信息码段、知识结构信息码段、难易程度码段和附加计数码段。
33.优选的，所述将学习资源数据添加至知识图谱节点，并支持在前端应用单元以结构化的图谱形式对知识点进行系统、完整地展示中，采用人工将学习资源数据添加至知识图谱节点的方式实现。
34.与现有技术相比，本技术至少具有以下有益效果：
35.本发明能够将学习资源数据进行搜集整理，并以知识图谱的方式进行展示，使学习者能够根据需要进行系统化学习，打破了知识学习与实践学习的壁垒，提高了学习效率，降低了人才培养成本。
附图说明
36.后文将参照附图以示例性而非限制性的方式详细描述本发明的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：
37.图1为本发明一种基于知识图谱的案例实践学习平台构建方法的流程示意图；
38.图2为知识点标识码编码结构示意图。
具体实施方式
39.为使本技术的目的、技术方案和优点更加清楚，下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
40.基于知识图谱的案例实践学习平台以鲜活的企业应用场景案例和完整的实验教学项目为基础，将案例以产品或项目为主线，所涉及知识点用知识图谱的方式进行关联，从而达到图谱化组织和应用知识的目的，便于学习者针对项目案例形成较为完整的知识图谱，并通过三维应用场景进行交互操作，大幅提升对产品的整体理解和实践应用能力。同时，基于知识图谱的案例实践学习平台以b/s模式进行开发，通过浏览器以前端应用单元和后端应用单元的形式进行展示。
41.本发明公开一种基于知识图谱的案例实践学习平台，包括：
42.数据采集模块，用于获取学习资源数据；
43.信息抽取模块，用于对获取的学习资源数据进行实体抽取和关系抽取；
44.知识融合模块，用于对抽取后的学习资源数据进行筛选和清晰化处理，并将筛选和清晰化处理后的学习资源数据存储至数据库；
45.知识图谱模块，用于对学习资源数据进行关联，形成整体的知识学习路径，实现理论学习和实践学习在统一知识体系下的对照和融合；
46.数据访问模块，用于对学习资源数据中的知识点进行编码以及进行实体关系定义，将所需的学习资源数据由数据库中调取并添加至知识图谱节点；
47.知识展示模块，用于将关联好学习资源数据的知识图谱模块以三维应用场景的形式进行展示。
48.优选的，所述信息抽取模块包括实体抽取单元和关系抽取单元。
49.优选的，所述案例实践学习平台以b/s模式进行开发，通过浏览器以前端应用单元和后端应用单元的形式进行展示。
50.如图1至图2所示，一种基于知识图谱的案例实践学习平台构建方法，其特征在于，包括如下步骤：
51.s1、构建项目案例的知识图谱。
52.s2、进行学习资源数据采集。
53.学习资源数据是构建知识图谱的基石，构建学科知识图谱需要大量的学科数据作为支撑，所以知识图谱框架搭建完成之后，学习资源数据的采集具有重要作用。为了保证学习资源数据获取的质量和效率，采用人工与启发式预处理的方式相结合的方式进行。
54.具体包括以下步骤：
55.s21、确定待构建项目案例知识体系，选择学科的知识范围；
56.s22、根据所选择的项目案例知识体系选取本地资源路径和/或网站地址作为数据源的获取地址；
57.s23、采取人工和/或自动的方式对待构建项目案例知识体系中需要获取的学习资源数据进行标注。
58.如表1所示，将学习资源数据标注为单元、案例、模块、章节、学习对象。其中，单元、
案例、模块、章节中的基本信息利用id与名称相结合的方式进行记录。
59.表1为学习资源数据中的实体类型、属性及其关系表。
[0060][0061][0062]
s24、使用网络爬虫技术进行网络学习资源数据收集，使用人工数据收集的方式进行本地学习资源数据收集。
[0063]
具体的，使用网络爬虫技术进行网络学习资源数据收集时，网络爬虫技术采用基于python的scrapy框架的网络爬虫技术。数据搜集工作采用基于python的scrapy框架的网络爬虫技术，分别对所选网站进行爬取。爬取过程首先需要设置一个url管理器，输入初始内容的url，将url下载器里的网页内容调用解析器进行解析，解析的过程包含页面地址解析和页面内容解析两部分。解析器将新的词条url放入url管理器中，作为下一个待爬取的页面，将解析后的内容保存在本地，重复这一过程，直到url管理器中为空时停止。另外，所有被爬取的网页都会被记录，以防重复爬取。随后，将下一个标注爬取的内容设为初始url，然后重复上述过程，直到标注的内容全部完成则爬取内容结束。搜集的数据包含结构化数据、半结构化数据、非结构化数据。
[0064]
s3、将采集到的学习资源数据进行信息抽取，抽取出待构建项目案例知识体系中的实体及实体对之间的具体关系，具体包括以下步骤：
[0065]
s31、基于案例实践学习平台的实体类型和平台提供不同的课程粒度信息，通过爬取网页获得相应的实体；
[0066]
s32、在半自动方法生成的规则基础上利用语法树来实现学习信息的抽取以及利用本体技术构建待构建领域本体，实现文本的信息抽取。
[0067]
文本的信息抽取的抽取方式包括属性抽取、关系抽取、实体抽取。实现信息抽取需要对应规则，通常较为常用的方法主要有基于自然语言处理技术利用句子间结构关系生成
的半结构化规则；基于半自动方法生成的规则基础上利用语法树来实现信息的抽取以及利用本体技术构建足够大的领域本体实现文本的信息抽取。本技术优选为后者。
[0068]
s4、将抽取后的学习资源数据进行筛选和清晰化处理。
[0069]
利用python语言编写数据爬取的脚本，将爬取的资源以csv格式存储，导入neo4j数据库。
[0070]
s41、数据清洗：对数据进行重新审查和校验，目的在于删除重复信息、纠正存在的错误，并提供数据一致性，步骤如下：
[0071]
第一步，预处理阶段。主要将数据导入数据处理工具，查看包括字段解释、数据来源、代码表等一切描述数据的元数据信息，并抽取一部分数据进行人工审查、校验；
[0072]
第二步，补全缺失的数据。首先确定缺失值范围，去除不需要的字段，并填充缺失内容，重新取数；
[0073]
第三步，格式内容规范化。从指定网站搜集来的学习资源数据在格式和内容上可能存在不规范的问题，比如时间、日期、数值、半全角等显示格式不一致；内容中有不该存在的字符；内容与该字段应用内容不符。采用人工修改数据格式的方式，将相应内容补全。
[0074]
第四步，处理逻辑错误数据。去掉一些使用简单逻辑推理就可以直接发现问题的数据，防止分析结果走偏，主要包含以下几个几方面：
①
去重
②
去除不合理值
③
修正矛盾内容；
[0075]
第五步，去掉非需求数据；
[0076]
第六步，关联性认证。
[0077]
s42、规范化处理：对清洗完成后的数据进行数据规约。
[0078]
数据规约主要包含两方面：属性规约和数值规约。属性规约通过属性合并来创建新属性维数，或删除不相关的属性。数值规约主要是减少样本数量。对大规模数据库内容进行复杂的数据分析通常需要耗费大量的时间。数据规约技术用于帮助从原有庞大数据集中获得一个精简的数据集合，并使用这一精简数据集保持原有数据集的完整性，这样在精简数据集上进行数据挖掘效率更高，并且挖掘出来的结果与使用原有数据集所获得的结果基本相同。
[0079]
s5、对学习资源数据中的知识点进行编码。
[0080]
采用复合编码方式对学习资源数据中的知识点进行编码。编码是根据一定的规律和方法，将无序的数据翻译成有序代码的过程。这个过程必须符合某种规定的编码规则。编码能够有效地对数据资源进行统一组织和规范化管理。尤其对于较为复杂的数据内容进行有效的整合和更新服务十分方便。在对案例涉及的学科知识点进行编码时，除了需要标识出知识点外，还要识别知识点所在知识体系中所处的位置，精确地反映出知识点的信息。
[0081]
如图2所示，本发明采用复合编码方式对学习资源数据中的知识点进行编码，分为四个码段，分别为学段信息码段、知识结构信息码段、难易程度码段、附加计数码段。
[0082]
s6、对学习资源数据中的知识点进行实体关系定义。
[0083]
如表2所示，通过知识点的深度连接关系进行组合，连接关系是指一个知识点与另一个知识点的连接方向、关系等信息。知识点之间存在以下关系类型：包含关系、上下位关系、相关关系、相等关系和先修后继关系。
[0084]
表2为学习资源数据中知识点的属性及其关系表。
[0085][0086]
s7、将学习资源数据添加至知识图谱节点，并支持在前端应用单元以结构化的图谱形式对知识点进行系统、完整地展示。
[0087]
利用人工经验对爬取的网络资源和本地资源库资源进行图谱节点学习内容的编辑，并进行图谱版本生成和发布。用知识图谱进行组织，可综合利用3d应用场景进行虚实结合训练，实现理论学习与案例实训的融合，高效对跨学科知识进行组织和应用训练，帮助学习者搭建牢固的知识体系，大大提升学习效率和实践能力。
[0088]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：任务调度方法、装置、设备及可读存储介质与流程

一种基于知识图谱的案例实践学习平台及其构建方法与流程

相关文献

最热文献