一种基于过程行为数据的学习预测方法

2022-04-16 14:50:15 来源：中国专利 TAG：

1.本发明属于数据科学技术领域，涉及一种基于过程行为数据的学习预测方法

背景技术：

2.在线学习已成为教育的“常态”形式之一，是互联网教育发展的重要组成。在线学习因具有时空灵活性高、知识获取门槛低、学习资源丰富等诸多优点，在世界范围内被广泛应用。但在这种模式下教师无法轻易感知学习者的学习状况，人们对其学习质量的质疑也随之而来。学习表现预测研究通过预测学生在未来考试中的成绩情况，为教师针对性调整可能存在问题的学生提供依据，降低学生无法通过课程的风险，从而保障在线学习质量。通过大量探究在线学习行为与学习绩效关系的实证研究，发现学习者的在线学习行为对学习绩效有着重要影响。
3.因此，近年来基于学习过程数据的学习表现预测被广泛关注，通过测量、收集与分析学习过程数据实现学习表现预测，不仅可以帮助教师及时修正教学策略，还能在学生学习过程中起到监督和预警作用。
4.研究指出，在线学习行为数据是最重要的在线学习过程数据之一，在线学习行为数据是指学习者在在线学习平台或线上教学组织形式下开展的各种行为活动所产生的数据，能够反映学习者学习过程中的活动记录，具体包括登录平台次数、访问资源次数、参与论坛讨论次数、访问资源次数等行为数据。同时在线学习行为涉及的隐私信息较少，数据的收集与使用比较方便，对在线学习表现有着重要影响。因此，研究者对在线学习行为进行了深入的研究，并构建了不同的基于在线学习行为的学习表现预测器。
5.学习表现预测通常是一个二元分类任务，将学生分为“合格”或“失败”两类群体来预示未来测验通过的可能性，由于预测学习是机器学习技术的主要优势，常被选作训练学习绩效预测模型的基本方法。这类预测器虽能够取得良好的预测效果，但存在一定的局限性。一是模型泛化能力低和运算复杂度高。在线学习过程中捕获和记录了大量不同维度的在线学习行为数据，在构建在线学习表现预测器时，容易出现过拟合和计算复杂度过高的问题。二是在线学习行为数据输入方式单一。在线学习预测器一般将在线学习行为数据直接作为输入变量，少有预测器会考虑学习行为数据的组合效果。

技术实现要素：

6.本发明的目的是提供一种基于过程行为数据的学习预测方法。该方法首先对在线学习行为进行特征选择，其次根据行为分类模型对行为数据进行特征融合以获取每类行为的类别特征值，最后构建基于机器学习的学习表现预测系统。
7.本发明方法具体是：
8.步骤(1)数据预处理；对在线学习平台获取的原始在线学习行为数据，进行数据清洗和转换，获取标准化的在线学习行为数据；
9.步骤(2)特征选择；对经过预处理的标准在线学习行为数据进行特征选择，获取核
心学习行为数据；
10.步骤(3)特征融合；将核心学习行为集合中的元素进行分类，根据过程行为模型构造行为类别集合，再对同类的核心学习行为进行特征融合，得到每类在线学习行为的类别特征值，构建在线学习行为聚类特征值集合；过程行为模型是指对在线学习行为数据进行归类的规则，将学习行为划分为学习准备行为类别、知识获取行为类别、互动学习行为类别、学习巩固行为类别；
11.步骤(4)模型训练；将在线学习行为聚类特征值集合作为特征数据，训练构建的在线学习表现预测器，达到迭代次数后，选择预测效果最好的在线学习表现预测器对在线学习者的学习表现进行预测。
12.进一步，步骤(1)具体是：对原始在线学习行为进行数据完整性检查，删除不完整的数据条，获得原始在线学习行为集合b{b1,b2,
…
,bn}，根据b{b1,b2,
…
,bn}对应设定标准在线学习行为集合b
′
{b
′1,b
′2,
…
,b
′n}；其中bn表示在线学习平台记录的第n种原始在线学习行为数据，b
′n表示标准化后的第n种在线学习行为数据，n＝1,2,
…
,n，n为在线学习行为数量；
13.b
′n的第m条标准学习行为数据d
n,m
表示第n种原始在线学习行为的第m条原始学习行为数据，m＝1,2,
…
,m，m为第n种在线学习行为的数据数量，μbn表示第n种原始在线学习行为数据平均值，σbn表示第n种原始在线学习行为数据方差。
14.更进一步，步骤(2)具体是：设定标准学习行为特征值集合v{v1,v2,
…
,vn}，其中，第n种标准在线学习行为特征值μb
′n表示第n种标准在线学习行为数据平均值；遍历学习行为特征值集合v中元素与方差阈值threshold相比较，若当前标准在线学习行为特征值大于等于threshold，则将对应的标准在线学习行为加入核心学习行为集合，否则不加入。
15.再进一步，步骤(3)具体是：
16.(3-1)根据过程行为模型，将核心学习行为划分至不同的在线学习行为聚类中：设定在线学习行为分类c{c1,c2,
…
,ck}，ck为第k种在线学习行为聚类，k＝1,2,
…
,k，k为在线学习行为聚类数量，即在线学习行为类别划分后，产生k个在线学习行为聚类，每一类在线学习行为聚类均包含个数不等的在线学习行为；
17.(3-2)对每个在线学习行为聚类进行特征融合，获取对应的在线学习行为类融合特征值；第k种在线学习行为聚类ck的类融合特征值的类融合特征值原始在线学习行为数据bn携带监督标签，原始在线学习行为数据信息为及格时，监督标签λ＝0，不及格时，监督标签λ＝1，bn′
与对应的bn监督标签一致；
18.(3-3)构建在线学习行为聚类特征值集合
19.进一步，所述的学习准备行为包括登录学习平台、访问课程主页面、访问课程活动界面；所述的知识获取行为包括浏览课程内容资源、参与课程活动、观看课程视频、访问资
源链接；所述的互动学习行为包括参与研讨、发布论坛、回复论坛、向教师提问；所述的学习巩固行为包括提出课后反思、完成课后测试。
20.进一步，所述的在线学习表现预测器的模型训练环节采用svc、bayes、knn或ann softmax机器学习方法。
21.与现有技术相比，本发明的有益效果如下：
22.(1)本发明通过设置预测方法中通过对在线学习行为进行特征选择，根据行为分类模型对行为数据进行特征融合以获取每类行为的类别特征值，以构建基于机器学习的学习表现预测系统，来预测在线学习者的学习表现；
23.(2)本发明方法中，通过利用特征选择保留关键学习行为来降低模型运算成本，这对于在线平台能够提供高准确度和低耗时率的学习表现预测服务具有现实意义；
24.(3)本发明方法中，学习表现预测器的构建过程中将相同类别学习行为的数据进行了特征融合处理后再用于对学习表现预测器进行训练，有效地提高了学习表现预测器的预测准确度,可解释性更强。
具体实施方式
25.一种基于过程行为数据的学习预测方法，具体如下：
26.步骤(1)数据预处理；对在线学习平台获取的原始在线学习行为数据，进行数据清洗和转换，获取标准化的在线学习行为数据。
27.在线学习行为数据的质量直接影响预测器的效果。因此，首先要对从在线学习平台获取的学习行为数据进行数据清洗。数据清洗过程没有统一的流程，必须根据数据的实际情况来选择方法，对缺失值、重复值、异常值进行处理。同时在线学习平台记录的在线学习行为往往不是单一维度的，而不同维度的在线学习行为数据在数值上往往不具有可比性，无法进行特征选择。本发明通过对不同维度的在线学习行为数据进行z-score标准化来解决这一问题。
28.对原始在线学习行为进行数据完整性检查，删除不完整的数据条，获得原始在线学习行为集合b{b1,b2,
…
,bn}，根据b{b1,b2,
…
,bn}对应设定标准在线学习行为集合b
′
{b
′1,b
′2,
…
,b
′n}；其中bn表示在线学习平台记录的第n种原始在线学习行为数据，bn′
表示标准化后的第n种在线学习行为数据，n＝1,2,
…
,n，n为在线学习行为数量。
29.bn′
的第m条标准学习行为数据d
n,m
表示第n种原始在线学习行为的第m条原始学习行为数据，m＝1,2,
…
,m，m为第n种在线学习行为的数据数量，μbn表示第n种原始在线学习行为数据平均值，σbn表示第n种原始在线学习行为数据方差。
30.步骤(2)特征选择；对经过预处理的标准在线学习行为数据进行特征选择，获取核心学习行为数据；
31.特征选择可以从所有特征中选择出对训练模型有益的相关特征，以此降低特征维度，提高模型的泛化能力、运行效率与可解释性。本发明使用方差过滤法对标准化的在线学习行为数据进行特征选择。方差过滤法通过特征本身的方差来筛选特征。特征的方差越小，表示样本在这个特征上的差异性越低，特征对样本的区分作用越小。方差阈值threshold是方差过滤法的重要参数，即方差小于threshold的特征都会被舍弃。
32.设定标准学习行为特征值集合v{v1,v2,
…
,vn}，其中，第n种标准在线学习行为特征值μbn′
表示第n种标准在线学习行为数据平均值。遍历学习行为特征值集合v中元素与方差阈值threshold相比较，若当前标准在线学习行为特征值大于等于threshold，则将对应的标准在线学习行为加入核心学习行为集合，否则不加入。
33.步骤(3)特征融合；将核心学习行为集合中的元素进行分类，根据过程行为模型构造行为类别集合，对同类的核心学习行为进行特征融合，得到每类在线学习行为的类别特征值。
34.(3-1)过程行为模型是指对在线学习行为数据进行归类的规则，将学习行为划分为学习准备行为类别、知识获取行为类别、互动学习行为类别、学习巩固行为类别。
35.学习准备行为包括登录学习平台、访问课程主页面、访问课程活动界面；
36.知识获取行为包括浏览课程内容资源、参与课程活动、观看课程视频、访问资源链接；
37.互动学习行为包括参与研讨、发布论坛、回复论坛、向教师提问；
38.学习巩固行为包括提出课后反思、完成课后测试。
39.(3-2)根据过程行为模型，将核心学习行为划分至不同的在线学习行为聚类中：设定在线学习行为分类c{c1,c2,
…
,ck}，ck为第k种在线学习行为聚类，k＝1,2,
…
,k，k为在线学习行为聚类数量，即在线学习行为类别划分后，产生k个在线学习行为聚类，每一类在线学习行为聚类均包含个数不等的在线学习行为。
40.本实施例中，k＝4，c1表示学习准备行为类别，c2表示知识获取行为类别，c3表示互动学习行为类别，c4表示学习巩固行为类别。例如，c1{b
′1,b
′3,b
′5}表示第1、3、5种标准在线学习行为是学习准备行为类别的在线学习行为聚类。
41.(3-3)对每个在线学习行为聚类进行特征融合，获取对应的在线学习行为类融合特征值；第k种在线学习行为聚类ck的类融合特征值的类融合特征值原始在线学习行为数据bn携带监督标签，原始在线学习行为数据信息为及格时，监督标签λ＝0，不及格时，监督标签λ＝1，b
′n与对应的bn监督标签一致。
42.(3-4)构建在线学习行为聚类特征值集合
43.步骤(4)模型训练；将vc作为特征数据，训练构建的在线学习表现预测器，达到迭代次数后，选择预测效果最好的在线学习表现预测器对在线学习者的学习表现进行预测。
44.在线学习表现预测器的模型训练环节可选择svc、bayes、knn与ann softmax等经典的机器学习方法。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种融合图像和气象环境数据的道路结冰识别方法

一种基于过程行为数据的学习预测方法

相关文献

最热文献