融合学习行为特征的个性化知识追踪方法与系统与流程

2021-12-14 23:03:00 来源：中国专利 TAG：

技术特征：
1.融合学习行为特征的个性化知识追踪方法，其特征在于，包括以下步骤：s1、获取教学过程中学生的学习行为特征数据以及作答数据；其中，获取的学习行为特征数据包括学生在教学平台上的学习活动产生的数据；获取的作答数据包括学生作答的习题和作答结果；s2、对获取到的学习行为特征数据和作答数据进行预处理，得到相应序列；其中，对于学习行为特征数据，需要先进行清洗，再进行标准归一化处理得到原始学习行为特征向量；对于作答数据，需要从作答数据中分离提取得到习题文本序列、习题相关知识点序列以及作答结果序列；s3、使用独热编码规则对作答结果序列进行编码得到作答结果向量，将作答结果向量与原始学习行为特征向量构成二维向量，使用卷积神经网络模型进行学习，得到影响作答结果的学习行为特征向量；将习题文本序列和习题相关知识点序列进行拼接，再输入到降噪自编码器，得到习题编码向量；s4、对学习行为特征向量、习题编码向量和作答结果向量进行拼接，得到特征集合，然后对特征集合中的特征进行交叉、特征级联，最后通过自编码器对特征集合进行降维，得到答题记录向量；s5、将答题记录向量作为输入，训练基于lstm的深度知识追踪模型，每个时刻输入一个答题记录向量，获得对应时刻的知识状态隐向量，再将得到的知识状态隐向量输入到一个全连接层来获取学生对知识点的掌握状态向量，实现个性化知识追踪。2.根据权利要求1所述的融合学习行为特征的个性化知识追踪方法，其特征在于，在步骤s1，从包括mooc和雨课堂在内的在线教学平台中，分教学单元来获取学生的学习行为特征数据和作答数据；其中，以一个教学单元为一个阶段来统计学生学习行为特征。3.根据权利要求1所述的融合学习行为特征的个性化知识追踪方法，其特征在于，所述步骤s2包括以下步骤：s201、对学习行为特征数据进行清洗，将选取出来的特征缺失超过80％的学生个体剔除，部分学习行为特征根据原始学习行为特征进行简单数值运算，提取更能反应学生学生状态的学习行为特征；s202、对清洗后的学习行为特征数据进行max
‑
min归一化来保持数据平衡，得到每个学生的原始学习行为特征向量，记为f，表示如下：n,c∈n
*
其中，n为学生个数，c为课程章节数，n*表示正整数，表示第n个学生在第c个单元中的学习行为向量，f
nc
能够具体描述为{b1,b2,
…
,b
fk
}，b
fk
表示第n个学生在第c个单元中的某一个学习行为特征，统计的学习行为特征总共有fk个；提取学生的习题文本序列，记为q；对作答数据按学生序号进行排序，然后将同一学生在同一单元中的答题记录按答题的先后顺序进行拼接成一条记录，然后使用一个标准化单元来统一数据的表现形式，形式化表示如下：tn∈n
*
其中，表示第n个学生做了第tn道习题，每个学生的答题量或每个单元的题量可能会不
相同，分别记为(t1,t2,
…
,tn)，tn表示第n个学生的答题量；提取习题相关知识点序列，记为k；根据作答数据和提取到的学生习题作答系列以及习题与知识点间的对应关系，获取每个学生作答的习题相关知识点序列，形式化表示如下：sn∈n
*
其中，表示第n个题目中包含第sn个知识点，每个题目包含的知识点数量不同，分别记为(s1,s2,
…
,sn)；提取学生作答结果序列，记为a；根据作答数据和提取到的学生习题作答系列，获取每个学生的作答结果序列，形式化表示如下：其中，表示第n个学生在第tn道习题上的作答结果，为正确或错误。4.根据权利要求1所述的融合学习行为特征的个性化知识追踪方法，其特征在于，所述步骤s3包括以下步骤：s301、使用独热编码规则对作答结果序列进行编码，1代表作答正确，0代表作答错误，得到作答结果向量，将学生学习行为特征和作答结果向量构造成二维向量，将习题文本序列和习题相关知识点序列进行序列拼接，再输入到降噪自编码器，得到习题编码向量，具体步骤如下：s3011、对习题文本进行预处理，包括标点与文字间隔、去除无意义字符，然后分词、去停用词，最后提取习题的关键词序列，即习题文本序列，将表示习题的关键词序列与相应习题的相关知识点序列进行拼接，得到习题特征序列；s3012、将得到的习题特征序列转换为位序编码，输入到嵌入层，或直接通过预训练词向量来初始化文本的嵌入层；假设嵌入层的维度为d，语料库中词汇量大小为m，则嵌入层将被随机初始化为大小d*m的矩阵，此时题目中所包含的词汇能够通过位序索引，得到相应的词向量，即嵌入向量；s3013、将词向量输入到降噪自编码器中，重构得到习题编码向量；降噪自编码器是由多层前馈神经网络构成，其中包括编码层、隐藏层和解码层，以隐藏层为界限，左边为编码器，右边为解码器，降噪自编码器经过解码器解码能够还原出文本的原始信息，在这个过程中，隐藏层通过使用更少的神经元来捕获文本的隐式描述，是文本更抽象的低维信息表示，在可解释性上分析，隐藏层提取了文本的主题信息；其中，每层前馈神经网络的权重是根据高斯分布进行随机初始化；所述编码层是用于将词向量输入映射到低维空间，具体表示为：h＝f(w
t
x' d)其中，h表示编码后的习题特征，x'表示词向量的有噪声版本，w
t
为编码层输入的权值矩阵，d为编码层偏置项，f(
·
)是一个element
‑
wide映射函数，该映射函数包括恒等函数f(g)＝g或sigmoid函数f(x)＝1/(1 e
(
‑
x)
)；所述解码层是用于从噪声数据中重构原的输入数据，具体表示为：
其中，为经过降噪编码器重构后的习题编码向量，参数w'
t
为解码层输入的权值矩阵，d’为解码层偏置项，g(
·
)是一个element
‑
wise映射函数；s302、基于卷积神经网络进行特征学习，卷积层使用多个不同大小的卷积核来提取多组局部特征，通过卷积操作后的输出为：co＝fr(wd*x
i,i cw
‑1 br)其中，*表示卷积层计算中的卷积操作，wd为共享权重参数，cw为滑动窗口大小，x为指窗口大小的学习行为特征和作答结果向量组成的二维向量，br为偏置项，fr为激活函数；s303、对卷积层提取出来的特征进行最大池化操作，然后通过全连接层的softmax函数对特征进行计算，从而根据计算出的概率值提取出影响作答结果的学习行为特征向量。5.根据权利要求1所述的融合学习行为特征的个性化知识追踪方法，其特征在于，所述步骤s4包括以下步骤：s401、将学习特征向量、习题编码向量和作答结果向量进行向量拼接，得到每个学生的影响作答结果的特征集合；s402、对影响作答结果的特征集合进行交叉，并在此基础上进行特征级联，使用自编码器对特征向量进行降维，得到答题记录向量。6.根据权利要求1所述的融合学习行为特征的个性化知识追踪方法，其特征在于，所述步骤s5包括以下步骤：s501、将答题记录向量作为输入，训练基于lstm的深度知识追踪模型，每个时刻输入一个答题记录向量，获得对应时刻的知识状态隐向量；模型间传递公式如下：i
t
＝σ(w
ri
r
t
u
ri
h
t
‑1 b
i
)i
t
＝σ(w
rf
r
t
u
rf
h
t
‑1 b
f
)c
t
＝f
t
*c
t
‑1 i
t
*tanh(w
rc
r
t
u
rc
h
t
‑1)o
t
＝σ(w
ro
r
t
u
ro
h
t
‑1 b
o
)h
t
＝o
t
*tanh(c
t
)其中，i
t
、f
t
、o
t
、c
t
分别表示lstm中的输入门、遗忘门、输出门和记忆单元，h
t
为当前层的隐向量输出，r
t
为t时刻的输入，u
ri
h
t
‑1、u
rf
h
t
‑1、u
rc
h
t
‑1、u
ro
h
t
‑1分别代表相应门的上一时刻的隐向量的h
t
‑1权重，w
ri
、w
rf
、w
rc
、w
ro
分别代表相应门的权重，b
i
、b
f
、b
o
分别代表相应门的偏置，σ为激活函数；s502、将对应时刻的知识状态隐向量输入到一个全连接层来获取学生对知识点的掌握状态向量k
t
，表示如下：k
t
＝σ(w
k
o
t
b
k
)其中，w
k
、b
k
是待学习的参数；在训练过程中采用的是交叉熵损失函数l，公式如下：其中，q
t 1
表示学生在t 1时刻回答的习题，a
t 1
表示t 1时刻回答的习题的正确与否，δ表示降维后的独热编码格式，l为交叉熵函数，y
tt
表示t时刻的输出。7.融合学习行为特征的个性化知识追踪系统，其特征在于，包括：数据预处理单元，用于准备输入数据集；首先对学习行为数据进行清洗，根据选取出来
的学习行为数据缺失超过80％的学生个体剔除，然后再对学习行为数据进行max
‑
min归一化来保持数据平衡，得到每个学生的原始学习行为特征向量，并从作答数据中分离提取得到习题文本序列、习题相关知识点序列以及作答结果序列；学习行为特征提取单元，用于提取影响作答结果的学习行为特征；使用独热编码规则对作答结果序列进行编码得到作答结果向量，将作答结果向量与原始学习行为特征向量构成二维向量，使用卷积神经网络模型进行学习，得到影响作答结果的学习行为特征向量；习题信息提取单元，用于获取题目文本及所包含知识点的信息；通过对习题文本进行处理，包括标点与文字间隔、去除无意义字符，然后分词、去停用词，最后提取习题的关键词序列，即习题文本序列，将表示习题的关键词序列与相应习题的相关知识点序列进行拼接，得到习题特征序列，将得到的习题特征序列转换为位序编码，输入到嵌入层，或直接通过预训练词向量来初始化文本的嵌入层；假设嵌入层的维度为d，语料库中词汇量大小为m，则嵌入层将被随机初始化为大小d*m的矩阵，此时题目中所包含的词汇能够通过位序索引，得到相应的词向量，即嵌入向量，将词向量输入到降噪自编码器中，重构得到习题编码向量；特征降维单元，用于对获取到的特征集合进行降维；对学习行为特征向量、习题编码向量和作答结果向量进行拼接，得到特征集合，然后对特征集合中的特征进行交叉、特征级联，最后通过自编码器对特征集合进行降维，得到答题记录向量；知识追踪训练单元，用于训练知识追踪模型，预测学生对知识点的掌握情况；将答题记录向量作为输入，训练基于lstm的深度知识追踪模型，每个时刻输入一个答题记录向量，获得对应时刻的知识状态隐向量，再将得到的知识状态隐向量输入到一个全连接层来获取学生对知识点的掌握状态向量，实现个性化知识追踪。

技术总结
本发明公开了一种融合学习行为特征的个性化知识追踪方法与系统，利用卷积神经网络提取学习行为和答题结果数据组成的复合向量中的有效特征；并通过降噪自编码器提取包含知识点在内的题目信息特征，最终将学习行为特征与题目信息特征相结合，经过LSTM网络和全连接层，获得学生对知识的掌握程度状态。在建模过程中，本发明融合了学生在学习过程中的一系列学习行为特征和习题本身及知识点的丰富信息，更准确地预测了每位学生的知识掌握程度。本发明可应用于混合式教学，为个性化教学提供量化依据。依据。依据。

技术研发人员：袁华王兰
受保护的技术使用者：华南理工大学
技术研发日：2021.08.13
技术公布日：2021/12/13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：数据搜索准确性验证方法、装置、设备及计算机可读介质与流程

融合学习行为特征的个性化知识追踪方法与系统与流程

相关文献

最热文献