一种基于大数据分析的在线教育方法与流程

2022-02-24 11:13:44 来源：中国专利 TAG：

1.本发明涉及在线教育技术领域，具体地说，涉及一种基于大数据分析的在线教育方法。

背景技术：

2.随着网络技术的发展，以往的面对面的教育方式转变为在线教育的方式，在线教育即远程教育，使一种基于网络的学习行为，因此真正打破了时间和空间的限制，对于工作繁忙，学习时间不固定的职场人而言网络远程教育是最方便不过的学习方式，但由于网络中资源过于复杂和繁琐，在线教育通过大数据进行分析时，偏差定位非常缓慢，而且脚本的兼容性底，从而导致在线教育的过程中出现卡顿现象，影响学习者的观看体验。

技术实现要素：

3.本发明的目的在于提供一种基于大数据分析的在线教育方法，以解决上述背景技术中提出的问题。
4.为实现上述目的，本发明提供一种基于大数据分析的在线教育方法，包括大数据分析平台，用于对在线教育的数据进行采集，并对采集的数据归纳和整理，所述大数据分析平台包括：
5.数据采集设备，所述数据采集设备用于对在线教育的线上行为数据进行采集，所述线上行为数据包括页面数据、交互数据、表单数据和会话数据，并对采集的数据进行预处理；
6.预处理设备，所述预处理设备用于对采集数据的进行数据清洗、数据集成、数据变换和数据归约；
7.数据输入设备，所述数据输入设备用于将预处理后的数据打包成控制脚本，并将脚本输入给脚本接收设备；
8.其中，所述脚本接收设备用于对数据输入设备输出的脚本接收，并对脚本进行类型区分，所述脚本接收设备与数据块地址处理设备连接；
9.其中，所述数据块地址处理设备用于对脚本内的控制命令提示符进行读取，通过第一行的控制命令提示符对所述数据块地址进行区分；
10.提示符区分设备，所述提示符区分设备用于将result根据类型进行区分，对接收的控制脚本包含的控制命令提示符进行读取，生成与控制命令提示符对应的2进制信息单元，所有控制命令提示符对应的2进制信息单元构成控制脚本的编辑执行result集合；
11.提示符读取设备，所述提示符读取设备用于对区分动作完成后的控制命令提示符进行读取，生成编辑执行result集合；
12.提示符定位设备，所述提示符读取设备读取完一个控制命令提示符后，则判断读取的控制命令提示符是否不匹配，若不匹配，则弹出该偏差控制命令提示符行偏差信息，所述提示符定位设备与提示符判断设备连接，用于将定位后的控制命令提示符输入给所述提
示符判断设备；
13.其中，所述提示符判断设备对位后的控制命令提示符进行接收，当区分result类型为控制脚本预设的控制脚本类型时，则采用预设的脚本类型对接收的控制脚本包含的控制命令提示符进行读取；否则，重新设定控制脚本类型读取规则字符串，并采用重新设定的控制脚本类型读取规则字符串对接收的控制脚本包含的控制命令提示符进行读取；读取控制脚本中的第一行，区分result集合为resulta和resultb，resulta是该控制脚本为预设的控制脚本类型，resultb是其他脚本类型，若是resulta，则采用预设的脚本类型进行读取，若是resultb，则采用重新设定的脚本类型进行读取。
14.作为本技术方案的进一步改进，所述预处理设备的数据清洗通过分箱法对数据中的噪声进行处理。
15.作为本技术方案的进一步改进，所述预处理设备的数据集成用于将清洗后一致的数据整合到一个数据库中。
16.作为本技术方案的进一步改进，所述预处理设备中，数据集成通过模式匹配、数据冗余和数据值冲突三个步骤进行整合；
17.其中，模式匹配用于在字符中找出与给定子串相同的所有子串,它以文本串和模式串为输入,以两个模式中元素在关系型数据库中对应于关系的属性间的映射关系作为输出；
18.其中，模式匹配算法采用bm匹配算法，bm匹配算法为采用从右向左比较的方法，同时通过坏字符规则和好后缀规则来决定向右跳跃的距离；
19.其中，bm匹配算法代码如下：
20.defines the entry point for the console application.
21.//
22.#include"stdafx.h"
23.#include《iostream》
24.#define max 200
25.using namespace std；
26.void get_dist(int*dist,char*t,const int lent)
27.{
28.int i；
29.for(i＝0；i《＝max；i )
30.dist[i]＝lent；
[0031]
for(i＝0；i《lent；i )
[0032]
dist[(int)t[i]]＝lent-i-1；
[0033]
}
[0034]
//
[0035]
int bm(char*s,char*t,int*dist,const int lens,const int lent)
[0036]
{
[0037]
int i,j,k；
[0038]
i＝lent-1；
[0039]
while(i《lens)
[0040]
{
[0041]
j＝lent-1；
[0042]
k＝i；
[0043]
while(j》＝0&&s[k]＝＝t[j])
[0044]
{
[0045]j--
；
[0046]k--
；
[0047]
}
[0048]
if(j《0)
[0049]
return i 2-lent；
[0050]
else
[0051]
i＝i dist[s[k]]；
[0052]
}
[0053]
if(i》＝lens)
[0054]
return 0；
[0055]
}
[0056]
int_tmain(int argc,_tchar*argv[])
[0057]
{
[0058]
int cases；
[0059]
char s[max],t[max]；
[0060]
int dist[max]；
[0061]
cout《《"请输入案例的个数："；
[0062]
cin》》cases；
[0063]
while(cases
--
)
[0064]
{
[0065]
cout《《"请输入主串:"《《endl；
[0066]
cin》》s；
[0067]
int lens＝strlen(s)；
[0068]
while(1)
[0069]
{
[0070]
cout《《"请输入需要匹配的模式串(以0结束):"《《endl；
[0071]
cin》》t；
[0072]
if(！strcmp(t,"0"))
[0073]
break；
[0074]
int lent＝strlen(t)；
[0075]
get_dist(dist,t,lent)；
[0076]
int pos＝bm(s,t,dist,lens,lent)；
[0077]
if(pos＝＝0)
[0078]
cout《《"没有匹配项！"《《endl；
[0079]
else
[0080]
cout《《"匹配的开始位置为:"《《pos《《endl；
[0081]
}
[0082]
}
[0083]
system("pause")；
[0084]
return 0；
[0085]
}
[0086]
其中，数据冗余采用数据模型对数据进行描述和定义；
[0087]
其中，数据模型中，数据结构是计算机存储、组织数据的方式，数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。
[0088]
作为本技术方案的进一步改进，所述bm匹配算法的基本流程如下：
[0089]
s1、设文本串t，模式串为p，然后将t与p进行左对齐；
[0090]
s2、对齐后bm算法从右向左对字符进行扫描；
[0091]
s3、扫描过程中，若发现某个字符x不匹配，则按如下两种情况讨论：
[0092]
若字符x在模式p中没有出现，那么从字符x开始的m个文本显然不可能与p匹配成功，直接全部跳过该区域即可；
[0093]
若字符x在模式p中出现，则以该字符进行对齐；
[0094]
s4、设skip(x)为p右移的距离，m为模式串p的长度，max(x)为字符x在p中最右位置；
[0095]
s5、若发现某个字符不匹配的同时，已有部分字符匹配成功，则按如下两种情况讨论：
[0096]
若在p中位置t处已匹配部分p'在p中的某位置t'也出现，且位置t'的前一个字符与位置t的前一个字符不相同，则将p右移使t'对应t方才的所在的位置；
[0097]
若果在p中任何位置已匹配部分p'都没有再出现，则找到与p'的后缀p”相同的p的最长前缀x，向右移动p，使x对应方才p”后缀所在的位置；
[0098]
s6、设shift(j)为p右移的距离，m为模式串p的长度，j为当前所匹配的字符位置，s为t'与t的距离(以上情况i)或者x与p”的距离。
[0099]
作为本技术方案的进一步改进，所述预处理设备中数据变换用于将数据按比例进行缩放，使之落入一个特定的区域，以消除数值型属性因大小不一而造成挖掘结果的偏差。
[0100]
作为本技术方案的进一步改进，所述数据变换采用小数定标规范化，通过移动属性a值的小数位置，将属性a的通过移动属性a值的小数位置，将属性a的值映射到[0，1]之间，用小数的科学表示法来达到规格化的目的；
[0101]
其中，移动的小数位数取决于属性a绝对值的最大值。
[0102]
作为本技术方案的进一步改进，所述小数定标规范化的计算公式如下：
[0103][0104]
其中，j为使max(|v
′
|)＜1成立的最小值。
[0105]
作为本技术方案的进一步改进，所述预处理设备中数据归约用于将原有的庞大数
据集中获得一个精简的数据集合，使这一精简数据集保持原有数据集的完整性，这样在精简数据集上进行数据挖掘显然效率更高，并且挖掘出来的结果与使用原有数据集所获得结果基本相同。
[0106]
作为本技术方案的进一步改进，所述数据归约采用数据压缩法，数据压缩法用于将数据编码的原始数据进行压缩。
[0107]
与现有技术相比，本发明的有益效果：
[0108]
1、该基于大数据分析的在线教育方法中，提示符定位设备能迅速找出不匹配的定位行，无需一行一行判断哪个控制命令提示符不匹配，提高了寻找偏差的效率，而且提示符判断设备通过区分result类型为控制脚本预设的控制脚本类型，从而提高了不同脚本类型的兼容性。
[0109]
2、该基于大数据分析的在线教育方法中，预处理设备采用数据归约的方法将原有的庞大数据集中获得一个精简的数据集合，并使这一精简数据集保持原有数据集的完整性，从而提高了在线教育中数据挖掘的效率。
附图说明
[0110]
图1为实施例1的匹配算法流程框图；
具体实施方式
[0111]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0112]
在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
[0113]
实施例1
[0114]
本发明提供一种基于大数据分析的在线教育方法，包括大数据分析平台，用于对在线教育的数据进行采集，并对采集的数据归纳和整理，大数据分析平台包括：
[0115]
数据采集设备，数据采集设备用于对在线教育的线上行为数据进行采集，线上行为数据包括页面数据、交互数据、表单数据和会话数据，并对采集的数据进行预处理；
[0116]
预处理设备，预处理设备用于对采集数据的进行数据清洗、数据集成、数据变换和数据归约；
[0117]
数据输入设备，数据输入设备用于将预处理后的数据打包成控制脚本，并将脚本输入给脚本接收设备；
[0118]
其中，脚本接收设备用于对数据输入设备输出的脚本接收，并对脚本进行类型区分，脚本接收设备与数据块地址处理设备连接；
[0119]
其中，数据块地址处理设备用于对脚本内的控制命令提示符进行读取，通过第一
行的控制命令提示符对数据块地址进行区分；
[0120]
提示符区分设备，提示符区分设备用于将result根据类型进行区分，对接收的控制脚本包含的控制命令提示符进行读取，生成与控制命令提示符对应的2进制信息单元，所有控制命令提示符对应的2进制信息单元构成控制脚本的编辑执行result集合；
[0121]
提示符读取设备，提示符读取设备用于对区分动作完成后的控制命令提示符进行读取，生成编辑执行result集合；
[0122]
提示符定位设备，提示符读取设备读取完一个控制命令提示符后，则判断读取的控制命令提示符是否不匹配，若不匹配，则弹出该偏差控制命令提示符行偏差信息，能迅速找出不匹配的定位行，无需一行一行判断哪个控制命令提示符不匹配，提高了寻找偏差的效率，提示符定位设备与提示符判断设备连接，用于将定位后的控制命令提示符输入给提示符判断设备；
[0123]
其中，提示符判断设备对位后的控制命令提示符进行接收，当区分result类型为控制脚本预设的控制脚本类型时，则采用预设的脚本类型对接收的控制脚本包含的控制命令提示符进行读取；否则，重新设定控制脚本类型读取规则字符串，并采用重新设定的控制脚本类型读取规则字符串对接收的控制脚本包含的控制命令提示符进行读取；读取控制脚本中的第一行，区分result集合为resulta和resultb，resulta是该控制脚本为预设的控制脚本类型，resultb是其他脚本类型，若是resulta，则采用预设的脚本类型进行读取，若是resultb，则采用重新设定的脚本类型进行读取，从而提高了不同脚本类型的兼容性。
[0124]
本实施例中，预处理设备的数据清洗通过分箱法对数据中的噪声进行处理，分箱法用于将处理的数据按照一定规则放进对应的“箱子”中，“箱子”是一个按照属性值划分的子区间，一个属性值处于某个子区间范围内，则视为将该属性值放进这个子区间代表的“箱子”里，分箱后对“箱子”内的数据进行平滑处理，平滑处理通过对同一“箱子”中的数据求平均值，用平均值代替该“箱子”中的数据。
[0125]
进一步的，预处理设备的数据集成用于将清洗后一致的数据整合到一个数据库中。
[0126]
具体的，预处理设备中，数据集成通过模式匹配、数据冗余和数据值冲突三个步骤进行整合；
[0127]
其中，模式匹配用于在字符中找出与给定子串相同的所有子串,它以文本串和模式串为输入,以两个模式中元素在关系型数据库中对应于关系的属性间的映射关系作为输出；
[0128]
其中，模式匹配算法采用bm匹配算法，bm匹配算法为采用从右向左比较的方法，同时通过坏字符规则和好后缀规则来决定向右跳跃的距离；
[0129]
其中，数据冗余采用数据模型对数据进行描述和定义；
[0130]
其中，数据模型中，数据结构是计算机存储、组织数据的方式，数据结构是指相互之间存在一种或多种特定关系的数据元素的集合,通常情况下，精心选择的数据结构可以带来更高的运行或者存储效率，数据结构往往同高效的检索算法和索引技术有关；数据操作主要描述在相应的数据结构上的操作类型和操作方式，它是操作算符的集合，包括若干操作和推理规则，用以对目标类型的有效实例所组成的数据库进行操作；据约束主要描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系，以及数据动态变化的规
则，以保证数据的正确、有效和相容，它是完整性规则的集合，用以限定符合数据模型的数据库状态，以及状态的变化。
[0131]
此外，bm匹配算法的基本流程如下：
[0132]
s1、设文本串t，模式串为p，然后将t与p进行左对齐；
[0133]
s2、对齐后bm算法从右向左对字符进行扫描；
[0134]
s3、扫描过程中，若发现某个字符x不匹配，则按如下两种情况讨论：
[0135]
若字符x在模式p中没有出现，那么从字符x开始的m个文本显然不可能与p匹配成功，直接全部跳过该区域即可；
[0136]
若字符x在模式p中出现，则以该字符进行对齐；
[0137]
s4、设skip(x)为p右移的距离，m为模式串p的长度，max(x)为字符x在p中最右位置；
[0138]
s5、若发现某个字符不匹配的同时，已有部分字符匹配成功，则按如下两种情况讨论：
[0139]
若在p中位置t处已匹配部分p'在p中的某位置t'也出现，且位置t'的前一个字符与位置t的前一个字符不相同，则将p右移使t'对应t方才的所在的位置；
[0140]
若果在p中任何位置已匹配部分p'都没有再出现，则找到与p'的后缀p”相同的p的最长前缀x，向右移动p，使x对应方才p”后缀所在的位置；
[0141]
s6、设shift(j)为p右移的距离，m为模式串p的长度，j为当前所匹配的字符位置，s为t'与t的距离(以上情况i)或者x与p”的距离。
[0142]
除此之外，预处理设备中数据变换用于将数据按比例进行缩放，使之落入一个特定的区域，以消除数值型属性因大小不一而造成挖掘结果的偏差。
[0143]
进一步的，数据变换采用小数定标规范化，通过移动属性a值的小数位置，将属性a的通过移动属性a值的小数位置，将属性a的值映射到[0，1]之间，用小数的科学表示法来达到规格化的目的；
[0144]
其中，移动的小数位数取决于属性a绝对值的最大值。
[0145]
具体的，小数定标规范化的计算公式如下：
[0146][0147]
其中，j为使max(|v
′
|)＜1成立的最小值。
[0148]
此外，预处理设备中数据归约用于将原有的庞大数据集中获得一个精简的数据集合，使这一精简数据集保持原有数据集的完整性，这样在精简数据集上进行数据挖掘显然效率更高，并且挖掘出来的结果与使用原有数据集所获得结果基本相同；
[0149]
其中，用于数据归约的时间不应当超过或“抵消”在归约后的数据上挖掘节省的时间；归约得到的数据比原数据小得多，但可以产生相同或几乎相同的分析结果。
[0150]
除此之外，数据归约采用数据压缩法，数据压缩法用于将数据编码的原始数据进行压缩；通过pca进行操作，假定待压缩的数据由n个取自k个维的元组或数据向量组成，主要成分分析并搜索得到c个最能代表数据的k维正交向量，这里c≤k。这样就可以把原数据投影到一个较小的空间，实现数据压缩。
[0151]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术
人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：三维头发模型的重建方法、装置、电子设备及存储介质与流程

一种基于大数据分析的在线教育方法与流程

相关文献

最热文献