一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于非线性动力学的儿童物体控制能力评估方法

2022-06-12 02:13:01 来源:中国专利 TAG:


1.本发明属于儿童身体运动协调能力评估技术领域,具体涉及一种基于非线性动力学的儿童物体控制能力评估方法。


背景技术:

2.作为儿童发展的重要组成部分,运动协调能力是儿童身心健康、运动技能以及成长发育的关键性基础条件,而患有运动协调能力障碍(developmentcoordination disorder,dcd)的儿童通常语言、认知等方面的能力也会受到影响,在儿童阶段及成人远期都可能会影响其生活自理能力及社会性相关功能。因此,探索科学高效的儿童运动协调能力与早期诊断方法,对提升识别诊断能力,早发现早干预具有重要意义。
3.物体控制能力是衡量人体大肌肉动作协调发展水平的重要内容之一,一般指投掷、踢和击打类动作技能,这些动作可以界定儿童躯干与四肢配合是否协调。因此,物体控制能力的发展对促进儿童达到自然、顺畅的动作技能水平起着至关重要的作用
4.随着传感器技术的迅速发展,研究人员可以利用传感器从生理学、运动学等不同的角度测量肉眼无法观察的特征,其测量结果具有较高的灵敏度、有效性和可重复性,为儿童运动协调能力评估较为精确的量化提供了途径。


技术实现要素:

5.本发明的目的是提供一种基于非线性动力学的儿童物体控制能力评估方法,解决了现有技术中存在的儿童物体控制能力识别问题、无法量化目标而导致的识别准确率低下的问题,实现儿童物体控制能力的分级评估。
6.本发明所采用的技术方案是,基于非线性动力学的儿童物体控制能力评估方法,具体按照以下步骤实施:
7.步骤1、利用kinect传感器采集测试者手部、肘部和肩部运动骨骼点空间位置信息,利用惯性传感器采集测试者手部的运动生物力学信号;
8.步骤2、从骨骼点空间位置信息和运动生物力学信号中提取人体运动的时频域特征和样本熵特征;
9.步骤3、采用主成分分析法对时频域特征和样本熵特征进行融合;
10.步骤4、构建基于rf的儿童物体控制能力评估模型,实现儿童物体控制能力的分类。
11.本发明的特点还在于,
12.步骤1具体按照以下步骤实施:
13.使用惯性传感器采集加速度和角速度信号,并提取信号峰值、峰值离散系数和信号周期在内的时域信号特征,同时还可以提取信号峰值功率、峰值频率和峰值总功率在内的频域信号特征;
14.使用kinect获得人体骨骼的空间位置数据,从而提取一些空间位置特征和关节角
度特征。
15.步骤2具体按照以下步骤实施:
16.步骤2.1、提取球落点的凸包特征和肘部夹角特征;
17.步骤2.2,提取样本熵:
18.样本熵具体计算如下:
19.步骤2.2.1、假设样本手部轨迹x方向序列集合为{a
x
(1),a
x
(2),...,a
x
(n)},则该序列样本熵计算如下:
20.按照序列{a
x
(1),a
x
(2),...,a
x
(n)}顺序组成一组m维向量a(i):
21.a(i)=[a
x
(1),a
x
(2),...,a
x
(i m-1)],i=1,2,...,i m-1
ꢀꢀꢀꢀ
(14)
[0022]
重构m维向量a(1),a(i),...,a(z),z=n-m 1
[0023]
步骤2.2.2、计算a(i)与a(j)向量之间的切比雪夫距离d[a(i),a(j)]:
[0024][0025]
给定阈值r,计算i<n-m 1时d[a(i),a(j)]<r的数目ni,将与距离总数 n-m 1比值,将该结果记作计算公式如下:
[0026][0027]
其中,m表示嵌入维数;r表示相似容限,r∈[0.1*std,0.25*std],std表示手部轨迹x方向序列的标准差;
[0028]
步骤2.2.3、将维数扩展至m 1维,重复步骤2.2.2-2.2.4,同理计算出
[0029]
则手部轨迹x方向序列样本熵为:
[0030][0031]
步骤2.1具体按照以下步骤实施:
[0032]
手部骨骼点在地面上投影点形成的包络近似看做是球落点形成的包络,络面积大小和离散程度反映了手对球的控制能力水平,其中包络面积和离散度计算方法为:
[0033]
步骤2.1.1、假设某样本投影点集为{(x1,z1),(x2,z2),...,(xn,zn)},第j个投影点坐标为(xj,zj),欧氏距离公式求取该样本重心投影轨迹长度c
xoz
,计算如公式:
[0034][0035]
步骤2.1.2、将点集按纵坐标z值的大小重新排序,并以q1,q2,q3....qn重新标记,如有相同最小z坐标的点,则选择其中横坐标x最小点记为q1;
[0036]
步骤2.1.3、把其他各点按q1qi与q1所在水平线所成的夹角值按升序排序;夹角相同时,以q1qi的距离由小到大进行排序,完成对其余各点q2,q3....qn的重新编号;
[0037]
步骤2.1.4、q
i 1
凹凸性判断:假设qi,q
i 1
,q
i 2
三个点的坐标分别为(xi,zi), (x
i 1
,z
i 1
),(x
i 2
,z
i 2
),计算凹凸判别变量k的值,公式为:
[0038]
k=(x
i 1zi 2-x
i 2zi 1
) (x
i 2
,z
i-xi,z
i 2
) (xi,z
i 1-x
i 1
,zi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0039]
k>0,q
i 1
为凸点;
[0040]
k<0,为凹点,删除q
i 1

[0041]
k=0,中性点,选择删除该点;
[0042]
步骤2.1.5、遍历了点集所有点后,获得凸包图的k个顶点,按照逆时针标记为q1(x1,z1),q2(x2,z2),...,qk(xk,zk),将k个顶点相连即可得到凸包,使用欧氏距离公式按照如下公式计算:
[0043]
for i=0,1,2,...,k-2:
[0044][0045][0046][0047]
获得k-2组距离组合,集合表示如下:
[0048]
{(d1,d
1_k
,d
2_k
),(d2,d
2_k
,d
3_k
),...,(d
k-2
,d
k-2_k
,d
(k-1)_k
)}
[0049]
其中,di表示相邻顶点之间的距离,d
i_k
表示q1qk两点距离,d
(i 1)_k
表示q
i 1
qk两点距离;
[0050]
步骤2.1.6、利用海伦公式和组合三角法求凸包面积s
xoz
,计算如公式:
[0051][0052][0053]
同理,重心数据在yox平面上投影的包络面积和轨迹长度分别表示为 s
yox
、c
yox
,重心在yoz平面上投影的包络面积和轨迹长度表示为s
yoz
、c
yoz

[0054]
肘部夹角定义如下:
[0055]
用(a
x
,ay,az),(b
x
,by,bz),(c
x
,cy,cz)分别表示手部、肘部和肩部的空间三维坐标,肘部—手部的空间向量表示为h=(a
x-b
x
,a
y-by,a
z-bz),肘部—肩部的空间向量表示为g=(c
x-b
x
,c
y-by,c
z-bz),则肘部夹角表示为:
[0056][0057]
步骤3具体按照以下步骤实施:
[0058]
采用主成分分析的方法对多元特征进行融合,提取具有代表性的综合评价特征,具体计算方法如下:
[0059]
假设有m个物体控制能力样本{x1,x2,...,xm},每个样本有n维特征每个特征xj都有各自的特征值;
[0060]
对所有特征进行中心化,计算第j个特征值的均值μj[0061][0062]
求协方差矩阵d
[0063][0064][0065]
其中,cov(x
p
,xq)为任意两个特征的协方差,p,q

[1,n];
[0066]
协方差矩阵d的特征值λ和对应的特征向量α关系如下:
[0067]
dα=λα
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(21)
[0068]
公式中对应的特征值λ有n个,记作{λ1...λi...λn},每个λi对应一个特征向量αi,将特征值λ按照从小到大排序,选取这n个λ中最大的前k个,并获取对应的特征向量,每一个特征向量记作(λi,αi),其中i的取值为1~k,从而得到一组{(λ1,α1),(λ2,α2),...,(λi,αi),...,(λk,αk)};
[0069]
对于每一个样本xi,将原始特征投影到选取的特征向量上,得到降维后的k维新特征计算方式如下:
[0070][0071]
最终得到m个样本的k维新特y,表示如下:
[0072][0073]
矩阵y即为对时频域特征和样本熵特征进行融合的结果。
[0074]
步骤4具体按照以下步骤实施:
[0075]
基于随机森林对儿童物体控制能力进行评估,随机森林集成了多棵树,随机森林的基本单元是决策树,决策树构建过程如下:
[0076]
步骤4.1、将所述步骤3输出结果y作为样本集,样本集y的第i维特征记作yi,
[0077]
将特征yi按照值从小到大排序,记为基于划分点t,将y 分为子集yt-和y
t
,其中y
t-是包含那些在特征yi上取值不大于t的样本,y
t
是包含那些在特征yi上取值大于t的样本;
[0078]
对于特征yi,把区间的中位点作为候选划分点,获得m-1个划分点集合:
[0079][0080]
步骤4.2、遍历考察集合选择最优的划分点进行样本集合的划分,公式如下:
[0081][0082]
其中,ent(y)是样本集基于标签值计算的信息熵,gain(y,yi,t)是样本集基于划分点t二分后的信息增益,gain(y,yi)是样本集基于t划分后的最大信息增益;
[0083]
步骤4.3、重复步骤4.1-4.2,获得k维特征的信息增益,集合表示如下:
[0084]
g=max{gain(y,y1),gain(y,y2),...,gain(y,yk)}
ꢀꢀ
(26)
[0085]
则g对应的特征被选维最佳分割特征作为根节点,重复上述过程递归的进行,就能构造出一颗决策树;
[0086]
步骤4.4、随机森林构建的流程如下:
[0087]
对样本集y用新符号表示如下:
[0088][0089]
输入为训练数据集y={(x1,y1),(x2,y2),...,(xm,ym)};
[0090]
输出为最终的强分类器结果h(x)。
[0091]
步骤4.4具体按照以下步骤实施:
[0092]
步骤4.4.1、已知m个样本构成训练集y,利用有放回抽样生成新的训练集y’;
[0093]
步骤4.4.2、从所有特征t中随机选择n个特征,n《t,构成新的训练集然后从n个特征中选择最佳分割特征作为节点,利用构造一颗决策树;
[0094]
步骤4.4.3、将步骤4.4.1~步骤4.4.2迭代d次,每次生成的训练集标记为其中i=(1,2,...,d),构造d棵决策树;
[0095]
步骤4.4.4、这d棵决策树共同构成随机森林,样本类别由每棵树参与投票表决,式28表示获得投票最多的类,即最终分类:
[0096][0097]
其中,h(x)表示组合分类模型,hi(x)表示单个决策树分类模型,y表示输出变量,i
(x)为示性函数;
[0098]
步骤4.5、评估等级划分,依据儿童基本运动技能评估工具,确定物体控制能力评估等级为较强、一般、较弱,对应的分值区间为[0,59]、[60, 79]、[80,100],通过线性函数将概率区间映射到对应的分数区间;
[0099]
映射函数f=kf c,其中,f为分类所属类对应的概率,f为评分,映射关系如下:
[0100]
(1)若样本分类结果为物体控制能力较弱,则将概率区间[1/3-1]将映射到区间[0,59]:
[0101]
f=88.5*f-29.5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(29)
[0102]
(2)若样本分类结果为物体控制能力一般,则将概率区间[1/3-1]映射到区间[60,79]:
[0103]
f=28.5*f 50.5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(30)
[0104]
(3)若样本分类结果为物体控制能力较强,则将概率区间[1/3-1]映射到区间[80,100]:
[0105]
f=30*f 70
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(31)。
[0106]
本发明的有益效果是,一种基于非线性动力学的儿童物体控制能力评估方法,引入了非线性动力学算法,提取运动信号的样本熵特征,实现了人体运动信号的多元特征采集;基于多传感器数据融合理论,采用主成分分析的方法实现了多元特征的融合;最后,使用随机森林方法构建构建了rf分类模型,实现了儿童物体控制能力的分类。
附图说明
[0107]
图1是本发明基于非线性动力学的儿童物体控制能力评估方法中,球落点的凸包特征和肘部夹角特征;
[0108]
图2是本发明基于非线性动力学的儿童物体控制能力评估方法中,样本熵计算过程;
[0109]
图3是本发明基于非线性动力学的儿童物体控制能力评估方法中,随机森林模型示意图。
具体实施方式
[0110]
下面结合附图和具体实施方式对本发明进行详细说明。
[0111]
本发明基于非线性动力学的儿童物体控制能力评估方法,结合图1~图3,具体按照以下步骤实施:
[0112]
步骤1、利用kinect传感器采集测试者手部、肘部和肩部运动骨骼点空间位置信息,利用惯性传感器采集测试者手部的运动生物力学信号;
[0113]
步骤1具体按照以下步骤实施:
[0114]
使用惯性传感器采集加速度和角速度信号,并提取信号峰值、峰值离散系数和信号周期在内的时域信号特征,同时还可以提取信号峰值功率、峰值频率和峰值总功率在内的频域信号特征;
[0115]
使用kinect获得人体骨骼的空间位置数据,从而提取一些空间位置特征和关节角度特征。
[0116]
步骤1.1,合加速度
[0117]
加速度常用来反映运动物体速度变化率的矢量,由牛顿第二定律可知加速度大小的决定了拍球力度的大小,即加速度大小越大,拍球运动所反映出的能量就越大。同时,为了避免单轴方向的加速度和角速度分析时带来的误差,引入合加速度度来补充反映手运动的剧烈程度。首先计算三轴加速度的平方和,然后对结果开方,计算公式如下:
[0118][0119]
式中:j
t
是合加速度,ax,ay,az分别是每个维度的加速度值。
[0120]
步骤1.2,均方根
[0121]
rms是时域特征提取法中一种常用的特征,具有计算速度快的优点,其核心思想是平方过滤,具有一定的平滑效果,可以去除加速度和角速度的部分噪声。rms反映了手部每次拍击的能量值,这有助于对物体控制能力水平等级的识别,计算公式如下:
[0122][0123]
式中:m为信号序列长度,ai是加速度值。
[0124]
步骤1.3,峰值信号的均值
[0125]
峰值是指一个周期内信号的极差值,该指标描述的是信号变化范围。在每次拍球动作中,加速度和角速度信号都会产生一个较为明显的波峰波谷。本发明提取加速度和角速度信号的峰值构建新的信号序列,计算角速度和加速度的峰值信号均值来反映信号能量集中趋势的情况。首先对峰值序列进行求和,然后进行平均操作,计算公式如下:
[0126][0127]
peak_avg为加速度信号的峰值序列均值,n为加速度信号中提取到的峰值点数目,ai_peaki表示在第i个动作周期内加速度信号的峰值。
[0128]
步骤1.4,峰值信号离散系数
[0129]
离散系数是常用于比较两组数据离散程度大小。当两个变量单位或平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值来比较,即离散系数,这样可以消除测量尺度和量纲的影响。计算公式如下:
[0130][0131]
peak_cv表示加速度信号的峰值序列离散系数,peak_avg表示加速度信号的峰值序列均值,peak_std表示加速度信号的峰值序列标准差。
[0132]
步骤1.5,信号周期均值
[0133]
信号的周期可以间接反映信号的频率,在拍球运动中,将受试者一次拍球所花费的时间定义为拍球周期t。假设加速度峰值点对应帧索引为 (p0,p1...,pn),则定义第n个周期tn=(p
n-p
n-1
)/f。周期均值t_avg计算公式如下:
[0134]
[0135]
步骤1.6,功率谱特征
[0136]
虽然时域特征提取法的计算简单,能够更直观的体现拍球活动数据的有效信息,但有些能量信息仅仅通过时域方法是察觉不到的,因此,可以使用频域特征来补充反映加速度和角速度信号中的有效信息。快速傅里叶变换可以将信号转换成频域信号,信号中所蕴含的能量信息可以由功率谱密度计算的峰值功率、峰值频率和信号总功率来反映。
[0137]
步骤2,从骨骼点空间位置信息和运动生物力学信号中提取人体运动的时频域特征和样本熵特征;
[0138]
步骤2具体按照以下步骤实施:
[0139]
步骤2.1、提取球落点的凸包特征和肘部夹角特征;
[0140]
步骤2.2,提取样本熵:
[0141]
样本熵是一种用于量化时间序列复杂性的非线性动力学参数,具有灵敏度高、抗干扰能力强等优势。
[0142]
物体控制运动信号是一种时间序列,在物体控制运动中,样本熵值越小表示物体控制运动信号复杂程度低;反之,样本熵越大,说明物体控制运动信号复杂程度高。其样本熵计算流程如图2所示,具体计算如下:
[0143]
步骤2.2.1、假设样本手部轨迹x方向序列集合为{a
x
(1),a
x
(2),...,a
x
(n)},则该序列样本熵计算如下:
[0144]
按照序列{a
x
(1),a
x
(2),...,a
x
(n)}顺序组成一组m维向量a(i):
[0145]
a(i)=[a
x
(1),a
x
(2),...,a
x
(i m-1)],i=1,2,...,i m-1
ꢀꢀꢀꢀ
(14)
[0146]
重构m维向量a(1),a(i),...,a(z),z=n-m 1
[0147]
步骤2.2.2、计算a(i)与a(j)向量之间的切比雪夫距离d[a(i),a(j)]:
[0148][0149]
给定阈值r,计算i<n-m 1时d[a(i),a(j)]<r的数目ni,将与距离总数 n-m 1比值,将该结果记作计算公式如下:
[0150][0151]
其中,m表示嵌入维数,通常取1或2;r表示相似容限, r

[0.1*std,0.25*std],std表示手部轨迹x方向序列的标准差;
[0152]
步骤2.2.3、将维数扩展至m 1维,重复步骤2.2.2-2.2.4,同理计算出
[0153]
则手部轨迹x方向序列样本熵为:
[0154][0155]
步骤2.1具体按照以下步骤实施:
[0156]
对球的操控不仅与手部运动力学特征相关,还应当充分考虑到手-小臂
‑ꢀ
大臂整体协调配合过程的一些空间位置、角度变化,如图1,比如球的落点越集中,说明手对球的把控越稳定,手部骨骼点在地面上投影点形成的包络近似看做是球落点形成的包络,络面积大小和离散程度也一定程度上反映了手对球的控制能力水平,其中包络面积和离散度计算
方法为:
[0157]
步骤2.1.1、假设某样本投影点集为{(x1,z1),(x2,z2),...,(xn,zn)},第j个投影点坐标为(xj,zj),欧氏距离公式求取该样本重心投影轨迹长度c
xoz
,计算如公式:
[0158][0159]
步骤2.1.2、将点集按纵坐标z值的大小重新排序,并以q1,q2,q3....qn重新标记,如有相同最小z坐标的点,则选择其中横坐标x最小点记为q1;
[0160]
步骤2.1.3、把其他各点按q1qi与q1所在水平线所成的夹角值按升序排序;夹角相同时,以q1qi的距离由小到大进行排序,完成对其余各点q2,q3....qn的重新编号;
[0161]
步骤2.1.4、q
i 1
凹凸性判断:假设qi,q
i 1
,q
i 2
三个点的坐标分别为(xi,zi), (x
i 1
,z
i 1
),(x
i 2
,z
i 2
),计算凹凸判别变量k的值,公式为:
[0162]
k=(x
i 1zi 2-x
i 2zi 1
) (x
i 2
,z
i-xi,z
i 2
) (xi,z
i 1-x
i 1
,zi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0163]
k>0,q
i 1
为凸点;
[0164]
k<0,为凹点,删除q
i 1

[0165]
k=0,中性点,选择删除该点;
[0166]
步骤2.1.5、遍历了点集所有点后,获得凸包图的k个顶点,按照逆时针标记为q1(x1,z1),q2(x2,z2),...,qk(xk,zk),将k个顶点相连即可得到凸包,使用欧氏距离公式按照如下公式计算:
[0167]
for i=0,1,2,...,k-2:
[0168][0169][0170][0171]
获得k-2组距离组合,集合表示如下:
[0172]
{(d1,d
1_k
,d
2_k
),(d2,d
2_k
,d
3_k
),...,(d
k-2
,d
k-2_k
,d
(k-1)_k
)}
[0173]
其中,di表示相邻顶点之间的距离,d
i_k
表示q1qk两点距离,d
(i 1)_k
表示 q
i
1qk两点距离;
[0174]
步骤2.1.6、利用海伦公式和组合三角法求凸包面积s
xoz
,计算如公式:
[0175][0176][0177]
同理,重心数据在yox平面上投影的包络面积和轨迹长度分别表示为 s
yox
、c
yox
,重心在yoz平面上投影的包络面积和轨迹长度表示为s
yoz
、c
yoz

[0178]
同时,控制能力的强弱,不仅影响球落点的范围,还会引起肘部夹角序列的不同程度的变化。离散程度不仅可以反映球落点集中程度,还可以反映肘部夹角序列变化的节奏
性和稳定性,其离散系数越大,夹角序列之间的偏差也就越大,说明拍球的节奏性和稳定性越弱,反之,其离散系数越小,夹角序列之间的偏差也就越小。肘部夹角定义如下:
[0179]
用(a
x
,ay,az),(b
x
,by,bz),(c
x
,cy,cz)分别表示手部、肘部和肩部的空间三维坐标,肘部—手部的空间向量表示为h=(a
x-b
x
,a
y-by,a
z-bz),肘部—肩部的空间向量表示为g=(c
x-b
x
,c
y-by,c
z-bz),则肘部夹角表示为:
[0180][0181]
步骤3,采用主成分分析法对时频域特征和样本熵特征进行融合;
[0182]
步骤3具体按照以下步骤实施:
[0183]
本发明使用多传感器采集了多元信号特征,由于物体控制运动具有肌肉间复杂的内联耦合关系,易导致存在特征冗余的问题。采用主成分分析的方法对多元特征进行融合,提取具有代表性的综合评价特征,具体计算方法如下:
[0184]
假设有m个物体控制能力样本{x1,x2,...,xm},每个样本有n维特征每个特征xj都有各自的特征值;
[0185]
对所有特征进行中心化,计算第j个特征值的均值μj[0186][0187]
求协方差矩阵d
[0188][0189][0190]
其中,cov(x
p
,xq)为任意两个特征的协方差,p,q

[1,n];
[0191]
协方差矩阵d的特征值λ和对应的特征向量α关系如下:
[0192]
dα=λα
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(21)
[0193]
公式中对应的特征值λ有n个,记作{λ1...λi...λn},每个λi对应一个特征向量αi,将特征值λ按照从小到大排序,选取这n个λ中最大的前k个,并获取对应的特征向量,每一个特征向量记作(λi,αi),其中i的取值为1~k,从而得到一组{(λ1,α1),(λ2,α2),...,(λi,αi),...,(λk,αk)};
[0194]
对于每一个样本xi,将原始特征投影到选取的特征向量上,得到降维后的k维新特征计算方式如下:
[0195][0196]
最终得到m个样本的k维新特y,表示如下:
[0197][0198]
矩阵y即为对时频域特征和样本熵特征进行融合的结果。
[0199]
步骤4,构建基于rf的儿童物体控制能力评估模型,实现儿童物体控制能力的分类。
[0200]
步骤4具体按照以下步骤实施:
[0201]
基于随机森林对儿童物体控制能力进行评估,随机森林集成了多棵树,随机森林的基本单元是决策树,决策树构建过程如下:
[0202]
步骤4.1、将所述步骤3输出结果y作为样本集,样本集y的第i维特征记作yi,
[0203]
将特征yi按照值从小到大排序,记为基于划分点t,将y 分为子集y
t-和y
t
,其中y
t-是包含那些在特征yi上取值不大于t的样本,y
t
是包含那些在特征yi上取值大于t的样本;
[0204]
对于特征yi,把区间的中位点作为候选划分点,获得m-1个划分点集合:
[0205][0206]
步骤4.2、遍历考察集合选择最优的划分点进行样本集合的划分,公式如下:
[0207][0208]
其中,ent(y)是样本集基于标签值计算的信息熵,gain(y,yi,t)是样本集基于划分点t二分后的信息增益,gain(y,yi)是样本集基于t划分后的最大信息增益;
[0209]
步骤4.3、重复步骤4.1-4.2,获得k维特征的信息增益,集合表示如下:
[0210]
g=max{gain(y,y1),gain(y,y2),...,gain(y,yk)}
ꢀꢀ
(26)
[0211]
则g对应的特征被选维最佳分割特征作为根节点,重复上述过程递归的进行,就能构造出一颗决策树;
[0212]
步骤4.4、随机森林的构建,随机森林模型如图3。随机森林构建的流程如下:
[0213]
为了避免混淆,方便表达,对样本集y用新符号表示如下:
[0214][0215]
输入为训练数据集y={(x1,y1),(x2,y2),...,(xm,ym)};
[0216]
输出为最终的强分类器结果h(x)。
[0217]
步骤4.4具体按照以下步骤实施:
[0218]
步骤4.4.1、已知m个样本构成训练集y,利用有放回抽样生成新的训练集y’;
[0219]
步骤4.4.2、从所有特征t中随机选择n个特征,n《t,构成新的训练集然后从n个特征中选择最佳分割特征作为节点,利用构造一颗决策树;
[0220]
步骤4.4.3、将步骤4.4.1~步骤4.4.2迭代d次,每次生成的训练集标记为其中i=(1,2,...,d),构造d棵决策树;
[0221]
步骤4.4.4、这d棵决策树共同构成随机森林,样本类别由每棵树参与投票表决,式28表示获得投票最多的类,即最终分类:
[0222][0223]
其中,h(x)表示组合分类模型,hi(x)表示单个决策树分类模型,y表示输出变量,i(x)为示性函数;
[0224]
步骤4.5、评估等级划分,依据儿童基本运动技能评估工具(tgmd-3),确定物体控制能力评估等级为较强、一般、较弱,对应的分值区间为[0,59]、 [60,79]、[80,100],通过线性函数将概率区间映射到对应的分数区间;
[0225]
映射函数f=kf c,其中,f为分类所属类对应的概率,f为评分,映射关系如下:
[0226]
(1)若样本分类结果为物体控制能力较弱,则将概率区间[1/3-1]将映射到区间[0,59]:
[0227]
f=88.5*f-29.5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(29)
[0228]
(2)若样本分类结果为物体控制能力一般,则将概率区间[1/3-1]映射到区间[60,79]:
[0229]
f=28.5*f 50.5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(30)
[0230]
(3)若样本分类结果为物体控制能力较强,则将概率区间[1/3-1]映射到区间[80,100]:
[0231]
f=30*f 70
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(31)。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献