一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于可穿戴设备的用户行为习惯预测方法

2022-05-18 07:44:05 来源:中国专利 TAG:


1.本发明涉及穿戴设备技术领域,特别涉及一种基于可穿戴设备的用户行为习惯预测方法。


背景技术:

2.据世界卫生组织报道身体活动不足是全球死亡的10个主要风险因素之一,每年造成约320万人死亡。熬夜、肥胖、运动量不足等是当下许多人生活的常态,对人们自身行为习惯进行监测和预测,有利于及时纠正当下人们不健康的行为习惯,还能为后续人们的运动健康管理和慢病预测提供良好的数据基础,并为用户推荐系统提供参考。
3.人类行为习惯可以由多种变量进行衡量,如睡眠数据、心率值、运动量这些生理数据以及运动相关的数据,它们都是高度个性化的数据,对于身体健康的监测具有重要意义。然而,采集高度个性化的数据需要耗费大量资源,近年来,可穿戴设备广泛出现和普及,为数据能够随时随地获取提供了极大的便利性,大大降低了数据采集成本。并且,它能够借助高速发展的数据挖掘技术,实现更加高效便捷的智能预测系统,给用户行为习惯预测提供了新的研究方向。
4.现有的用户行为预测方法包括马尔可夫(mc)模型、传统长短期记忆网络(lstm)等。然而,由于马尔科夫假设当下时刻的状态只依赖于前一时刻的状态,忽略了长期历史信息,模型没有能力对数据中的长期依赖关系进行建模。理论上,lstm可以基于任意长的过去的观测结果进行用户行为习惯预测,然而,传统的lstm预测方法在记忆序列模式时会忽略一些重要特征。一方面,用户行为习惯可能在短期内发生变化,数据在时序上的重要性有所不同。另一方面,每一位用户活动在可能开始的时间和可能持续的时间方面都是不同的,用户活动存在个体差异,不同特征间也存在重要性的区别。传统单一lstm网络模型不能够很好的获取到这些时序上和特征上的不同重要性,进而影响lstm网络对用户行为习惯的预测结果。


技术实现要素:

5.本发明技术解决方案:克服现有技术的不足,提供一种基于可穿戴设备的用户行为习惯预测方法,以克服当下单一lstm网络模型难以获取用户数据短期内重要时间特征的缺陷,同时解决其无法对不同特征的重要性进行很好的区别等问题。另外结合可穿戴设备可以以较低成本获取大量数据的优势,最终提升对用户未来行为习惯预测的精度。
6.本发明技术解决方案:一种基于可穿戴设备的用户行为习惯预测方法,所述方法包括:
7.步骤1,采集用户日常活动时的生理数据、运动相关的数据以及用户基本特征数据,通过可穿戴设备的陀螺仪传感器、加速度传感器、心电传感器采集用户日常活动时的心率、睡眠和运动相关的特征数据,再结合收集到的用户基本特征数据:身高、体重、年龄和性别,构建多元特征向量x
t
={x1,...,xd,...,xd},其中,x
t
代表相对某日而言,某用户数据的
特征向量,包含d个特征,d代表特征维度,xd表示某一维特征。
8.步骤2,对采集的数据进行预处理。
9.将采集到的数据集中80%的数据作为训练集,20%的数据作为测试集,并对训练集和测试集进行预处理,采用离差标准化方法对输入数据进行归一化,归一化公式为:
[0010][0011]
其中,x
*
为归一化后的数据,其范围在[0,1],xi为原始数据,x
max
为原始数据的最大值,x
min
为原始数据的最小值;
[0012]
采用滑动窗口方法,从训练集中提取长度为m的连续数据,并将所述连续数据作为模型训练集x
train
,最终将x
train
的数据格式转化为[n,m,d],其中,n代表样本数,m代表序列数据的长度,d代表特征维度;提取心率、睡眠和运动相关的z个特征的第m 1至第m t的数据作为x
train
的标签y
train
,t=1,2,

,n,n表示天数,当t=1时y
train
的数据格式为[n,z],z表示标签的特征维度,当t不为1时y
train
的数据格式为[n,t*z],同时将测试集x
test
的数据格式转化为[c,m,d],c代表测试样本数,标签y
test
的数据格式与训练集的相对应。
[0013]
步骤3,建立attention-lstm复合模型。
[0014]
所述建立的attention-lstm复合模型,主要由以下三个模型进行集成:
[0015]
第一部分是基于不同时刻的注意力机制改进的lstm模型,lstm网络加入时间注意力模块,即对时序信息分配注意力权重,此模型使用3层的lstm网络,设lstm隐藏层的一个输出为h
t
,则t时刻的注意力权重α
t
计算公式如下:
[0016]
α
t
=w
αtht
b
α
[0017]

′1,...,α

t
,...,α'
l
]=softmax([α1,...,α
t
,...,α
l
])
[0018]
其中,w
αt
为参数矩阵的转置,b
α
为对应偏置向量,h
t
为t时刻lstm的隐藏层输出向量,l为序列长度,然后所有权重组成向量输入到softmax函数中得到每个时刻的最终权值α

t
,基于注意力权重得到的输出hv计算公式如下:
[0019][0020]
其中,α

t
为t时刻的最终权值,最后将hv展开为一维向量h;
[0021]
第二部分是基于不同特征的注意力机制改进的lstm模型,lstm网络加入特征注意力模块,即对各个特征分配注意力权重,此模型使用2层的lstm网络,把输入数据的所有时刻特征xf组成的向量记为hf,特征xf的权重βf计算公式如下:
[0022]
βf=w
αdt
hf ν
β
[0023]

′1,...,β'f,...,β'f]=softmax([β1,...,βf,...,βf])
[0024]
其中,w
αdt
为参数矩阵的转置,ν
β
为偏置向量,xf为输入数据的某一维特征,f表示输入数据的特征维度,然后所有权重组成向量输入到softmax函数中得到每个特征的最终权值β'f,基于注意力权重得到的输出h
vd
计算公式如下:
[0025][0026]
其中,β'f为特征xf的最终权值,然后将h
vd
输入到lstm网络学习时间序列模式,最
后把lstm网络的最终输出展开为一维向量h”;
[0027]
第三部分是基于全连接网络(fc)的用户行为习惯预测整合模型,把所述两个lstm改进模型的输出h,h”进行拼接输入至用户行为习惯预测整合模型,通过预测整合模型将两个改进的lstm模型的输出进行动态结合,提升特征提取能力的同时也不会损失特征的时序信息,从而输出最终结果;
[0028]
其中,最后一层的激活函数使用线性激活函数linear,其他使用激活函数relu。
[0029]
步骤4,使用用户数据训练attention-lstm复合模型。
[0030]
训练流程为:先对模型每层的权重进行随机初始化,然后输入数据,基于不同时刻的attention机制改进的lstm模型和基于不同特征的attention机制改进的lstm模型分别输出一个一维特征向量h和h”;再将h和h”进行拼接作为用户行为习惯预测整合模型的输入,先前向传播得到attention-lstm复合模型的输出,根据损失函数和真实标签计算损失,其中损失函数使用均方根误差;再反向传播更新每一层的权重,通过梯度下降多次迭代使模型拟合并达到最优,训练过程使用adam优化器,最终获得完成训练的复合网络模型。
[0031]
步骤5,通过已训练好的attention-lstm复合模型预测用户行为习惯,所述用户行为习惯包括用户日常活动时的生理数据和运动相关的数据走势。
[0032]
将可穿戴设备收集到的用户当下及历史数据,截取与训练attention-lstm复合模型时长度为m相同长的数据,数据格式转化为[sample,m,d],其中sample表示预测样本数,将数据输入到训练好的attention-lstm复合模型预测行为习惯里面的各种特征在未来t天的走势,当t不为1时,进行预测之后,要把预测结果由二维转为三维。
[0033]
本发明与现有技术相比的优点在于:
[0034]
(1)本发明能够预测用户行为习惯里面的运动、心率和睡眠相关的特征在未来一段时间的走势。对当下单一lstm网络模型在记忆序列模式时会忽略一些重要特征,一方面为用户行为习惯可能在短期内发生变化,数据在时序上的重要性有所不同,另一方面是用户活动存在个体差异,不同特征间也存在重要性的区别等问题,本发明引入基于不同时刻和基于不同特征的attention机制以获得输入数据的时序信息和对不同特征分配不同的注意力权重,再通过基于全连接网络的用户行为习惯预测整合模型将两个改进的lstm模型的输出结果进行动态结合,提升特征提取能力的同时也不会损失特征的时序信息,另外,结合可穿戴设备可以以较低成本获取大量数据的优势,最终提升对用户未来行为习惯预测的精度。
[0035]
(2)本发明联合可穿戴设备可以对人们自身行为习惯进行监测和预测,有利于及时纠正当下人们不健康的行为习惯;注意力机制的加入也提高了神经网络的可解释性,从而可基于某些特征给用户提供针对性的建议。
[0036]
(3)此外,本发明也将更进一步促进可穿戴设备传感器技术在运动健康管理、疾病预测、用户推荐系统等领域的应用。
附图说明
[0037]
图1是本发明的一种基于可穿戴设备的用户行为习惯预测方法的流程图;
[0038]
图2是本发明一种基于注意力机制和长短期记忆网络(attention-lstm)复合模型的网络结构示意图;
[0039]
图3为lstm神经单元的结构图。
具体实施方式
[0040]
下面将结合附图对本发明的具体实施方式进行描述,详细介绍本发明实施例提供的一种基于可穿戴设备的用户行为习惯预测方法。
[0041]
本发明实施例中的基于可穿戴设备的用户行为习惯预测方法流程图如图1所示,包括以下步骤:
[0042]
步骤1,采集用户日常活动时的生理数据、运动相关的数据以及用户基本特征数据,通过可穿戴设备(智能手环、智能手表等)的陀螺仪传感器、加速度传感器、心电传感器采集用户日常活动时的心率、睡眠和运动相关的特征数据,再结合收集到的用户基本特征数据:身高、体重、年龄和性别,构建多元特征向量x
t
={x1,...,xd,...,xd},其中,x
t
代表相对某日而言,某用户数据的特征向量,包含d个特征,d代表特征维度,xd表示某一维特征,本发明实施例中d=8,特征向量为x
t
={x1,x2,x3,x4,x5,x6,x7,x8},其中,x1至x8这8个特征依次为:身高(米)、体重(公斤)、年龄、性别(0表示女、1表示男)、日平均心率、日平均运动步数、日平均运动时长、日平均睡眠时长。
[0043]
步骤2,对采集的数据进行预处理。
[0044]
步骤2.1,将采集到的数据集中80%的数据作为训练集,20%的数据作为测试集,并对训练集和测试集进行归一化处理,归一化公式为:
[0045][0046]
其中,x
*
为归一化后的数据,其范围在[0,1],xi为原始数据,x
max
为原始数据的最大值,x
min
为原始数据的最小值。
[0047]
步骤2.2,采用滑动窗口方法,从训练集中提取长度为m的连续数据,并将所述连续数据作为模型训练集x
train
,最终将x
train
数据格式转化为[n,m,8],n代表样本数,m代表序列数据的长度,8代表特征维度,本实施例中z=4,提取用户日平均心率、日平均运动步数、日平均运动时长、日平均睡眠时长这4个特征的第m 1至第m t的数据作为x
train
的标签y
train
,t=1,2,

,n,n表示天数;当t=1时y
train
的数据格式为[n,4],4代表标签的特征维度,当t不为1时y
train
的数据格式为[n,t*4],同时将测试集x
test
的数据格式转化为[c,m,8],c代表测试样本数,标签y
test
的数据格式与训练集的相对应。
[0048]
步骤3,建立attention-lstm复合模型,图2是本发明attention-lstm复合模型的网络结构示意图,所述网络结构示意图包含三个部分:
[0049]
第一部分是基于不同时刻的attention机制改进的lstm模型,用户行为习惯可能在短期内发生变化,数据在时序上的重要性有所不同,lstm网络加入时间注意力模块,对时序信息分配注意力权重,lstm层数过多时容易导致模型过拟合且难以收敛,因此基于不同时刻attention机制改进的lstm模型包含3层lstm网络;
[0050]
第二部分是基于不同特征的attention机制改进的lstm模型,用户活动存在个体差异,不同特征间也存在重要性的区别,lstm网络加入特征注意力模块,对各个特征分配注意力权重,此模型包含2层lstm网络;
[0051]
上述两个改进模块中的lstm单元都是对用户数据进行建模,lstm单元结构如图3
所示,其中,每个神经元的输入为当前时刻网络的输入x
t
、上一时刻的单元状态c
t-1
以及上一时刻的输出值h
t-1
,每个神经元的输出为当前时刻输出值h
t
和当前时刻的单元状态c
t
;三种门控单元分别为遗忘门zf,控制了上一时刻的单元状态c
t-1
哪些信息保留到当前时刻c
t
,输入门zi,对当前输入x
t
选择性的保留到单元状态c
t
,输出门z
°
,决定了单元状态c
t
有多少输出到当前h
t
,z
t
是单元状态输入,具体每个门和各个单元状态的更新如下:
[0052]
遗忘门:zf=σ(wf·
[h
t-1
,x
t
] bf)
[0053]
输入门:zi=σ(wi·
[h
t-1
,x
t
] bi)
[0054]
输出门:zo=σ(wf·
[h
t-1
,x
t
] bo)
[0055]
单元状态输入:z
t
=tanh(w
·
[h
t-1
,x
t
] b)
[0056]
单元状态:c
t
=zf⊙ct-1
zi⊙zt
[0057]
当前时刻隐状态输出:h
t
=z
°

tanh(c
t
)
[0058]
其中,wf,wi,wo,w表示权重矩阵,bf,bi,bo,b表示偏置向量,方括号表示向量拼接,tanh表示双曲正切激活函数,σ表示sigmoid激活函数;
[0059]
基于不同时刻的attention机制改进的lstm模型,attention机制应用于lstm网络之后,设lstm隐藏层的一个输出为h
t
,则t时刻的注意力权重α
t
计算公式如下:
[0060]
α
t
=w
αtht
b
α
[0061]

′1,...,α

t
,...,α'
l
]=softmax([α1,...,α
t
,...,α
l
])
[0062]
其中,w
αt
为参数矩阵的转置,b
α
为对应偏置向量,h
t
为t时刻lstm的隐藏层输出向量,l为序列长度,然后所有权重组成向量输入到softmax函数中得到每个时刻的最终权值α

t
,基于注意力权重得到的输出hv计算公式如下:
[0063][0064]
其中,α

t
为t时刻的最终权值,最后将hv展开为一维向量h;
[0065]
基于不同特征的attention机制改进的lstm模型,attention机制应用于lstm网络之前,把输入数据的所有时刻特征xf组成的向量记为hf,特征xf的权重βf计算公式如下:
[0066]
βf=w
αdt
hf ν
β
[0067]

′1,...,β'f,...,β'f]=softmax([β1,...,βf,...,βf])
[0068]
其中,w
αdt
为参数矩阵的转置,ν
β
为偏置向量,xf为输入数据的某一维特征,f表示输入数据的特征维度,本实施例中xf∈{x1,x2,x3,x4,x5,x6,x7,x8},即f=8,然后所有权重组成向量输入到softmax函数中得到每个特征的最终权值β'f,基于注意力权重得到的输出h
vd
计算公式如下:
[0069][0070]
其中,β'f为特征xf的最终权值,然后将h
vd
输入到lstm网络学习时间序列模式,最后把lstm网络的最终输出展开为一维向量h”;
[0071]
第三部分是基于全连接网络(fc)的用户行为习惯预测整合模型,把所述两个lstm改进模型的输出h,h”进行拼接输入至用户行为习惯预测整合模型,通过预测整合模型将两个改进的lstm模型的输出进行动态结合,提升特征提取能力的同时也不会损失特征的时序信息,从而输出最终结果;
[0072]
其中,最后一层的激活函数使用线性激活函数linear,其他使用激活函数relu。
[0073]
步骤4,使用用户数据训练attention-lstm复合模型。
[0074]
考虑到所述attention-lstm复合模型的最后一层为全连接层,其输出最多只能是一个二维矩阵,因而当预测长度t为1时,即预测用户未来1天的时序特征数据,标签数据的格式按照[n,4]即可,当t不为1时,即预测用户未来t天的时序特征数据,在将数据输入到模型前需要将标签数据的格式转化为[n,t*4],当进行预测之后,再把预测结果由二维转为三维;
[0075]
训练流程:先对模型每层的权重进行随机初始化,然后输入数据,基于不同时刻和基于不同特征的attention机制改进的lstm模型分别输出一个一维特征向量h和h”;再将h和h”进行拼接作为用户行为习惯预测整合模型的输入,先前向传播得到attention-lstm复合模型的输出,根据损失函数和真实标签计算损失,其中损失函数使用均方根误差(rmse),再反向传播更新每一层的权重,通过梯度下降多次迭代使模型拟合并达到最优,训练过程使用adam优化器,最终获得完成训练的复合网络模型,rmse计算公式如下:
[0076][0077]
其中,s为样本数,yi,yi′
分别为真实值与预测值。
[0078]
步骤5,通过已训练好的attention-lstm复合模型预测用户行为习惯,所述用户行为习惯包括用户日常活动时的生理数据和运动相关的数据走势。
[0079]
将可穿戴设备收集到的用户当下及历史数据,截取与训练attention-lstm复合模型时长度为m相同长的数据,数据格式转化为[sample,m,8],其中,sample表示预测样本数,m代表序列数据的长度,8代表特征维度,将其输入到训练好的attention-lstm复合模型预测用户行为习惯里面的日平均心率、日平均运动步数、日平均运动时长、日平均睡眠时长这4个特征在未来t天的走势,当t不为1时,进行预测之后,要把预测结果由二维[sample,t*4]格式转为三维[sample,t,4]格式。
[0080]
综上所述,本发明利用可穿戴设备的各种传感器采集到用户日常活动时的生理数据和运动相关的数据后再结合基本特征数据,然后对其进行预处理,通过已训练好的attention-lstm复合模型预测用户行为习惯里面的运动、心率和睡眠相关的特征在未来一段时间的走势。
[0081]
本发明对当下单一lstm网络模型难以获取输入的用户数据短期内的重要时间特征,同时单一lstm网络也无法对不同特征的重要性进行很好的区别等问题提出了改进方法,引入两种attention机制,再通过用户行为习惯预测整合模型将两个改进的lstm模型的输出结果进行动态结合,在提升特征提取能力的同时不会损失特征的时序信息,另外结合了可穿戴设备可以以较低成本获取大量数据的优势,最终提升对用户未来行为习惯预测的精度。本发明联合可穿戴设备可以对人们自身行为习惯进行监测和预测,有利于及时纠正当下人们不健康的行为习惯,此外,本发明也将更进一步促进可穿戴设备传感器技术在运动健康管理、疾病预测、用户推荐系统等领域的应用。
[0082]
以上虽然描述了本发明的具体实施方法,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明原理和实现的前提下,可以对这些实施方案做出多种变更
或修改,因此,本发明的保护范围由所附权利要求书限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献