一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

张贴动作手势识别及模型训练方法、装置及设备与流程

2022-05-18 12:01:15 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种张贴动作手势识别及模型训练方法、装置及设备。


背景技术:

2.将布告、广告、标语等张贴物采用粘、钉等手段张贴在墙或板或其他载体上,张贴物用于展示信息。人工检查用户是否张贴相应的张贴物,显然是极其耗费时间和精力的,也增加了企业的人工成本,同时人工检查的准确度有待考量。
3.有待于此,相关技术提出基于计算机视觉的模板匹配方法,通过对图像数据基于模板进行信息匹配来检测张贴行为。但难点在于,该方法必须选择出每张图片中哪一种特征是最重要的,这很大程度上依赖于工程师的判断和长时间的误差处理。因此传统计算机视觉的模板匹配方法工作量是比较大的,因为要考虑多种不同的匹配模板,最终精确度很难做到很高。


技术实现要素:

4.针对现有技术中的问题,本发明的目的在于提供一种张贴动作手势识别及模型训练方法、装置及设备,不仅能够大幅提升识别效率,还能够降低人工因素干扰导致的识别精度低的问题,提升识别精确度。
5.本发明实施例提供一种张贴动作手势识别方法,该方法包括:
6.获取待识别图像及基于卷积神经网络的手势识别模型,卷积神经网络包括至少一层卷积层;
7.利用至少一层卷积层从待识别图像中提取图像特征,并根据图像特征在待识别图像中确定至少一个对象候选框及候选对象的类别,并根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,目标对象作为张贴动作手势。
8.可选地,卷积神经网络可以包括至少两层卷积层,则利用至少一层卷积层从待识别图像中提取图像特征,包括:
9.根据至少两层卷积层输出的图像特征,在待识别图像中识别出对象候选框集合及各候选对象的类别。
10.可选地,根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,包括如下步骤:
11.根据候选对象的类别在对象候选框集合中保留候选对象的类别为目标的对象候选框;
12.根据保留的对象候选框之间的位置关系,对保留的对象候选框进行去重,得到目标对象框。
13.可选地,根据保留的对象候选框之间的位置关系,对保留的对象候选框进行去重,得到目标对象框,包括如下步骤:
14.从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框,参考对象候选框的置信度高于保留的对象候选框中的剩余候选框;
15.根据剩余候选框与参考对象候选框之间的位置关系,获得剩余候选框与参考候选框之间的重叠面积,并在重叠面积超过目标阈值的情况下,在待识别图像中将剩余候选框删除,得到目标对象框。
16.可选地,根据保留的对象候选框之间的位置关系,对保留的对象候选框进行去重,得到目标对象框,还包括如下步骤:
17.在重叠面积未超过目标阈值的情况下,保留剩余候选框,得到剩余候选框集合;
18.将保留的剩余候选框集合作为保留的对象候选框,返回从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框。
19.本发明实施例还提供一种手势识别模型训练方法,该方法包括:
20.获取手势图像样本,手势图像样本中标注有手势标注框;
21.将手势图像样本输入基于卷积神经网络的手势识别模型,利用至少一层卷积层提取图像特征,并根据图像特征输出对手势的预测框;
22.根据预测框和手势标注框之间的损失函数调整手势识别模型的模型参数,直到手势识别模型收敛。
23.可选地,损失函数包括坐标损失函数、目标损失函数、类别预测损失函数、及预测框和手势标注框交并比损失函数。
24.可选地,交并比损失函数为ciou损失函数。
25.本发明实施例还提供一种张贴动作手势识别装置,该装置包括:
26.获取模块,获取待识别图像及基于卷积神经网络的手势识别模型,卷积神经网络包括至少一层卷积层;
27.手势识别模块,利用至少一层卷积层从待识别图像中提取图像特征,并根据图像特征在待识别图像中确定至少一个对象候选框及候选对象的类别,并根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,目标对象作为张贴动作手势。
28.本发明实施例还提供一种手势识别模型训练装置,该装置包括:
29.获取模块,获取手势图像样本,手势图像样本中标注有手势标注框;
30.图像提取模块,将手势图像样本输入基于卷积神经网络的手势识别模型,利用至少一层卷积层提取图像特征,并根据图像特征输出对手势的预测框;
31.模型训练模块,根据预测框和手势标注框之间的损失函数调整手势识别模型的模型参数,直到手势识别模型收敛。较结果。
32.本发明实施例还提供一种电子设备,包括:
33.处理器;
34.存储器,其中存储有处理器的可执行指令;
35.其中,处理器配置为经由执行可执行指令来执行的张贴动作手势识别方法、或手势识别模型训练方法的步骤。
36.本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被处理器执行时实现的张贴动作手势识别方法、或手势识别模型训练方法的步骤。
37.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本公开。
38.本发明的张贴动作手势识别及模型训练方法、装置及设备具有如下有益效果:
39.张贴动作手势识别方法通过利用至少一层卷积层从待识别图像中提取图像特征,并根据图像特征在待识别图像中确定至少一个对象候选框及候选对象的类别,并根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,目标对象作为张贴动作手势。本公开说明书提出的方案采用手势识别模型的技术手段对张贴行为进行自动学习及识别,不仅能够大幅提升识别效率,还能够降低人工因素干扰导致的识别精度低的问题,提升识别精确度。
附图说明
40.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
41.图1是本公开说明书一实施例的张贴动作手势识别方法的流程图;
42.图2是本公开说明书一实施例的手势识别模型训练方法的流程图;
43.图3是本公开说明书一实施例的张贴动作手势识别装置的结构示意图;
44.图4是本公开说明书一实施例的手势识别模型训练装置的结构示意图;
45.图5是本公开说明书一实施例的电子设备的结构示意图;
46.图6是本公开说明书一实施例的计算机可读存储介质的结构示意图。
具体实施方式
47.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
48.此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
49.附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
50.本公开说明书提出基于卷积神经网络模型的张贴动作手势的识别方法,其中卷积神经网络模型可通过训练自动学习模型参数,从而能够对输入图像识别出张贴手势姿态,并输出张贴手势姿态识别结果。
51.本公开说明书提出基于卷积神经网络的手势识别模型实现手势识别,可以对图像中的目标提取不同程度、不同形状的特征,而不仅仅是边缘特征和二值化等传统图像处理特征,使得模型相对现有技术而言具有很强的鲁棒性。
52.本公开说明书提供的方案采用机器学习模型的技术手段对张贴行为进行自动学
习及识别,不仅能够大幅提升识别效率,还能够降低人工因素干扰导致的识别精度低的问题,提升识别精确度。
53.图1为本公开实施例提供的张贴动作手势识别方法的流程图,如图1所示,本方法包括如下步骤:
54.步骤110:获取待识别图像及基于卷积神经网络的手势识别模型,卷积神经网络包括至少一层卷积层;
55.步骤120:利用至少一层卷积层从待识别图像中提取图像特征,并根据图像特征在待识别图像中确定至少一个对象候选框及候选对象的类别,并根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,目标对象作为张贴动作手势。
56.其中,手势识别模型是基于卷积神经网络(convolutional neural networks,cnn)构建得到,卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(feedforward neural networks),是深度学习(deep learning)的代表算法之一。其中卷积层用于提取待识别图像中的局部特征,输出特征图,该特征图即为上文的图像特征。
57.其中,图像特征至少包括对象候选框在待识别图像中的位置及候选对象的类别,对象候选框的位置可以使用定位坐标表征。定位坐标用于定位对象候选框,由于候选框通常是矩形,根据候选框左上角和右下角的坐标,即可定位该候选框。
58.候选对象的类别可以包括目标和背景,其中目标是指待识别图像前景中的对象,而背景是待识别对象的背景部分。可以理解的是,待识别的手势作为图像中的对象,其类别是目标。
59.因此,根据图像特征可以识别出待识别图像上各个对象候选框。
60.在本公开实施例中,卷积神经网络可以包括至少两层卷积层,则每层卷积层均输出图像特征,在这种情况下,根据至少两层卷积层输出的图像特征可在待识别图像中确定对象候选框集合及各候选对象的类别。
61.这样做的好处在于:由于不同卷积层输出的图像特征所对应的对象候选框的大小不一样,因此,对于类别为目标的对象的大小就不一样,选取模型中至少两层卷积层输出的图像特征来确定对象候选框集合,就可以获取到待识别图像中不同位置、不同大小的对象,从而使得模型具有更高的召回率,提高模型对手势识别的精确度。
62.在一种可选实施例中,手势识别模型中卷积层的数量大于2,而至少两层卷积层则包括最后一层卷积层及其前面至少一层卷积层。在其他的实施方式中,也可以选取第4层、5层、6层、7层卷积层输出的图像特征,或者第6层和第7层卷积层输出的图像特征。
63.本公开说明书对于所选取的卷积层及其数量和顺序没有限定。
64.在可选实施例中,不排除根据卷积神经网络的最后一层卷积层的图像特征确定对象候选框或其集合。
65.在本公开实施例中,卷积神经网络还包括池化层(pooling layer),在卷积层进行特征提取后,输出的特征图会被传递至池化层进行特征选择和信息过滤。池化层包含预设定的池化函数,其功能是将特征图中单个点的结果替换为其相邻区域的特征图统计量,达到降维的目的。
66.在这种情况下,还可以利用池化层提取图像特征,并根据池化层输出端图像特征确定对象候选框。
67.在本公开实施例中,根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,包括:
68.根据候选对象的类别在对象候选框集合中保留候选对象的类别为目标的对象候选框;
69.根据保留的对象候选框之间的位置关系,对保留的对象候选框进行去重,得到目标对象框。
70.在本实施例中,获取的对象候选框集合中的各个对象候选框,是来自于至少两层卷积层输出的图像特征,而这些图像特征中有的对象类别是目标,有的对象类别是背景,因此,需要从中根据对象类别进行筛选。同时,不同的卷积层输出的图像特征有可能指向的是同一个对象,因此,还需要对这些对象候选框进行去重。
71.具体而言,可以保留对象类别是目标的图像特征所对应的对象候选框,然后在筛选后的各个对象候选框中,判断哪些对象候选框的重合度很高,那么这些重合度很高的对象候选框就是指同一个对象,继而将其去重即可。例如,可以根据对象候选框的定位坐标来确定不同对象候选框之间的位置关系,然后基于该位置关系确定其重合度。
72.在本公开实施例中,根据保留的对象候选框之间的位置关系,对保留的对象候选框进行去重,得到目标对象框,包括:
73.从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框,参考对象候选框的置信度高于保留的对象候选框中的剩余候选框;
74.根据剩余候选框与参考候选框之间的位置关系,获得剩余候选框与参考候选框之间的重叠面积,并在重叠面积超过目标阈值的情况下,在待识别图像中将剩余候选框删除,得到目标对象框。
75.在重叠面积超过目标阈值时,认为两个候选框的里面的对象属于同一个类别,只需要留下一个类别的可能性框图即可。
76.具体地,图像特征具体输出对候选对象的类别的识别概率,这体现为置信度,具体为该候选对象的类别为目标的概率。因此,可通过对置信度进行排序,得到置信度最高分,该最高分对应的对象候选框为参考对象候选框。
77.具体地,在剩余候选框有多个时,通过遍历剩余候选框,与参考对象候选框进行重叠面积比对,从而得到目标对象框。
78.在本公开实施例中,可能会出现同一待识别图像中包含多个目标手势的情况。对此,该方法还可以包括:
79.在重叠面积未超过目标阈值的情况下,保留剩余候选框,得到剩余候选框集合;
80.将保留的剩余候选框集合作为保留的对象候选框,返回从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框。
81.在这种情况下,可能会识别得到多个目标手势。该手势识别模型可以获得待识别模型中不同位置、不同大小和类别的手势,从而使得模型具有更高的召回率,提高模型对手势数量识别的精确度。
82.图2为本公开实施例提供的手势识别模型训练方法的流程图,如图2所示,该方法包括如下步骤:
83.步骤210:获取手势图像样本,手势图像中标注有手势标注框;
84.步骤220:将手势图像样本输入基于卷积神经网络的手势识别模型,利用至少一层卷积层提取图像特征,并根据图像特征输出对手势的预测框;
85.步骤230:根据预测框和手势标注框之间的损失函数调整手势识别模型的模型参数,直到手势识别模型收敛。
86.本公开实施例采用机器学习方法训练手势识别模型,该手势识别模型可用于上述图1所示手势识别方法,对手势进行高效精确识别。采用机器学习方法,手势识别模型可以自动学习各类手势,省去人工手段的工作量和人为因素的干扰,能够提升手势识别结果的客观性和精确度。
87.在本公开实施例中,手势识别模型具有一层或多层卷积层。本手势识别模型是利用机器学习方法预先训练出的具有多层卷积层的卷积神经网络模型。
88.本公开实施例的方法具有较高的可扩展性。具体可以增加不同光线下,不同角度,不同种类手势图像并进行人工标注丰富样本集,具有较好的可扩展性。
89.本公开实施方案采用深度学习的模板匹配方法,将已经被标记上对象类别的图像数据集投入到模型中,卷积神经网络得以找到背后的模式,自动找到最具有描述性和明显的特征,相对于传统计算机视觉而言减少了工作量,精确度也有所提升。
90.其中上述手势识别模型的训练过程,可以是先获取大量的待识别的手势图像作为训练样本,并由人工对图像中的手势进行标注,如要区分不同的类别,可以给予不同的标签进行区分;
91.然后,将训练样本输入模型,由模型对训练样本中的手势进行预测;根据预测值和训练样本的标注值计算其误差;再计算误差值相对于卷积参数的梯度,对模型参数进行调优;通过上述过程的迭代、调优,得到最终的基于卷积神经网络的手势识别模型。
92.在本公开可选实施例中,图1所使用手势识别模型也可以是使用图2所示训练方法之外的其他方法训练得到的,在此不做限定。
93.在本公开实施例中,损失函数可以包括四个部分,分别是坐标损失函数、目标损失函数、类别预测损失函数、及预测框和上述手势标注框交并比(英文:intersection over union iou,缩写iou)损失函数。
94.在本公开实施例中,坐标损失函数可分为两个部分,坐标中心误差和宽高的误差。其中,坐标中心误差可以使用均方误差,宽高的误差计算时取的是平方根,原因是对不同大小的边界框预测中,相对于大边界框,小边界框预测偏一点更不能接受,而差方和误差函数中对同样的偏移损失值是一样的。为了缓解这个问题,本公开实施例将预测框的宽和高取平方根代替原来的宽和高。
95.在本公开实施例中,目标损失函数采用二分类交叉熵函数,这可以解决使用均方误差在训练阶段产生的梯度消失的问题。
96.当训练样本中不含有手势时,该置信度的标签为0,若含有手势时,该置信度的标签为预测框与手势标注框的iou数值。同时设置一个控制函数,在包含手势的格点处,该值为1,若格点不含有手势,该值为0。也就是说只对那些有真实手势所属的格点进行损失计算,若该格点不包含手势则不进行此项损失计算。与上面的控制函数相反,在本控制函数中,在不含手势的格点处,该值为1,若格点含有手势,该值为0。也就是只对那些没有真实手势所属的格点进行损失计算,若该格点包含手势则不进行此项损失计算。
97.在本公开实施例中,类别损失函数采用交叉熵损失函数,它表征两个概率分布之间的距离。预测框对应的类别位置,该标签值为1,其余位置为0,与分类网格相同。同时设置一个控制函数,在标签中包含目标的格点处,设置为1,若格点不含有手势,该值为0。也就是只对那些有真实目标所属的格点进行类别损失计算,若该格点不包含目标则不进行此项损失计算。在交叉熵损失函数之前,加入了softmax函数,这个函数会让输入的节点中大的更大,小的更小,并且可以确保最终所有节点的输出的总和为1,这样一来只要对应真实值为1的那个节点输出足够靠近1,其他的节点自然输出就会趋近于0。
98.在本公开实施例中,使用iou损失函数,通过计算预测框和手势标注框的重合度来减少损失,iou损失函数的值越小,代表预测框和手势标注框的重合程度越高,预测效果越好。
99.其中,iou是交并比的意思,即预测框和手势标注框的面积的交集除以预测框和手势标注框的面积的并集
100.需要考虑的是,上述目标损失函数中,坐标中心误差使用均方误差表征,均方差损失函数中预测框中心点坐标和宽高等信息是独立的变量,但是实际上它们之间是有关系的。从直观上来说,框的中心点和宽高的确存在着一定的关系,所以解决方法是增加iou损失函数。
101.本公开可选实施例具体提出了ciou损失函数,ciou的全称为complete iou,它在diou(distance-iou)的基础上,还能同时考虑两个矩形框的长宽比,也就是形状的相似性。ciou将预测框与手势标注框之间的中心距离、重叠率、尺度以及惩罚因子都考虑进去,惩罚因子把预测框长宽比和手势标注框的长宽比考虑进去,不会像iou和giou(generalized intersection over union)一样出现训练过程中发散等问题,使得目标框回归变得更加稳定。
102.本公开实施例还提供了一种张贴动作手势识别装置,用于实现张贴动作手势识别方法,图3为本发明一实施例的张贴动作手势识别装置的结构示意图,该装置包括:
103.获取模块310,获取待识别图像及基于卷积神经网络的手势识别模型,卷积神经网络包括至少一层卷积层;
104.手势识别模块320,利用至少一层卷积层从待识别图像中提取图像特征,并根据图像特征在待识别图像中确定至少一个对象候选框及候选对象的类别,并根据候选对象的类别在对象候选框中筛选包含目标对象的目标对象框,目标对象作为张贴动作手势。
105.在可选实施例中,卷积神经网络可以包括至少两层卷积层,则手势识别模块320具体用于:
106.根据至少两层卷积层输出的图像特征,在待识别图像中识别出对象候选框集合及各候选对象的类别。
107.在可选实施例中,手势识别模块320具体用于:
108.从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框,参考对象候选框的置信度高于保留的对象候选框中的剩余候选框;
109.根据剩余候选框与参考对象候选框之间的位置关系,获得剩余候选框与参考候选框之间的重叠面积,并在重叠面积超过目标阈值的情况下,在待识别图像中将剩余候选框删除,得到目标对象框。
110.在可选实施例中,手势识别模块320具体用于:
111.在重叠面积未超过目标阈值的情况下,保留剩余候选框,得到剩余候选框集合;
112.将保留的剩余候选框集合作为保留的对象候选框,返回从图像特征中获得保留的对象候选框的置信度,并根据置信度在保留的对象候选框中选择参考候选框。
113.本公开实施例还提供了一种手势识别模型训练装置,用于实现手势识别模型训练方法,图4为本发明一实施例的手势识别模型训练装置的结构示意图,该装置包括:
114.获取模块410,获取手势图像样本,手势图像样本中标注有手势标注框;
115.图像提取模块420,将手势图像样本输入基于卷积神经网络的手势识别模型,利用至少一层卷积层提取图像特征,并根据图像特征输出对手势的预测框;
116.模型训练模块430,根据预测框和手势标注框之间的损失函数调整手势识别模型的模型参数,直到手势识别模型收敛。
117.可选地,损失函数包括坐标损失函数、目标损失函数、类别预测损失函数、及预测框和手势标注框交并比损失函数。
118.本发明实施例还提供一种电子设备,包括处理器;存储器,其中存储有处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行的张贴动作手势识别方法、或手势识别模型训练方法的步骤。
119.所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
120.下面参照图5来描述根据本发明的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
121.如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:至少一个处理单元510、至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540等。
122.其中,存储单元存储有程序代码,程序代码可以被处理单元510执行,使得处理单元510执行本说明书上述张贴动作手势识别方法、或手势识别模型训练方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元510可以执行如图1或图2中所示的步骤。
123.存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)521和/或高速缓存存储单元522,还可以进一步包括只读存储单元(rom)523。
124.存储单元520还可以包括具有一组(至少一个)程序模块525的程序/实用工具524,这样的程序模块525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
125.总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
126.电子设备500也可以与一个或多个外部设备570(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得
该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器560可以通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
127.电子设备中,存储器中的程序被处理器执行时实现的张贴动作手势识别方法、或手势识别模型训练方法的步骤,因此,设备也可以获得上述张贴动作手势识别方法、或手势识别模型训练方法的技术效果。
128.本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被处理器执行时实现的张贴动作手势识别方法、或手势识别模型训练方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上执行时,程序代码用于使终端设备执行本说明书上述张贴动作手势识别方法、或手势识别模型训练方法部分中描述的根据本发明各种示例性实施方式的步骤。
129.参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上执行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
130.程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
131.计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
132.可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商
来通过因特网连接)。
133.计算机存储介质中的程序被处理器执行时实现的张贴动作手势识别方法、或手势识别模型训练方法的步骤,因此,计算机存储介质也可以获得上述张贴动作手势识别方法、或手势识别模型训练方法的技术效果。
134.以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献