自动接听来电的方法、装置、设备及存储介质与流程

2022-07-31 05:45:46 来源：中国专利 TAG：

1.本发明涉及智能交互技术领域，尤其涉及一种自动接听来电的方法、装置、设备及计算机可读存储介质。

背景技术：

2.随着人工智能技术的发展，使用了人工智能技术的各种智能终端也在不断推陈出新，如各种智能电视、智能家具、智能手机等。相较于传统终端，智能终端在人机交互和控制方式上有着无可比拟的优势与便利性，例如，用户可以通过语音与智能终端进行交互或控制，或者是通过语音、手势等方式控制智能终端自动执行对应的指令。
3.目前，许多大屏智能终端也具有通话功能，相较于手机等小屏终端，大屏终端上的摄像头通常至少可以拍到所处场景中用户的上本身。基于此，许多大屏智能终端实现了基于特定手势识别的自动接听来电功能，通过识别用户是否做出特定手势以实现自动接听来电的功能，而无需用户手动触控接听来电。在实际应用中，由于光照、场景、个体变化等诸多复杂因素的影响，智能终端若是单纯识别用户的手势动作，往往准确率不高。因此，现有技术提出了基于识别用户上半身整体是否做出相应的接电话手势以进行电话接听。
4.然而，现有基于识别手势来接听电话的方法往往需要大量的原始样本数据进行深度学习训练，但是出于成本考虑，现实生活中可供深度学习训练的原始样本数据通常有限，导致现有技术中智能终端识别特定手势时的准确率不高，从而存在智能终端在识别用户手势自动接听来电时，准确率不高的问题。

技术实现要素：

5.本发明的主要目的在于提供一种自动接听来电的方法、装置、设备及计算机可读存储介质，旨在实现准确识别用户接听电话的手势，从而自动接听来电。
6.为实现上述目的，本发明提供一种自动接听来电的方法，所述自动接听来电的方法包括以下步骤：
7.解析在检测到有来电接入时采集到的目标图像得到解析结果；
8.根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；
9.若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；
10.若判定存在所述预设手势，则自动接听来电。
11.可选地，所述解析在检测到有电话接入时采集到的目标图像得到解析结果的步骤，包括：
12.将所述目标图像分别发送至预设的人脸识别库以及手势识别库进行解析，以得到所述解析结果，其中，所述解析结果包括所述存在概率信息和所述坐标信息；
13.获取所述存在概率信息中所述人脸图像的第一存在概率信息及所述手势图像的
第二存在概率信息；
14.获取所述坐标信息中所述人脸图像的第一坐标信息及所述手势图像的第二坐标信息。
15.可选地，所述根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像的步骤，包括：
16.判断所述存在概率信息中的所述第一存在概率信息与所述第二存在概率信息是否同时大于预设概率值；
17.若所述第一存在概率信息与所述第二存在概率信息同时大于所述预设概率值，则判定所述目标图像中同时存在所述人脸图像和所述手势图像。
18.可选地，所述根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势的步骤，包括：
19.获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息；
20.判断所述坐标差值信息是否达到预设条件，并在判断到所述坐标差值信息达到所述预设条件时确定所述目标图像中存在预设手势。
21.可选地，所述获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息的步骤，包括：
22.获取所述第一坐标信息与所述第二坐标信息之间坐标中心点的距离差值；
23.获取所述第一坐标信息与所述第二坐标信息之间坐标点的高度差值及横轴差值；
24.将所述距离差值和所述高度差值以及所述横轴差值赋值为所述坐标差值信息。
25.可选地，所述判断所述坐标差值信息是否达到预设条件的步骤，包括：
26.判断所述距离差值是否在第一差值范围内，所述高度差值是否在第二差值范围内，以及，所述横轴差值是否在第三差值范围内；
27.若所述距离差值在所述第一差值范围内，所述高度差值在所述第二差值范围内，且，所述横轴差值在所述第三差值范围内，则判定所述坐标差值信息达到所述预设条件。
28.可选地，所述自动接听来电的方法应用于大屏终端，所述大屏终端配置有摄像装置，在所述解析在检测到有来电接入时采集到的目标图像得到解析结果的步骤之前，包括：
29.检测到有来电接入时，启动所述摄像装置以通过所述摄像装置采集所述目标图像。
30.此外，本发明还提供一种自动接听来电的装置，所述装置包括：
31.解析模块，用于解析在检测到有来电接入时采集到的目标图像得到解析结果；
32.判断模块，用于根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；
33.手势识别模块，用于若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；
34.接听模块，用于若判定存在所述预设手势，则自动接听来电。
35.可选地，所述解析模块还用于：
36.将所述目标图像分别发送至预设的人脸识别库以及手势识别库进行解析，以得到所述解析结果，其中，所述解析结果包括所述存在概率信息和所述坐标信息；
37.获取所述存在概率信息中所述人脸图像的第一存在概率信息及所述手势图像的第二存在概率信息；
38.获取所述坐标信息中所述人脸图像的第一坐标信息及所述手势图像的第二坐标信息。
39.可选地，所述判断模块还用于：
40.判断所述存在概率信息中的所述第一存在概率信息与所述第二存在概率信息是否同时大于预设概率值；
41.若所述第一存在概率信息与所述第二存在概率信息同时大于所述预设概率值，则判定所述目标图像中同时存在所述人脸图像和所述手势图像。
42.可选地，所述手势识别模块还用于：
43.获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息；
44.判断所述坐标差值信息是否达到预设条件，并在判断到所述坐标差值信息达到所述预设条件时确定所述目标图像中存在预设手势。
45.可选地，所述手势识别模块还用于：
46.获取所述第一坐标信息与所述第二坐标信息之间坐标中心点的距离差值；
47.获取所述第一坐标信息与所述第二坐标信息之间坐标点的高度差值及横轴差值；
48.将所述距离差值和所述高度差值以及所述横轴差值赋值为所述坐标差值信息。
49.可选地，所述判断模块还用于：
50.判断所述距离差值是否在第一差值范围内，所述高度差值是否在第二差值范围内，以及，所述横轴差值是否在第三差值范围内；
51.若所述距离差值在所述第一差值范围内，所述高度差值在所述第二差值范围内，且，所述横轴差值在所述第三差值范围内，则判定所述坐标差值信息达到所述预设条件。
52.可选地，所述装置还包括：
53.采集模块，用于检测到有来电接入时，启动所述摄像装置以通过所述摄像装置采集所述目标图像。
54.此外，本发明还提供一种自动接听来电的设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动接听来电的程序，所述自动接听来电的程序配置为实现如上述的自动接听来电的方法的步骤。
55.此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有自动接听来电的程序，所述自动接听来电的程序被处理器执行时实现如上述的自动接听来电的方法的步骤。
56.本发明通过解析在检测到有来电接入时采集到的目标图像得到解析结果；根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；若判定存在所述预设手势，则自动接听来电。
57.相较于现有的单纯识别用户手势或整体识别用户上半身的动作，来判断是否存在特定手势的方式，本发明通过解析目标图像，先判断目标图像中是否同时存在人脸图像和手势图像，当目标图像中同时存在人脸图像和手势图像时，再根据人脸图像与手势图像的
坐标信息进一步判断目标图像中是否存在预设手势的方法，改变了智能终端对特定手势的识别方式，由于现有的人脸识别技术已经较为成熟，准确率较高，故本方法有效提高了对特定手势识别的准确率，解决了现有技术中智能终端在识别用户手势自动接听来电时，准确率不高的问题，使得智能终端可以准确识别用户接听电话的手势，从而自动接听来电。
附图说明
58.图1为本发明方案涉及的硬件运行自动接听来电的设备的结构示意图；
59.图2为本发明一种自动接听来电的方法一实施例的流程示意图；
60.图3为本发明一种自动接听来电的方法一实施例涉及的应用流程示意图；
61.图4为本发明一种自动接听来电的装置的功能模块结构关系示意图。
62.本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
63.应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
64.应当理解，尽管在本文可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本文范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。本技术使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的，或意味着任一个或任何组合。
65.应该理解的是，虽然本技术实施例中的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
66.为了对发明的技术特征、目的和效果有更加清楚的理解，现对照附图说明本发明的具体实施方式。
67.参照图1，图1为本发明实施例方案涉及的自动接听来电的设备的结构示意图。本发明实施例的自动接听来电的设备可以是具有通话功能的大屏智能终端，例如，智能电视。
68.如图1所示，该自动接听来电的设备可以包括：处理器1001，例如中央处理器(central processing unit，cpu)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity，wi-fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory，ram)存储器，也可以是稳定的非易失性存储器(non-volatile memory，nvm)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
69.本领域技术人员可以理解，图1中示出的结构并不构成对自动接听来电的设备的
限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
70.如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及自动接听来电的程序。
71.在图1所示的自动接听来电设备中，网络接口1004主要用于与其他设备进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明自动接听来电设备中的处理器1001、存储器1005可以设置在自动接听来电设备中，自动接听来电设备通过处理器1001调用存储器1005中存储的自动接听来电的程序，并执行以下操作：
72.解析在检测到有来电接入时采集到的目标图像得到解析结果；
73.根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；
74.若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；
75.若判定存在所述预设手势，则自动接听来电。
76.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，还执行以下操作：
77.将所述目标图像分别发送至预设的人脸识别库以及手势识别库进行解析，以得到所述解析结果，其中，所述解析结果包括所述存在概率信息和所述坐标信息；
78.获取所述存在概率信息中所述人脸图像的第一存在概率信息及所述手势图像的第二存在概率信息；
79.获取所述坐标信息中所述人脸图像的第一坐标信息及所述手势图像的第二坐标信息。
80.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，还执行以下操作：
81.判断所述存在概率信息中的所述第一存在概率信息与所述第二存在概率信息是否同时大于预设概率值；
82.若所述第一存在概率信息与所述第二存在概率信息同时大于所述预设概率值，则判定所述目标图像中同时存在所述人脸图像和所述手势图像。
83.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，还执行以下操作：
84.获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息；
85.判断所述坐标差值信息是否达到预设条件，并在判断到所述坐标差值信息达到所述预设条件时确定所述目标图像中存在预设手势。
86.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，还执行以下操作：
87.获取所述第一坐标信息与所述第二坐标信息之间坐标中心点的距离差值；
88.获取所述第一坐标信息与所述第二坐标信息之间坐标点的高度差值及横轴差值；
89.将所述距离差值和所述高度差值以及所述横轴差值赋值为所述坐标差值信息。
90.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，
还执行以下操作：
91.判断所述距离差值是否在第一差值范围内，所述高度差值是否在第二差值范围内，以及，所述横轴差值是否在第三差值范围内；
92.若所述距离差值在所述第一差值范围内，所述高度差值在所述第二差值范围内，且，所述横轴差值在所述第三差值范围内，则判定所述坐标差值信息达到所述预设条件。
93.进一步地，处理器1001可以用于调用存储器1005中存储的自动接听来电的程序，还执行以下操作：
94.检测到有来电接入时，启动所述摄像装置以通过所述摄像装置采集所述目标图像。
95.随着人工智能技术的不断发展，ai(artificial intelligence，人工智能)图像识别等深度学习算法现在有很多开源的工程实现。在安卓平台通过引入开源工程ncnn(一个为手机端极致优化的高性能神经网络前向计算框架)算法库和学习工具，可以做到将摄像头采集的实时图片传入到ai库，能让识别库算出某个特定物体是否存在以及存在概率和位置。
96.因此，提出了一种基于特定手势识别的自动接听来电的方法，即智能终端在识别到用户做出接听电话的特定手势时，自动接听来电，而无需用户手动控制接听。但单纯的手势识别，受场景、光照等因素的影响较大，较难准确识别。此时，基于大屏智能终端可以通过摄像头采集到完整的用户上半身的图像，提出了一种获取用户上半身图像，以整体识别用户是否做出相应的接听电话的动作，从而判断是否自动接听来电的方法。但此种方式，由于深度学习的库在引入一个新的识别目标时，需要大量的原始目标图像导入，才能通过不断的训练将识别率和准确率提高。而实际应用中，做接听电话的目标图片基本上很难从其他渠道获取，而出于成本考虑，也很难通过自行找人找场景拍摄大量目标图片的方式获得原始目标图像。故此时可供深度学习的原始目标图像通常较为有限，因而现有技术中智能终端在识别用户手势自动接听来电时，准确率不高的问题。
97.为了解决上述问题，本发明提供了一种自动接听来电的方法，包括：解析在检测到有来电接入时采集到的目标图像得到解析结果；根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；若判定存在所述预设手势，则自动接听来电。
98.这种方法通过判断目标图像中是否同时存在人脸图像和手势图像，当同时存在时，进一步根据人脸和手势图像的坐标信息判断是否存在预设手势，从而判断是否自动接听电话。相较于现有技术中单纯识别手势的方法，增加了人脸识别，以及人脸与手势图像的坐标信息，即位置关系的识别条件。由于现有技术中，人脸识别的技术已经较为成熟，无需做其他成本投入，且准确率也非常高，因此，本发明的结合了人脸和手势识别的方法，能够在无需增加额外成本的同时，有效提高对特定手势的识别准确率，解决了现有技术中智能终端在识别用户手势自动接听来电时，准确率不高的问题。使得智能终端可以准确识别用户接听电话的手势，从而自动接听来电。
99.本发明实施例提供了一种自动接听来电的方法，参照图2，图2为本发明的一种自动接听来电的方法一实施例的流程示意图。
100.本实施例中，所述自动接听来电的方法包括：
101.步骤s10，解析在检测到有来电接入时采集到的目标图像得到解析结果。
102.在本实施例中，执行主体是具有通话功能的智能终端，如智能电视机。目标图像是指智能终端在检测到有来电接入时，采集的至少包含用户上半身影像的图像，用于识别用户是否做出接电话的手势，从而判断是否需要自动接听来电。
103.解析结果是指识别库所得出的人脸和手势图像是否存在，以及存在概率和位置的结果信息，包括目标图像中人脸图像和手势图像的存在概率信息和坐标信息。
104.具体地，例如，如图3所示的应用流程，将所述目标图像分别发送至预设的人脸识别库及手势识别库，获取所述人脸识别库和所述手势识别库的识别结果以做为所述解析结果。
105.可选地，步骤s10，解析在检测到有来电接入时采集到的目标图像得到解析结果之前，包括：
106.步骤s01，检测到有来电接入时，启动所述摄像装置以通过所述摄像装置采集所述目标图像。
107.在本实施例中，这种自动接听来电的方法应用于配置有摄像装置的大屏终端，大屏终端是指诸如智能电视机的屏幕较大的智能终端，相对于智能手机等通常为用户手持的小屏终端，大屏终端通常置于与用户具有一定的距离的位置，故而才能在检测到有来电接入时，采集到至少包含用户上半身影像的目标图像。
108.摄像装置是指用于采集目标图像的具有摄像功能的装置，例如，智能终端中的摄像头。如图3所示的应用流程，当智能终端检测到用户有来电接入时，即接收到通话请求时，可以自动启动摄像装置，打开摄像功能，从而通过摄像头采集当前时刻的外界场景图像，作为待识别的目标图像。
109.本实施例通过在检测到有来电接入时，通过摄像装置采集目标图像，即拍摄当前时刻外部场景的图像，以进一步判断此时用户是否做出接听电话的手势，从而判断是否需要自动接听来电。
110.步骤s20，根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像。
111.在本实施例中，在ai图像识别过程中，机器识别图像并不是一下子将一个复杂的图片完整识别出来，而是将一个完整的图片分割成许多个小部分，把每个小部分里具有的特征提取出来(也就是识别每个小部分)，再将这些小部分具有的特征汇总到一起，就可以完成机器识别图像的过程了。因此，在机器对图像识别完成后，会输出该图像中存在特定物体的存在概率信息和坐标信息，即解析结果。例如，在对图像进行人脸识别时，计算该图像中存在人脸的存在概率信息和人脸的坐标信息，所得到的人脸存在概率信息和位置信息即为解析结果。其中，坐标信息用于表示图像中存在的特定物体的位置信息，通常是一个坐标点的集合。存在概率信息用于表示图像中存在特定物体的概率值，通常概率值越大，则图像中存在特定物体的可能性也越大。
112.判断目标图像中是否同时存在人脸图像和手势图像，是指将目标图像分为两个点进行识别，一个是单纯识别目标图像中的手势，另一个则是单纯的识别目标图像中的人脸，在分别对目标图像中的人脸和手势进行识别得到解析结果后，根据解析结果中的存在概率信息判断目标图像中是否同时存在人脸图像和手势图像，其中手势图像是指表示需要自动
接听电话的手势图像。
113.需要说明的时，由于大屏终端的使用场景等因素的影响，所采集并识别到的人脸和手势图像可能是单个也可能存在多个，至少需要同时存在一个手势图像和一个人脸图像，才能判定目标图像中同时存在手势图像和人脸图像。
114.步骤s30，若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势。
115.在本实施例中，若是，则表示目标图像中同时存在人脸图像和手势图像。预设手势是指用于表示需要接听电话的手势。由于用户在做出接听电话的手势时，手部通常会位于脸部稍下方的位置，即人脸图像与手势图像的位置关系是相对固定的，也就是说手势图像需要位于人脸图像下方不远处。
116.因此，可以根据解析结果中的坐标信息，得到所存在的人脸图像与手势图像的位置关系，判断是否满足手势位于人脸下方不远处，从而进一步判断目标图像中是否存在表示接听来电的预设手势。
117.步骤s40，若判定存在所述预设手势，则自动接听来电。
118.在本实施例中，当解析结果中人脸和手势的坐标信息满足条件时，即识别出的人脸图像和手势图像满足手势位于人脸下方不远处的条件时，判定存在预设手势，此时则自动接听来电。
119.本实施例通过通过解析目标图像得到解析结果，并根据解析结果中的存在概率信息，先判断目标图像中是否同时存在人脸图像和手势图像，当目标图像中同时存在人脸图像和手势图像时，再根据解析结果中的坐标信息进一步判断目标图像中是否存在预设手势的方法，改变了智能终端对特定手势的识别方式，有效提高了特定手势的识别准确率，且由于无需获取大量用户做出接听电话动作的图片作为深度学习的原始样本数据，还实现了降低成本的技术效果。解决了现有技术中智能终端在识别用户手势自动接听来电时，准确率不高的问题，使得智能终端可以准确识别用户的手势，根据需求自动接听来电，无需用户手动控制接听，较为方便。
120.进一步地，在本发明自动接听来电的方法的另一实施例中，步骤s10，解析在检测到有电话接入时采集到的目标图像得到解析结果，包括：
121.步骤s11，将所述目标图像分别发送至预设的人脸识别库以及手势识别库进行解析，以得到所述解析结果，其中，所述解析结果包括所述存在概率信息和所述坐标信息。
122.在本实施例中，预设的人脸识别库是基于现有的人脸识别技术，已经训练好的较为准确和完整的解析库，无需再投入新的开发和学习，用于识别并解析目标图像中的人脸图像。预设的手势识别库是根据各种接听电话的纯手势图片进行深度学习，训练完成得到的解析库，用于识别并解析目标图像中的手势图像。
123.如图3所示的应用流程，将同一目标图像分别发送至人脸识别库及手势识别库后，两个识别库分别对图像进行识别并解析，并输出相应的解析结果。解析结果包括目标图像中存在人脸或手势图像的存在概率信息和坐标信息。
124.需要说明的是，在检测到有来电接入时，通常会采集到许多帧的目标图像，此时所得到的解析结果需要是同一帧图像上存在人脸或手势的存在概率信息和坐标信息。
125.步骤s12，获取所述存在概率信息中所述人脸图像的第一存在概率信息及所述手
势图像的第二存在概率信息。
126.在本实施例中，可以基于解析库输出的解析结果中的存在概率信息，分别获得同一帧目标图像中的存在人脸图像的第一存在概率信息和手势图像的第二存在概率信息。其中，由于同一帧目标图像中，可能存在多个人脸或手势图像，故第一和第二存在概率信息中，可以包含一个或多个人脸或手势图像的存在概率信息，例如，第一存在概率信息中可能包含：人脸1的存在概率：50％、人脸2的存在概率：65％、人脸3的存在概率：80％；第二存在概率信息中可能包含：手势1的存在概率：20％、手势2的存在概率60％。
127.步骤s13，获取所述坐标信息中所述人脸图像的第一坐标信息及所述手势图像的第二坐标信息。
128.在本实施例中，可以基于解析结果中的坐标信息，分别获得同一帧目标图像中存在人脸图像的第一坐标信息和手势图像的第二坐标信息。第一、第二坐标信息是用于表示人脸、手势图像在目标图像中的位置的坐标点集信息。由于机器在识别图像时，通常是根据一个个矩形区域进行识别的，故最后输出的坐标信息，通常是至少包括矩形图像区域四个顶点坐标及中心点坐标的坐标点集。
129.本实施例通过将同一目标图像，分别发送至人脸识别库和手势识别库，从而获取解析结果，即目标图像中存在人脸图像和手势图像的存在概率信息及位置信息，以进一步判断目标图像中是否存在预设手势。
130.进一步地，在本发明自动接听来电的方法的另一实施例中，步骤s20，根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像，包括：
131.步骤s21，判断所述存在概率信息中的所述第一存在概率信息与所述第二存在概率信息是否同时大于预设概率值。
132.在本实施例中，预设概率值是判定存在人脸或手势图像所需达到的最低概率值，可以根据实际需求自行定义。此外，预设的人脸和手势图像的存在概率信息的评判标准可以不一致，即第一和第二存在概率信息的预设概率值可以不一致。例如，由于人脸识别较为准确，可将人脸图像的预设概率值设置为90％；而将手势图像的预设概率值设置为80％，然后分别进行对比以判断人脸图像和手势图像是否同时存在。
133.具体的，例如，判断所述第一存在概率信息是否大于第一预设概率值，所述第二存在概率信息是否大于第二预设概率值。
134.步骤s22，若所述第一存在概率信息与所述第二存在概率信息同时大于所述预设概率值，则判定所述目标图像中同时存在人脸图像和手势图像。
135.在本实施例中，当第一、第二存在概率信息均大于预设概率值时，则说明同一帧目标图像中同时存在人脸图像和手势图像。由于第一、第二存在概率信息中均可以包含多个人脸或手势图像的存在概率信息，故最少只需其中一个人脸图像的存在概率值和一个手势图像存在概率值大于预设概率值，即可判定目标图像中同时存在人脸图像和手势图像。
136.此外，如图3所示的应用流程，若第一存在概率信息中的概率值均小于预设概率值和/或第二存在概率信息中的概率值均小于预设概率值，则判定目标图像中未同时存在人脸图像和手势图像，则丢弃该目标图像，继续通过摄像装置采集下一帧目标图像，并重新开始执行上述步骤s10及后续步骤。
137.本实施例通过根据存在人脸图像的第一存在概率信息和存在手势图像的第二存
在概率信息，判断目标图像中是否同时存在人脸图像和手势图像，若同时存在，则继续执行步骤s30及后续步骤，若未同时存在，则丢弃该目标图像，继续执行步骤s10及后续步骤。
138.进一步地，在本发明自动接听来电的方法的另一实施例中，步骤s30，根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势，包括：
139.步骤s31，获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息。
140.在本实施例中，坐标差值信息包括第一和第二坐标信息之间坐标中心点的距离差值、坐标点的高度差值及横轴差值，用于判断人脸图像和手势图像的位置关系是否满足预设条件。
141.步骤s32，判断所述坐标差值信息是否达到预设条件，并在判断到所述坐标差值信息达到所述预设条件时确定所述目标图像中存在预设手势。
142.在本实施例中，预设条件为坐标差值信息中的距离差值、高度差值、横轴差值均需在一定的差值范围内，也就是说，图标图像中的人脸图像和手势图像的距离与位置关系需要满足一定条件，具体地，手势图像需要位于人脸图像下方不远的位置。
143.坐标差值信息达到预设条件，即人脸图像和手势图像的位置关系满足条件，则此时可以确定目标图像中存在预设手势，即此时用户需要自动接听电话。
144.可选地，步骤s31，获取所述坐标信息中所述第一坐标信息和所述第二坐标信息之间坐标点的坐标差值信息，包括：
145.步骤s311，获取所述第一坐标信息与所述第二坐标信息之间坐标中心点的距离差值。
146.在本实施例中，由于目标图像中可能存在多个人脸图像和手势图像，故第一、第二坐标信息中，可能同时存在多个人脸或手势图像的坐标点集。因此，第一坐标信息与第二坐标信息中均可能包含一个或多个中心点坐标。此时，分别计算第一坐标信息中的各中心点坐标与第二坐标信息中的各中心点坐标的距离差值即可。
147.步骤s312，获取所述第一坐标信息与所述第二坐标信息之间坐标点的高度差值及横轴差值。
148.在本实施例中，高度差值，也就是识别出的各人脸图像和各手势图像的上下距离。可以通过获取第一坐标信息中各坐标点集中y轴的最大值，即识别出的各人脸图像的最高处；再获取第二坐标信息中各坐标点集中y轴的最大值，即识别出的各手势图像的最高处；再计算出第一、第二坐标信息中y轴最大值的差值，即可得到高度差值。
149.横轴差值，也就是识别出的各人脸图像和各手势图像的左右距离。可以通过获取第一坐标信息中各坐标点集中x轴的最小值，即识别出的各人脸图像的最左端；再获取第二坐标信息中各坐标点集中x轴的最小值，即识别出的各手势图像的最左端；再计算出第一、第二坐标信息中x轴最小值的差值，即可得到横轴差值。
150.步骤s313，将所述距离差值和所述高度差值以及所述横轴差值赋值为所述坐标差值信息。
151.在本实施例中，将第一和第二坐标信息中各坐标点集的中心点距离差值、高度差值和横轴差值做为坐标差值信息，即将识别出的各人脸图像和手势图像的中心点距离、上下距离和左右距离做为坐标差值信息，从而可以得到各人脸图像和手势图像的位置关系，
进而通过判断位置关系是否满足预设条件来判断目标图像中是否存在预设手势。
152.本实施例通过分别获取第一、第二坐标信息中坐标点的距离差值、高度差值和横轴差值以做为坐标差值信息，即通过获取各人脸图像和手势图像的中心点距离、上下距离和左右距离，判断人脸图像和手势图像的位置关系是否满足预设条件，进而判断目标图像中是否存在预设手势。
153.可选地，步骤s32，判断所述坐标差值信息是否达到预设条件，包括：
154.步骤s321，判断所述距离差值是否在第一差值范围内，所述高度差值是否在第二差值范围内，以及，所述横轴差值是否在第三差值范围内。
155.在本实施例中，第一差值范围，即为人脸和手势图像的中心点距离的范围，不能太近也不能太远，具体数值可以自行定义，例如，可以是(10px(pixel，像素)～30px)。
156.第二差值范围，即为人脸和手势图像的上下距离的范围，手势图像需要位于人脸图像下方不远的位置，具体数值可以自行定义。例如，可以是(-15px到-30px)，需要说明的是，由于手势需要位于人脸下方，若预设的差值范围为负，则此时的高度差值需要用手势图像的最大y值减去人脸图像的最大y值。
157.第三差值范围，即为人脸和手势图像的左右距离的范围，具体数值可以自行定义。由于手势图像可以位于人脸图像的左右两侧，故此时的第三差值范围可以有两个，例如，左边(10px到20px)，右边(-10px到-20px)。
158.步骤s322，若所述距离差值在所述第一差值范围内，所述高度差值在所述第二差值范围内，且，所述横轴差值在所述第三差值范围内，则判定所述坐标差值信息达到所述预设条件。
159.在本实施例中，距离差值在第一差值范围内，即人脸图像和手势图像的中心点距离满足条件；高度差值在第二差值范围内，即人脸图像和手势图像的上下距离满足手势在人脸下方不远处的条件；横轴差值在第三差值范围内，即人脸图像和手势图像的左右距离满足条件。上述三个条件，需要同时满足，才能判定差值信息达到预设条件，即人脸图像和手势图像的位置关系满足预设条件。
160.本实施例通过分别判断距离差值、高度差值和横轴差值是否在各差值范围内，只有当前述条件全都满足时，才能判定坐标差值信息达到预设条件，进而判定存在预设手势，有效地提高了对特定手势识别的准确率。
161.进一步地，本发明实施例还提供一种自动接听来电的装置，如图4所示，本发明的自动接听来电的装置包括：
162.解析模块10，用于解析在检测到有来电接入时采集到的目标图像得到解析结果；
163.判断模块20，用于根据所述解析结果中的存在概率信息判断所述目标图像中是否同时存在人脸图像和手势图像；
164.手势识别模块30，用于若是，则根据所述解析结果中的坐标信息判断所述目标图像中是否存在预设手势；
165.接听模块40，用于若判定存在所述预设手势，则自动接听来电。
166.优选地，所述自动接听来电的装置还包括：
167.采集模块，用于检测到有来电接入时，启动所述摄像装置以通过所述摄像装置采集所述目标图像。
168.上述本发明自动接听来电的装置的各个功能模块在运行时所实现的步骤，可参照上述本发明用于自动接听来电的方法的各个实施例，此处不再赘述。
169.进一步地，本发明实施例还提供一种自动接听来电的设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的自动接听来电的程序，所述自动接听来电的程序配置为实现如上述实施例提供的用于自动接听来电的方法的步骤，具体实施步骤可参照上述实施例，此处不再过多赘述。
170.进一步地，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有自动接听来电的程序，所述自动接听来电的程序被处理器执行时实现如上述实施例提供的自动接听来电的方法的步骤，具体实施步骤可参照上述实施例，此处不再过多赘述。
171.本发明实施例所提供的装置、设备和计算机可读存储介质，用于实现上述实施例提供的自动接听来电的方法，解决了现有技术中智能终端在识别用户手势自动接听来电时，准确率不高的问题，与现有技术相比，本发明实施例所提供的装置、设备和计算机可读存储介质的有益效果与上述实施例的自动接听来电的方法的有益效果相同，在此不做赘述。
172.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
173.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。
174.以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音频设备密封性的检测方法及电子设备和存储介质与流程

自动接听来电的方法、装置、设备及存储介质与流程

相关文献

最热文献