技术特征:
1.一种姿态检测方法,其特征在于,包括:
通过至少两个语音采集设备采集语音通话过程中的语音信号;
获取所述语音信号对应的姿态能量信息;
根据所述姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。
2.根据权利要求1所述的方法,其特征在于,获取所述语音信号对应的姿态能量信息,包括:
获取所述语音信号对应各预定姿态的投影能量。
3.根据权利要求2所述的方法,其特征在于,获取所述语音信号对应各预定姿态的投影能量,包括:
获取所述语音信号的各频点对应各预定姿态的投影能量;
获取各频点分别对应的权重值;
根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量,确定所述语音信号对应各预定姿态的投影能量。
4.根据权利要求3所述的方法,其特征在于,获取所述语音信号的各频点对应各预定姿态的投影能量,包括:
获取所述语音信号对应的特征向量,所述特征向量包含各频点对应的特征值;
将所述特征向量进行归一化处理,得到所述语音信号对应的归一化特征向量;
根据所述归一化特征向量和各预定姿态分别对应的特征矩阵,确定各频点分别对应各预定姿态的投影能量。
5.根据权利要求4所述的方法,其特征在于,获取所述语音信号对应的特征向量,包括:
获取与语音信号对应的至少两个频域信号;
对于每一频点,合并各频域信号在该频点处的特征值,得到所述语音信号的特征向量。
6.根据权利要求4所述的方法,其特征在于,将所述特征向量进行归一化处理之前,还包括:
根据预定的补偿参数,对所述特征向量进行频率响应补偿处理,得到幅度校正后的特征向量。
7.根据权利要求4所述的方法,其特征在于,对于至少一个预定姿态,对应的特征矩阵是通过以下方式得到的:
分别确定样本声源与各个语音采集设备之间的距离;
根据样本声源与各个语音采集设备之间的距离,确定预定姿态对应的特征向量;
基于预定姿态对应的特征向量,确定预定姿态对应的特征矩阵。
8.根据权利要求3所述的方法,其特征在于,获取各频点分别对应的权重值,包括:
获取各频点对应的预定权重。
9.根据权利要求3所述的方法,其特征在于,获取各频点分别对应的权重值,包括:
根据各频点对应各预定姿态的投影能量和/或所述语音信号的能量信息,通过权重确定神经网络,确定各频点对应的权重。
10.根据权利要求9所述的方法,其特征在于,所述权重确定神经网络包括控制子网络和计算子网络;
根据各频点对应各预定姿态的投影能量和所述语音信号的能量信息,通过权重确定神经网络,确定各频点对应的权重,包括:
通过所述控制子网络,根据所述语音信号的能量信息,确定所述语音信号的信噪比表征值,根据所述信噪比表征值确定各频点的权重值是否为预定权重;
若不是,通过所述计算子网络,根据各频点对应各预定姿态的投影能量,确定各频点的权重值。
11.根据权利要求10所述的方法,其特征在于,所述控制子网络,经由级联的若干第一特征提取层对所述语音信号的能量信息进行特征提取,以及经由分类层根据提取的特征获取信噪比表征值;
所述计算子网络,经由级联的若干第二特征提取层对各频点对应各预定姿态的投影能量进行特征提取,以及经由线性回归层根据提取的特征获得各频点的权重。
12.根据权利要求11所述的方法,其特征在于,第二特征提取层将提取出的特征与所述控制子网络中相应的第一特征提取层输出的特征进行合并,输出合并后的特征。
13.根据权利要求3所述的方法,其特征在于,根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量,确定所述语音信号对应各预定姿态的投影能量,包括:
针对每种预定姿态,分别根据各频点对应的权重值,对各频点对应该预定姿态的投影能量进行加权处理;
针对每种预定姿态,分别将各频点对应于该预定姿态的加权处理后的投影能量进行累加,得到所述语音信号对应该预定姿态的投影能量。
14.根据权利要求1所述的方法,其特征在于,根据所述姿态能量信息,从各预定姿态中确定出所述用户在语音通话过程中的姿态,包括:
选择最大的姿态能量信息所对应的预定姿态,得到所述用户在语音通话过程中的姿态信息。
15.根据权利要求1所述的方法,其特征在于,还包括:
基于所述用户在语音通话过程中的姿态信息,对所述语音信号进行降噪处理,得到降噪后的语音信号。
16.一种姿态检测装置,其特征在于,包括:
语音采集模块,用于通过至少两个语音采集设备采集语音通话过程中的语音信号;
能量获取模块,用于获取所述语音信号对应的姿态能量信息;
姿态确定模块,用于根据所述姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。
17.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1-15任一项所述的姿态检测方法。
18.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-15任一项所述的姿态检测方法。
技术总结
本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质,其中方法包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,其中,在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。
技术研发人员:杨磊;王维钦;谭璐芬;王立众
受保护的技术使用者:北京三星通信技术研究有限公司;三星电子株式会社
技术研发日:2020.07.24
技术公布日:2021.08.20
本文用于企业家、创业者技术爱好者查询,结果仅供参考。