农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

基于语音采集的通讯方法、装置及系统与流程

2021-08-31 17:44:00 来源：中国专利 TAG：语音通讯采集装置方法

本申请涉及语音通讯技术领域，具体而言，涉及一种基于语音采集的通讯方法、装置及系统。

背景技术：

经发明人研究发现，在现有的无人机语音通讯技术中，麦克风采集实时喊话声音数据之后，直接将声音数据传输到无人机上面通过机载喇叭播放，语音传输距离短，容易受到干扰，从而存在着通讯稳定性低的问题。

技术实现要素：

有鉴于此，本申请的目的在于提供一种基于语音采集的通讯方法、装置及系统，以改善现有技术中存在的问题。

为实现上述目的，本申请实施例采用如下技术方案：

第一方面，本发明提供一种基于语音采集的通讯方法，所述方法应用于语音采集端设备，包括：

确认无人机的第一图传模块是否处于空闲状态；

若是，则将已编码的语音数据通过所述第一图传模块发送给无人机。

在可选的实施方式中，在所述确认无人机的第一图传模块是否处于空闲状态之前，还包括：

根据预设采集频率采集语音数据；

对所述语音数据进行降噪处理；

将经降噪处理的语音数据进行压缩编码，获得所述已编码的语音数据。

在可选的实施方式中，所述对所述语音数据进行降噪处理的步骤，包括：

获取所述语音数据中连续n个语音数据的音量值，其中，1≤m≤n；

将目标音量值作为所述连续n个语音数据中的第m个语音数据的音量值，得到处理后的语音数据，其中，所述目标音量值为所述连续n个语音数据中第m个语音数据起至少一个语音数据音量值之和的均值；

根据人声频率范围对所述处理后的语音数据进行筛选，保留与所述人声频率范围匹配的语音数据；

将所述与所述人声频率范围匹配的语音数据作为所述经降噪处理的语音数据。

在可选的实施方式中，所述将已编码的语音数据通过所述第一图传模块发送给无人机的步骤，包括：

对所述已编码的语音数据进行传输处理，获得至少一个具有识别信息的语音数据包，将所述语音数据包通过所述第一图传模块发送给所述无人机；

其中，所述识别信息包含：标识头信息、id信息及数据包长度，所述标识头信息用于表征对应语音数据包为有效数据包，所述id信息用于表征对应语音数据包在全部语音数据包中的位置。

第二方面，本发明提供一种基于语音采集的通讯方法，所述方法应用于无人机，包括：

通过第二图传模块接收语音采集端设备发送的语音数据；

对所述语音数据进行解码，获得脉冲编码调制语音数据。

在可选的实施方式中，所述语音数据为至少一个语音数据包，所述通过第二图传模块接收语音采集端设备发送的语音数据的步骤，包括：

对所述语音数据包的识别信息进行解析，判断所述语音数据包是否具有标识头信息；

若是，则将每个具有标识头信息的语音数据包作为有效语音数据包；

根据每个所述有效语音数据包的id信息，对全部所述有效语音数据包进行排序；

将排序完整的有效语音数据包作为所述语音数据。

在可选的实施方式中，在所述将排序完整的有效语音数据包作为所述语音数据的步骤之前，还包括：

判断全部所述有效语音数据包中是否存在id信息不连续的有效语音数据包；

若存在，则确定与丢失id信息相邻的两个id信息的有效语音数据包；

根据所述相邻的两个id信息的有效语音数据包获得预测系数信息；

根据所述预测系数信息还原所述丢失id信息对应的语音数据包；

将全部所述有效语音数据包与所述丢失id信息对应的语音数据包，作为所述排序完整的有效语音数据包。

在可选的实施方式中，在所述对所述语音数据进行解码，获得脉冲编码调制语音数据的步骤之后，所述方法还包括：

对所述脉冲编码调制语音数据进行放大，获得待播放语音数据。

在可选的实施方式中，所述对所述脉冲编码调制语音数据进行放大，获得待播放语音数据的步骤，包括：

对所述脉冲编码调制语音数据基于放大参数进行放大，其中，被放大的脉冲编码调制语音数据的音量值位于音量阈值范围内；

将所述被放大的脉冲编码调制语音数据作为所述待播放语音数据。

第三方面，本发明提供一种基于语音采集的第一通讯装置，所述第一通讯装置应用于语音采集端设备，包括：

状态确认模块，用于确认无人机的第一图传模块是否处于空闲状态；

数据发送模块，用于在无人机的第一图传模块处于空闲状态时，将已编码的语音数据通过所述第一图传模块发送给无人机。

第四方面，本发明提供一种基于语音采集的第二通讯装置，所述第二通讯装置应用于无人机，包括：

数据接收模块，用于通过第二图传模块接收语音采集端设备发送的语音数据；

数据解码模块，用于对所述语音数据进行解码，获得脉冲编码调制语音数据。

第五方面，本发明提供一种基于语音采集的通讯系统，包括通信连接的无人机和语音采集端设备，所述语音采集端设备用于执行前述实施方式任意一项所述的方法，所述无人机用于执行前述实施方式任意一项所述的方法。

第六方面，本发明提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前述实施方式任一项所述的通讯方法。

第七方面，本发明提供一种存储介质，所述存储介质包括计算机程序，所述计算机程序运行时控制所述存储介质所在电子设备执行前述实施方式任一项所述的通讯方法。

本申请实施例提供的基于语音采集的通讯方法、装置及系统，通过在无人机的第一图传模块处于空闲状态时，将已编码的语音数据通过第一图传模块发送给无人机，实现了语音数据编码之后再发送，避免了现有技术中采集实时声音数据之后，直接将声音数据传输到无人机进行播放，所导致的语音传输距离短，容易受到干扰，通讯稳定性低的问题。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的基于语音采集的通讯系统的结构框图。

图2示出了本申请实施例提供的电子设备的结构框图。

图3为本申请实施例提供的基于语音采集的通讯方法的流程示意图。

图4为本申请实施例提供的另一通讯方法的流程示意图。

图5为本申请实施例提供的另一通讯方法的流程示意图。

图6为本申请实施例提供的另一通讯方法的流程示意图。

图7为本申请实施例提供的另一通讯方法的流程示意图。

图8为本申请实施例提供的另一通讯方法的流程示意图。

图9为本申请实施例提供的基于语音采集的第一通讯装置的结构框图。

图10为本申请实施例提供的基于语音采集的第二通讯装置的结构框图。

图标：10-基于语音采集的通讯系统；100-语音采集端设备；110-第一存储器；120-第一处理器；130-通信模块；200-无人机；900-第一通讯装置；910-状态确认模块；920-数据发送模块；1000-第二通讯装置；1010-数据接收模块；1020-数据解码模块。

具体实施方式

现有技术中实现无人机喊话功能的技术方案主要有两种：1：无人机播放预先设置的几种警报声音，操作人员可以手动选择播放哪种声音。2：实时喊话，麦克风采集声音传输到无人机上面通过机载喇叭进行播放。

然而，技术方案一中的喊话方式虽然音质清晰，音频文件不占用数据传输带宽，但是内容固定，非常不灵活，技术方案二中实时喊话语音传输距离短，容易受到干扰，音量小。

为了改善本申请所提出的上述至少一种技术问题，本申请实施例提供一种基于语音采集的通讯方法、装置及系统，下面通过可能的实现方式对本申请的技术方案进行说明。

针对以上方案所存在的缺陷，均是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案，都应该是发明人在发明过程中做出的贡献。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

需要说明的是，在不冲突的情况下，本申请的实施例中的特征可以相互结合。

结合图1，本申请实施例提供了一种基于语音采集的通讯系统10，通讯系统可以包括语音采集端设备100和无人机200，语音采集端设备100可以在无人机200的图传模块处于空闲状态时，将已编码的语音数据通过图传模块发送给无人机200，无人机200可以对语音数据进行解析，获得脉冲编码调制语音数据，对脉冲编码调制语音数据进行放大，获得待播放语音数据。

其中，语音采集端设备100可以是无人机200的一部分，也可以为无人机200的控制终端，具体可以为遥控器、智能手机、平板电脑、膝上型电脑、地面站、穿戴式设备(手表、手环)中的任意一种或多种。

无人机200可以是旋翼型飞行器，例如双旋翼飞行器、四旋翼飞行器、六旋翼飞行器、八旋翼飞行器，也可以是固定翼飞行器。无人机200可以包括动力系统，动力系统用于为飞行器提供飞行动力，其中，动力系统可以包括螺旋桨、电机、电子调速器中的任意一种或多种，无人机200还可以包括云台以及摄像装置，摄像装置通过云台搭载于无人机200的主体上。摄像装置用于在无人机200的飞行过程中进行图像或视频拍摄，包括但不限于多光谱成像仪、高光谱成像仪、可见光相机及红外相机等，云台为多轴传动及增稳系统，云台电机通过调整转动轴的转动角度来对成像设备的拍摄角度进行补偿，并通过设置适当的缓冲机构来防止或减小成像设备的抖动。

无人机200还可以包括图传模块，图传模块将处于飞行状态的无人机200所采集的画面和语音等数据流实时稳定的发射给地面无线图传遥控接收设备。整个图传系统的工作过程大致如下(以数字图传为例)：无人机200上挂载的视频拍摄装置将采集的视频信号传输到安装在无人机200上的图传模块，然后图传模块通过2.4ghz无线信号传送到地面的接收设备。

可选地，图传系统的具体构成不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，图传系统可以包括作为ap的无线中继，无人机200和接收设备作为两个终端连接到无线中继ap上，无人机200、接收设备分别与无线中继建立socket连接，无线中继需要布置数据转发app，用于转发视频流。

又例如，在另一种可以替代的示例中，无人机200可以作为ap，无线中继可以包括station ap模式。在无线中继位于station模式时，无线中继与无人机200连接获得独立ip。在无线中继位于ap模式时，无线中继作为ap与接收设备连接，为接收设备分配ip。其中，无人机200的ssid与无线中继的ssid不相同，无线中继可以采用nat 路由配置以转发数据流，建立无人机200与接收设备的数据通路，接收设备分别与无人机200、无线中继建立socket连接。

又例如，在另一种可以替代的示例中，无人机200可以将混合音视频实时数据发往云端。其中，无人机200的图传模块编码h.264数据，并通过rtp/rtsp协议将数据发送至云端。接收设备接收视频数据流(h.264)，在本地解码播放。接收设备可以采集本地音频，并将编码后的音频发送到图传模块，图传模块将编码后的音频推送云端。

又例如，在另一种可以替代的示例中，接收设备可以将混合音视频实时数据发往云端。其中，无人机200的图传模块编码h.264数据，并通过rtp/rtsp协议将数据发送至接收设备，接收设备接收视频数据流(h.264)。接收设备还可以采集本地音频，与接收的视频流进行融合，通过rtmp将音视频流推送到云端。

请参照图2，是本申请实施例提供的一种语音采集端设备100的方框示意图，本实施例中的语音采集端设备100可以为能够进行数据交互、处理的服务器、处理设备、处理平台等。语音采集端设备100包括第一存储器110、第一处理器120及通信模块130。第一存储器110、第一处理器120以及通信模块130各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。

其中，第一存储器110用于存储程序或者数据。第一存储器110可以是，但不限于，随机存取存储器(randomaccessmemory，ram)，只读存储器(readonlymemory，rom)，可编程只读存储器(programmableread-onlymemory，prom)，可擦除只读存储器(erasableprogrammableread-onlymemory，eprom)，电可擦除只读存储器(electricerasableprogrammableread-onlymemory，eeprom)等。

第一处理器120用于读/写第一存储器110中存储的数据或程序，并执行相应地功能。

通信模块130用于通过网络建立语音采集端设备100与其它通信终端之间的通信连接，并用于通过网络收发数据。

应当理解的是，图2所示的结构仅为语音采集端设备100的结构示意图，语音采集端设备100还可包括比图2中所示更多或者更少的组件，或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。

请结合参阅图3，为本申请实施例提供的一种基于语音采集的通讯方法的流程示意图，可以由图2语音采集端设备100执行，例如可以由语音采集端设备100中的处理器执行。应当理解，在其他实施例中，本实施例的通讯方法中的部分步骤的顺序可以根据实际需要相互交换，或者其中的部分步骤也可以省略或删除。下面对图3所示的通讯方法的流程进行详细描述。

步骤s310，确认无人机200的第一图传模块是否处于空闲状态。

在本申请实施例中，当无人机200的第一图传模块处于空闲状态时，执行步骤s320；当无人机200的第一图传模块不处于空闲状态时，可以返回等待信号。

步骤s320，将已编码的语音数据通过第一图传模块发送给无人机200。

上述方法通过在无人机的第一图传模块处于空闲状态时，将已编码的语音数据通过第一图传模块发送给无人机，实现了语音数据编码之后再发送，避免了现有技术中采集实时声音数据之后，直接将声音数据传输到无人机进行播放，所导致的语音传输距离短，容易受到干扰，通讯稳定性低的问题。

在步骤s310之前，需要说明的是，本申请实施例提供的通讯方法还可以包括得到已编码的语音数据的步骤。因此，在图3的基础上，图4为本申请实施例提供的另一种通讯方法的流程示意图，参见图4，通讯方法还可以包括：

步骤s330，根据预设采集频率采集语音数据。

步骤s340，对语音数据进行降噪处理。

步骤s350，将经降噪处理的语音数据进行压缩编码，获得已编码的语音数据。

对于步骤s330，需要说明的是，预设采集频率的具体数值不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，预设采集频率可以为24000hz。也就是说，对语音进行24000hz采样率的高频采集，既能保证采样的分辨率高，又能避免更高的数据量影响数据传输。

对于步骤s340，需要说明的是，进行降噪处理的具体方式不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，步骤s340可以包括中位值平均降噪和限定人声频率范围的步骤。因此，在图4的基础上，图5为本申请实施例提供的另一种通讯方法的流程示意图，参见图5，步骤s340可以包括：

步骤s341，获取语音数据中连续n个语音数据的音量值。

其中，1≤m≤n。

步骤s342，将目标音量值作为连续n个语音数据中的第m个语音数据的音量值，得到处理后的语音数据。

其中，目标音量值为连续n个语音数据中第m个语音数据起至少一个语音数据音量值之和的均值。

步骤s343，根据人声频率范围对处理后的语音数据进行筛选，保留与人声频率范围匹配的语音数据。

步骤s344，将与人声频率范围匹配的语音数据作为经降噪处理的语音数据。

对于步骤s342，需要说明的是，n的具体数值不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，n可以为6，可以获取语音数据中连续6个语音数据的音量值。

在计算目标音量值之前需要设置每次计算均值的语音数据的数量，在本申请实施例可以将此数量设置为5，也就是说，可以将连续5个语音数据音量值之和的均值作为目标音量值。然而，可能会存在第m个语音数据到第n个语音数据的数量不足5的情况。因此，首先需要判断m 4的值是否小于n，在小于或等于时将第m个语音数据到第m 4个语音数据音量值之和的均值作为目标音量值，在大于时将第m个语音数据到第n个语音数据音量值之和的均值作为目标音量值。

例如，在m的值为1时，m 4的值小于6，可以将第1个语音数据到第5个语音数据音量值之和的均值作为第1个语音数据的目标音量值；在m的值为3时，m 4的值大于6，可以将第3个语音数据到第6个语音数据音量值之和的均值作为第3个语音数据的目标音量值。通过上述方法，在n的值为6时，可以将第1个语音数据到第5个语音数据音量值之和的均值作为第1个语音数据的目标音量值，将第2个语音数据到第6个语音数据音量值之和的均值作为第2个语音数据的目标音量值，将第3个语音数据到第6个语音数据音量值之和的均值作为第3个语音数据的目标音量值，将第4个语音数据到第6个语音数据音量值之和的均值作为第4个语音数据的目标音量值，将第5个语音数据到第6个语音数据音量值之和的均值作为第5个语音数据的目标音量值，将第6个语音数据的音量值作为第6个语音数据的目标音量值。

对于步骤s343，需要说明的是，人声频率一般集中在300-3000hz范围内，高于这个频率一般为汽笛声，建筑声音等噪音，所以超过人声频率范围的语音数据可以忽略掉，不影响人的喊话声音。

对于步骤s350，需要说明的是，对语音数据进行压缩编码，每个数据包独立编码，有利于网络环境差的情况下，最大程度还原语音数据。

可选地，压缩编码的具体方式不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，压缩编码算法的具体步骤可以如下所示：

1：将每帧数据包分为4个子帧，每个子帧数据包进行一次10阶的线性预测编码(lpc)分析，得到相应的lpc系数。

2：将得到的lpc系数转化为线谱对(lsf)系数，并对lsf系数进行量化，即得到各子帧对应的线性预测分析器，通过对各个子帧的线性预测，得到各个子帧的残差。

3：选择残差中最大的两个连续子帧，被选定为本次处理的初始状态。

4：对初始状态进行基于dpcm的标量量化，其结果作为编码输出的一部分。同时将初始状态存入参考帧存储区，用于对本帧剩余样点进行矢量量化。

5：对于剩余的残差，每次的搜索参考帧范围是动态参考帧，参考帧中存储了已经被编码的对象，并随着最新的结果，该动态参考帧被更新。

对于步骤s320，需要说明的是，发送语音数据的具体方式不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，步骤s320可以包括以下子步骤：

对已编码的语音数据进行传输处理，获得至少一个具有识别信息的语音数据包，将语音数据包通过第一图传模块发送给无人机200。

其中，识别信息包含：标识头信息、id信息及数据包长度，标识头信息用于表征对应语音数据包为有效数据包，id信息用于表征对应语音数据包在全部语音数据包中的位置。

详细地，在将已编码的语音数据发送给无人机200之前，需要对已编码的语音数据通过传输层进行传输处理，为每个数据包定义id、数据标识头和长度，通过网络协议将语音数据包传输至无人机200。

进一步地，请结合参阅图6，为本申请实施例提供的另一种基于语音采集的通讯方法的流程示意图，可以由图2无人机200执行。应当理解，在其他实施例中，本实施例的通讯方法中的部分步骤的顺序可以根据实际需要相互交换，或者其中的部分步骤也可以省略或删除。下面对图6所示的通讯方法的流程进行详细描述。

步骤s610，通过第二图传模块接收语音采集端设备100发送的语音数据。

步骤s620，对语音数据进行解码，获得脉冲编码调制语音数据。

上述方法通过对接收的语音数据进行解码，获得脉冲编码调制语音数据，实现了语音数据编码之后再发送，对已编码的语音数据解码后再播放，避免了现有技术中采集实时声音数据之后，直接将声音数据传输到无人机进行播放，所导致的语音传输距离短，容易受到干扰，通讯稳定性低的问题。

对于步骤s610，需要说明的是，接收语音数据的具体方式不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，步骤s610可以包括解析识别信息的步骤。因此，在图6的基础上，图7为本申请实施例提供的另一种通讯方法的流程示意图，参见图7，步骤s610可以包括：

步骤s611，对语音数据包的识别信息进行解析，判断语音数据包是否具有标识头信息。

在本申请实施例中，在语音数据包具有标识头信息时，判定语音数据包正常，执行步骤s612；在语音数据包不具有标识头信息时，判定语音数据包出错，可以丢弃出错的语音数据包。

步骤s612，将每个具有标识头信息的语音数据包作为有效语音数据包。

步骤s613，根据每个有效语音数据包的id信息，对全部有效语音数据包进行排序。

步骤s614，将排序完整的有效语音数据包作为语音数据。

详细地，在接收语音数据之后，可以通过网络协议对语音数据包进行解析，如果没有解析到数据标识头，认为此包是错包，丢弃，查找每个有效数据包的id，如果有乱序的需要重新排序。

需要说明的是，在步骤s614之前，本申请实施例提供的通讯方法还可以包括以下子步骤：

判断全部有效语音数据包中是否存在id信息不连续的有效语音数据包；在不存在id信息不连续的有效语音数据包时，判定有效语音数据包排序完整，将有效语音数据包作为语音数据；在存在id信息不连续的有效语音数据包时，则确定与丢失id信息相邻的两个id信息的有效语音数据包；根据相邻的两个id信息的有效语音数据包获得预测系数信息；根据预测系数信息还原丢失id信息对应的语音数据包；将全部有效语音数据包与丢失id信息对应的语音数据包，作为排序完整的有效语音数据包。

例如，在一种可以替代的示例中，有效语音数据包的数量可以为4个，分别为有效语音数据包a(id信息为1)、有效语音数据包b(id信息为2)、有效语音数据包d(id信息为4)和有效语音数据包e(id信息为5)，可以知道的是，丢失id信息为3，可以根据相邻的有效语音数据包b和有效语音数据包d还原丢失id信息对应的有效语音数据包c。

对于步骤s620，需要说明的是，对语音数据进行解码可以还原成原始的脉冲编码调制(pulsecodemodulation,pcm)语音数据，由于每个数据包独立编码，对于网络差丢包的环境，丢掉的数据包并不影响其余的数据包。

在步骤s620之后，本申请实施例提供的通讯方法还可以包括对语音数据进行音量放大的步骤。因此，在图6的基础上，图8为本申请实施例提供的另一种通讯方法的流程示意图，参见图8，通讯方法还可以包括：

步骤s630，对脉冲编码调制语音数据进行放大，获得待播放语音数据。

可选地，进行放大的具体方式不受限制，可以根据实际应用需求进行设置。例如，在一种可以替代的示例中，步骤s630可以包括以下子步骤：

对脉冲编码调制语音数据基于放大参数进行放大，将被放大的脉冲编码调制语音数据作为待播放语音数据。

其中，被放大的脉冲编码调制语音数据的音量值位于音量阈值范围内。

详细地，可以对还原的pcm语音数据进行音量放大增益，直接将音量数据*放大系数x得到放大后的语音数据。音量阈值范围可以为16bit，如果放大后的语音数据超过16bit的最大或者最小数值范围，需要把音量值重新赋值并限定在16bit的范围内，得到待播放语音数据。

需要说明的是，为了保证语音传输的清晰效果，有两点很重要：1：编解码端高效的压缩语音数据以及声音降噪。2：网络错误包的容错处理，以及音量数据的放大增益。本申请实施例采用了高效的语音编解码算法并对语音输入端进行降噪，可以解决噪音大，音量小的问题；增加网络协议处理异常数据包，可以较大程度消除网络环境差导致的数据包异常；接收端对语音数据进行音量增益，可以提高音量，增大了传输距离。通过上述方法，本申请实施例中的喊话声音抗干扰，画质清晰。声音传输距离远，喊话端和飞机端可以实现无线30公里通信，飞机端在200米高空播放喊话内容，地面的人可以清晰听到。应用场景丰富：警用飞机上面喊话非法人员；实时指挥交通；森林中警示声音驱逐有害动物；应急环境中进行远距离语音传输。

结合图9，本申请实施例还提供了一种基于语音采集的第一通讯装置900，该第一通讯装置900实现的功能对应上述应用于语音采集端设备100的通讯方法执行的步骤。该第一通讯装置900可以理解为上述语音采集端设备100的处理器，也可以理解为独立于上述语音采集端设备100或处理器之外的在语音采集端设备100控制下实现本申请功能的组件。其中，第一通讯装置900可以包括状态确认模块910和数据发送模块920。

状态确认模块910，用于确认无人机200的第一图传模块是否处于空闲状态。在本申请实施例中，状态确认模块910可以用于执行图3所示的步骤s310，关于状态确认模块910的相关内容可以参照前文对步骤s310的描述。

数据发送模块920，用于在无人机200的第一图传模块处于空闲状态时，将已编码的语音数据通过第一图传模块发送给无人机200。在本申请实施例中，数据发送模块920可以用于执行图3所示的步骤s320，关于数据发送模块920的相关内容可以参照前文对步骤s320的描述。

结合图10，本申请实施例还提供了一种基于语音采集的第二通讯装置1000，该第二通讯装置1000实现的功能对应上述应用于无人机200的通讯方法执行的步骤。该第二通讯装置1000可以理解为上述无人机200的处理器，也可以理解为独立于上述无人机200或处理器之外的在无人机200控制下实现本申请功能的组件。其中，第二通讯装置1000可以包括数据接收模块1010和数据解码模块1020。

数据接收模块1010，用于通过第二图传模块接收语音采集端设备100发送的语音数据。在本申请实施例中，数据接收模块1010可以用于执行图6所示的步骤s610，关于数据接收模块1010的相关内容可以参照前文对步骤s610的描述。

数据解码模块1020，用于对语音数据进行解码，获得脉冲编码调制语音数据。在本申请实施例中，数据解码模块1020可以用于执行图6所示的步骤s620，关于数据解码模块1020的相关内容可以参照前文对步骤s620的描述。

此外，本申请实施例还提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。在电子设备为语音采集端设备100时，处理器执行程序时实现应用于语音采集端设备100的通讯方法。在电子设备为无人机200时，处理器执行程序时实现应用于无人机200的通讯方法。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述通讯方法的步骤。

本申请实施例所提供的通讯方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行上述方法实施例中的通讯方法的步骤，具体可参见上述方法实施例，在此不再赘述。

综上所述，本申请实施例提供的基于语音采集的通讯方法、装置及系统，通过在无人机的第一图传模块处于空闲状态时，将已编码的语音数据通过第一图传模块发送给无人机，实现了语音数据编码之后再发送，避免了现有技术中采集实时声音数据之后，直接将声音数据传输到无人机进行播放，所导致的语音传输距离短，容易受到干扰，通讯稳定性低的问题。

以上仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音唤醒方法、装置、存储介质及电子设备与流程

基于语音采集的通讯方法、装置及系统与流程

相关文章

最热文献