一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于自主驾驶车辆的声源检测和定位的系统和方法与流程

2022-07-20 01:41:38 来源:中国专利 TAG:

技术特征:
1.一种用于在自主驾驶车辆(adv)在驾驶环境内运行时利用adv进行声源检测和定位的方法,所述方法包括:从安装在adv上的多个音频传感器接收音频数据,所述音频数据包括由多个音频传感器捕获并由一个或多个声源发出的声音;基于接收到的音频数据,确定多个声源信息,每个声源信息包括与特定声音的存在相关联的置信度分数;以及生成数据表示以报告adv的驾驶环境中是否存在特定声音,所述数据表示包括所确定的多个声源信息;其中接收到的音频数据和生成的数据表示用于随后训练机器学习算法以在adv的自主驾驶期间实时识别特定声源。2.根据权利要求1所述的方法,其中确定多个声源信息包括利用多个音频传感器执行声源定位,以确定以下各项中的至少一项:声源相对于其相应音频传感器的方向、声源与其相应音频传感器之间的距离、捕获的声音的相对位置、捕获的声音的绝对位置、捕获的声音的接近/离开状态、或与当前时间戳相关联的捕获的声音的强度。3.根据权利要求2所述的方法,其中每个声源信息进一步包括以下至少之一:声源相对于相应音频传感器的方向、声源与相应音频传感器之间的距离、捕获的声音的相对位置、捕获的声音的绝对位置、捕获的声音的接近/离开状态、或与当前时间戳相关联的捕获的声音的强度。4.根据权利要求3所述的方法,其中,所述数据表示是包括共同覆盖所述adv的驾驶环境的多个区域的网格,每个区域对应于所述多个音频传感器中的音频传感器并报告指示区域内是否存在特定声音的结果的向量,所述结果的向量包括区域标识(id)和一个声源信息。5.根据权利要求4所述的方法,其中每个区域被配置为部分地覆盖所述驾驶环境内的特定尺寸。6.根据权利要求1所述的方法,其中,所述声源为应急车辆,所述特定声音为警报声。7.根据权利要求1所述的方法,其中,所述置信度分数在值0~1的范围内。8.根据权利要求4所述的方法,其中,所述网格的中心表示所述adv的位置。9.一种具有存储在其中的指令的非暂时性机器可读介质,所述指令在由处理器执行时使所述处理器执行如权利要求1至8中任一项所述的方法的操作。10.一种用于声源检测和定位的系统,包括:处理器;以及耦接到处理器且存储指令的存储器,当指令被处理器执行时,使处理器执行如权利要求1至8中任一项所述的方法的操作。11.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时使得所述处理器执行如权利要求1至8中任一项所述的方法。12.一种用于声源检测和定位的系统,包括:传感器系统,包括安装在adv上的多个音频传感器,用于接收音频数据,所述音频数据包括由多个音频传感器捕获并由一个或多个声源发出的声音;
声源检测和定位模块,用于基于接收到的音频数据,确定多个声源信息,每个声源信息包括与特定声音的存在相关联的置信度分数;以及生成数据表示以报告adv的驾驶环境中是否存在特定声音,所述数据表示包括所确定的多个声源信息,其中接收到的音频数据和生成的数据表示用于随后训练机器学习算法以在adv的自主驾驶期间实时识别特定声源。13.根据权利要求12所述的系统,其中,所述声源检测和定位模块用于利用多个音频传感器执行声源定位,以确定以下各项中的至少一项:声源相对于其相应音频传感器的方向、声源与其相应音频传感器之间的距离、捕获的声音的相对位置、捕获的声音的绝对位置、捕获的声音的接近/离开状态、或与当前时间戳相关联的捕获的声音的强度。14.根据权利要求13所述的系统,其中,所述数据表示是包括共同覆盖所述adv的驾驶环境的多个区域的网格,每个区域对应于所述多个音频传感器中的音频传感器并报告指示区域内是否存在特定声音的结果的向量,所述结果的向量包括区域标识(id)和一个声源信息。15.根据权利要求14所述的系统,其中,每个区域被配置为部分地覆盖所述驾驶环境内的特定尺寸。16.根据权利要求12所述的系统,其中,所述声源为应急车辆,所述特定声音为警报声。17.根据权利要求12所述的系统,其中,所述置信度分数在值0~1的范围内。18.根据权利要求14所述的系统,其中,所述网格的中心表示所述adv的位置。

技术总结
公开了用于利用自主驾驶车辆(ADV)进行声源检测和定位的系统和方法。方法包括从安装在ADV上的多个音频传感器接收音频数据。音频数据包括由音频传感器捕获并由一个或多个声源发出的声音。基于接收到的音频数据,方法进一步包括确定多个声源信息。每个声源信息包括与特定声音的存在相关联的置信度分数。方法进一步包括生成数据表示以报告在ADV的驾驶环境内是否存在特定声音。数据表示包括确定的声源信息。接收到的音频数据和生成的数据表示用于随后训练机器学习算法,以在ADV的自主驾驶过程中实时识别特定的声源。中实时识别特定的声源。中实时识别特定的声源。


技术研发人员:孙宏艺 许珂诚 罗琦 林泽俊 王为 雷诺兹卫斯理 胡江滔 缪景皓
受保护的技术使用者:百度(美国)有限责任公司
技术研发日:2021.12.29
技术公布日:2022/7/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献