一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息处理装置和信息处理方法与流程

2021-11-20 01:01:00 来源:中国专利 TAG:

技术特征:
1.一种信息处理装置,包括:基础特征提取单元,被配置成提取声音的基础特征;多尺度特征提取单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征,提取所述声音的多尺度特征;初级分类单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征对所述声音进行初级分类,以获得初级分类结果;次级分类单元,被配置成基于所述声音的所述初级分类结果和所述多尺度特征对所述声音进行次级分类,以获得次级分类结果;以及分类结果融合单元,被配置成对所述声音的初级分类结果和次级分类结果进行融合,以获得所述声音的最终分类结果。2.根据权利要求1所述的信息处理装置,其中,所述初级分类结果包括所述声音属于多个根类别中的每一个根类别的概率,其中,所述次级分类单元包括与所述多个根类别一一对应的多个次级分类器,以及其中,对于所述多个次级分类器中的每一个,在所述声音属于该次级分类器所对应的根类别的概率等于或大于预定阈值的情况下,该次级分类器被激活。3.根据权利要求2所述的信息处理装置,其中,所述多个根类别中的每一个根类别包括多个子类别,并且所述多个根类别包括的子类别的总数目为n,其中n为大于1的自然数,其中,所述次级分类结果包括通过被激活的次级分类器获得的至少一个n维概率向量,每个n维概率向量中的各个元素表示所述声音属于各个子类别的概率,并且被预先设置为0,其中,所述次级分类器中的每一个被配置成在被激活的情况下通过执行如下迭代处理获取相应的n维概率向量,在第一轮处理中,所述次级分类器:基于所述声音的多尺度特征获得第一概率向量,其中,所述第一概率向量中的各个元素表示所述声音属于所述次级分类器所对应的根类别包括的各个子类别的概率;选择所述第一概率向量中的前m个最大的元素对应的子类别作为候选子类别;基于所述候选子类别生成m个子类别向量,其中m为大于1的自然数;以及针对所述m个子类别向量中的每一个,基于所述第一概率向量中的、与该子类别向量包括的元素对应的元素,计算所述子类别向量的分数;在第i≥2轮处理中,所述次级分类器:选择通过前一轮处理生成的所述子类别向量中的前n个分数最大的子类别向量作为候选子类别向量,其中n为大于1的自然数并且n≤m;以及针对所述候选子类别向量中的每一个:基于该候选子类别向量和所述声音的多尺度特征获得第i概率向量,其中,所述第i概率向量中的各个元素表示所述声音属于所述次级分类器所对应的根类别包括的各个子类别的概率;选择所述第i概率向量中的前m个最大的元素对应的子类别作为候选子类别;以及将所述候选子类别中的每一个分别添加到该候选子类别向量,以新生成子类别向量,并且基于该候选子类别向量的分数以及所述第i概率向量中的、与新添加的候选子类别对应的元素,计算新生成的所述子类别向量的分数,其中,在新生成的子类别向量中的每一个的分数均小于从前一轮处理生成的所述子类
别向量中选择的所述候选子类别向量中的每一个的分数的情况下,迭代处理终止,并且其中,所述次级分类器基于倒数第二轮处理中生成的子类别向量中的分数最高的子类别向量包括的各个元素所对应的概率获得相应的n维概率向量。4.根据权利要求1至3中任一项所述的信息处理装置,其中,所述信息处理装置包括多个所述多尺度特征提取单元,其中,所述信息处理装置还包括多尺度特征融合单元,被配置成对通过多个所述多尺度特征提取单元提取的多个多尺度特征进行融合,并且获得融合的多尺度特征,以及其中,所述次级分类单元进一步被配置成基于所述声音的所述初级分类结果和所述融合的多尺度特征对所述声音进行次级分类,以获得所述次级分类结果。5.根据权利要求4所述的信息处理装置,其中,每个所述多尺度特征提取单元包括:多个特征提取子单元,每个特征提取子单元被配置成基于通过所述基础特征提取单元所提取的所述基础特征,提取所述声音的特征;以及第一特征融合子单元,被配置成对通过所述多个特征提取子单元提取的所述声音的多个特征进行融合,将融合结果输出作为通过相应的多尺度特征提取单元提取的所述声音的多尺度特征,并且将所述融合结果输出至下一个多尺度特征提取单元作为下一个多尺度特征提取单元的输入。6.根据权利要求5所述的信息处理装置,其中,每个多尺度特征提取单元还包括:多个全局池化子单元,每个全局池化子单元分别对应于一个特征提取子单元,并且每个全局池化子单元被配置成对通过与该全局池化子单元对应的特征提取子单元提取的所述声音的特征进行全局池化;以及第二特征融合子单元,被配置成对经由所述全局池化子单元池化的所述声音的多个特征进行融合,并且将融合结果输出作为通过相应的多尺度特征提取单元提取的所述声音的多尺度特征。7.根据权利要求6所述的信息处理装置,其中,所述特征提取子单元是二维卷积单元,并且其中,每个多尺度特征提取单元还包括:预处理子单元,被配置成对输入进行处理以降低所述输入的维度。8.根据权利要求6所述的信息处理装置,其中,所述信息处理装置包括三个所述多尺度特征提取单元,并且每个多尺度特征提取单元包括三个所述特征提取子单元和三个所述全局池化子单元。9.根据权利要求6所述的信息处理装置,其中,所述第一特征融合子单元进一步被配置成以拼接的方式对通过所述多个特征提取子单元提取的所述声音的多个特征进行融合,以及其中,所述第二特征融合子单元进一步被配置成以拼接的方式对经由所述全局池化子单元池化的所述声音的多个特征进行融合。10.一种信息处理方法,包括:基础特征提取步骤,用于提取声音的基础特征;多尺度特征提取步骤,用于基于通过所述基础特征提取步骤所提取的所述基础特征,提取所述声音的多尺度特征;
初级分类步骤,用于基于通过所述基础特征提取步骤所提取的所述基础特征对所述声音进行初级分类,以获得初级分类结果;次级分类步骤,用于基于所述声音的所述初级分类结果和所述多尺度特征对所述声音进行次级分类,以获得次级分类结果;以及分类结果融合步骤,用于对所述声音的初级分类结果和次级分类结果进行融合,以获得所述声音的最终分类结果。

技术总结
本申请公开一种信息处理装置和信息处理方法。该信息处理装置包括:基础特征提取单元,被配置成提取声音的基础特征;多尺度特征提取单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征,提取所述声音的多尺度特征;初级分类单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征对所述声音进行初级分类,以获得初级分类结果;次级分类单元,被配置成基于所述声音的所述初级分类结果和所述多尺度特征对所述声音进行次级分类,以获得次级分类结果;以及分类结果融合单元,被配置成对所述声音的初级分类结果和次级分类结果进行融合,以获得所述声音的最终分类结果。类结果。类结果。


技术研发人员:林慧镔 石自强 刘柳 刘汝杰
受保护的技术使用者:富士通株式会社
技术研发日:2020.05.13
技术公布日:2021/11/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献