一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

对象处理方法、装置、设备、存储介质和计算机程序产品与流程

2022-04-13 13:29:58 来源:中国专利 TAG:

技术特征:
1.一种对象处理方法,其特征在于,所述方法包括:基于预训练神经网络模型,确定输入对象的表示矩阵;基于所述预训练神经网络模型中待与所述表示矩阵进行卷积运算的目标卷积核的尺度,在所述目标卷积核滑过所述表示矩阵的过程中,从所述表示矩阵中确定位于当前卷积窗口内的各个表示向量;对于位于当前卷积窗口内的各个表示向量,以所述表示向量为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述表示向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果;将所述当前卷积窗口内的每个表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果相加,得到所述目标卷积核在所述当前卷积窗口对应的卷积结果;其中,在所述目标卷积核滑过所述表示矩阵的过程中,各个卷积窗口对应的卷积结果用于生成所述输入对象的特征表示。2.根据权利要求1所述的方法,其特征在于,所述基于预训练神经网络模型,确定输入对象的表示矩阵,包括:将所述输入对象分割成多个单元;获取基于所述预训练神经网络模型生成的表示向量集合;所述表示向量集合中各表示向量用于表征组成对象的各个单元;所述表示向量集合中的表示向量是将组成对象的单元输入至所述预训练神经网络模型得到的;对于组成所述输入对象的每个单元,从所述表示向量集合查询用于表征所述单元的表示向量;根据所述每个单元对应的表示向量,确定所述输入对象的表示矩阵。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个单元对应的表示向量,确定所述输入对象的表示矩阵,包括:确定组成所述输入对象的各个单元在所述输入对象中的分布;将所述每个单元对应的表示向量按所述分布进行组合,得到所述输入对象的表示矩阵。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定所述输入对象的表示矩阵中每个表示向量的表示向量标识;所述对于当前卷积窗口内的各个表示向量,以所述表示向量为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述表示向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果,包括:对于位于当前卷积窗口内的各个表示向量,以所述表示向量对应的表示向量标识为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述表示向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果。5.根据权利要求2所述的方法,其特征在于,所述输入对象为输入文本,所述表示向量集合中各表示向量用于表征组成文本的各个
词语,所述表示向量是将词语输入至用于处理文本的所述预训练神经网络模型所得到的词向量;或,所述输入对象为音频,所述表示向量集合中各表示向量用于表征组成音频的各个片段,所述表示向量是将片段输入至用于处理音频的所述预训练神经网络模型所得到的音频向量。6.根据权利要求2所述的方法,其特征在于,所述行卷积表的构建步骤包括:将组成样本对象的各个单元输入所述预训练神经网络模型,得到每个单元对应的表示向量,生成每个单元的单元标识或每个单元相应的向量标识;对于所述预训练神经网络模型的首个卷积层中的每个卷积核,确定每个卷积核的卷积核标识以及每个所述卷积核的卷积核行向量;所述卷积核行向量的维度与所述表示向量的维度相同;将每个表示向量分别与每个卷积核行向量进行卷积运算,得到行卷积结果;以所述表示向量对应的单元标识或向量标识为第一级索引、所述卷积核行向量所在的卷积核对应的卷积核标识为第二级索引、所述卷积核行向量在所述卷积核中的行位置为第三级索引,生成三级索引;将每个所述三级索引与相应的行卷积结果对应存储,生成行卷积表。7.根据权利要求6所述的方法,其特征在于,所述将每个表示向量分别与每个卷积核行向量进行卷积运算,得到行卷积结果,包括:遍历表示向量与所述预训练神经网络模型的首个卷积层中的卷积核;确定待进行卷积运算的表示向量与所述卷积核行向量;将所述表示向量与所述卷积核行向量中,对应相同位置的元素进行相乘,得到各位置的乘积结果;对所述各位置的乘积结果进行求和,得到所述待进行卷积运算的表示向量与所述卷积核行向量之间的行卷积结果。8.根据权利要求1所述的方法,其特征在于,所述对象为文本,所述行卷积表的构建步骤包括:将组成样本文本的各个词语输入所述预训练神经网络模型,得到每个词语对应的词向量,生成每个词语的词语标识或相应的词向量标识;对于所述预训练神经网络模型的首个卷积层中的每个卷积核,确定每个卷积核的卷积核标识以及每个所述卷积核的卷积核行向量;所述卷积核行向量的维度与所述词向量的维度相同;将每个词向量分别与每个卷积核行向量进行卷积运算,得到行卷积结果;以所述词向量对应的词语标识或词向量标识为第一级索引、所述卷积核行向量所在的卷积核对应的卷积核标识为第二级索引、所述卷积核行向量在所述卷积核中的行位置为第三级索引,生成三级索引;将每个所述三级索引与相应的行卷积结果对应存储,生成行卷积表。9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:确定当前卷积窗口在所述表示矩阵中的当前滑动位置,将所述当前卷积窗口对应的卷积结果,作为所述当前滑动位置对应的卷积结果;
根据在所述目标卷积核滑过所述表示矩阵的过程中每个滑动位置对应的卷积结果,生成所述表示矩阵与所述目标卷积核的卷积结果。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:通过所述预训练神经网络中的池化层,对所述表示矩阵与所述目标卷积核的卷积结果进行池化处理,得到池化结果。11.根据权利要求1所述的方法,其特征在于,所述对象为图像时,所述方法还包括:获取输入图像的像素矩阵;基于所述预训练神经网络模型中待与所述像素矩阵进行卷积运算的目标卷积核的尺度,在所述目标卷积核滑过所述像素矩阵的过程中,从所述像素矩阵中确定位于当前卷积窗口内的各个像素值;对于位于当前卷积窗口内的各个像素值,以所述像素值为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述像素值在所述当前卷积窗口中的位置为第三级索引,查询基于所述预训练神经网络模型生成的乘积表,得到所述像素值与所述目标卷积核中所述位置处的卷积核参数间的乘积结果;将所述当前卷积窗口内的每个像素值与所述目标卷积核中相应位置处的卷积核参数间的乘积结果相加,得到所述目标卷积核在所述当前卷积窗口对应的卷积结果;其中,所述乘积表存储像素值、所述预训练神经网络模型中卷积核的卷积核标识以及所述卷积核参数的位置共同对应的乘积结果,所述乘积结果是将所述像素值与所述卷积核标识所标识的卷积核中所述位置处的卷积核参数相乘得到的;在所述目标卷积核滑过所述像素矩阵的过程中,各个卷积窗口对应的卷积结果用于生成所述输入图像的特征表示。12.一种文本处理方法,其特征在于,所述方法包括:基于预训练神经网络模型,确定输入文本的表示矩阵;所述输入文本的表示矩阵是根据所述输入文本中每个词的词向量得到的;基于所述预训练神经网络模型中待与所述表示矩阵进行卷积运算的目标卷积核的尺度,在所述目标卷积核滑过所述表示矩阵的过程中,从所述表示矩阵中确定位于当前卷积窗口内的各个词向量;对于位于当前卷积窗口内的各个词向量,以所述词向量为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述词向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述词向量与所述目标卷积核相应行位置的行向量间的行卷积结果;将所述当前卷积窗口内的每个词向量与所述目标卷积核相应行位置的行向量间的行卷积结果相加,得到所述目标卷积核在所述当前卷积窗口对应的卷积结果;其中,在所述目标卷积核滑过所述表示矩阵的过程中,各个卷积窗口对应的卷积结果用于生成所述输入文本的特征表示。13.一种对象处理装置,其特征在于,所述装置包括:第一表示矩阵确定模块,用于基于预训练神经网络模型,确定输入对象的表示矩阵;第一卷积核滑动模块,用于基于所述预训练神经网络模型中待与所述表示矩阵进行卷积运算的目标卷积核的尺度,在所述目标卷积核滑过所述表示矩阵的过程中,从所述表示矩阵中确定位于当前卷积窗口内的各个表示向量;
第一结果查询模块,用于对于位于当前卷积窗口内的各个表示向量,以所述表示向量为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述表示向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果;第一结果处理模块,用于将所述当前卷积窗口内的每个表示向量与所述目标卷积核相应行位置的行向量间的行卷积结果相加,得到所述目标卷积核在所述当前卷积窗口对应的卷积结果;其中,在所述目标卷积核滑过所述表示矩阵的过程中,各个卷积窗口对应的卷积结果用于生成所述输入对象的特征表示。14.一种文本处理装置,其特征在于,所述装置包括:第二表示矩阵确定模块,用于基于预训练神经网络模型,确定输入文本的表示矩阵;所述输入文本的表示矩阵是根据所述输入文本中每个词的词向量得到的;第二卷积核滑动模块,用于基于所述预训练神经网络模型中待与所述表示矩阵进行卷积运算的目标卷积核的尺度,在所述目标卷积核滑过所述表示矩阵的过程中,从所述表示矩阵中确定位于当前卷积窗口内的各个词向量;第二结果查询模块,用于对于位于当前卷积窗口内的各个词向量,以所述词向量为第一级索引、所述目标卷积核的卷积核标识为第二级索引、所述词向量在所述当前卷积窗口中的行位置为第三级索引,查询基于所述预训练神经网络模型生成的行卷积表,得到所述词向量与所述目标卷积核相应行位置的行向量间的行卷积结果;第二结果处理模块,用于将所述当前卷积窗口内的每个词向量与所述目标卷积核相应行位置的行向量间的行卷积结果相加,得到所述目标卷积核在所述当前卷积窗口对应的卷积结果;其中,在所述目标卷积核滑过所述表示矩阵的过程中,各个卷积窗口对应的卷积结果用于生成所述输入文本的特征表示。15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法。16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12任一项所述的方法。

技术总结
本申请提供一种对象处理方法、装置、设备、存储介质和计算机程序产品,属于人工智能领域,可降低用于文本识别、图像识别和音频识别等人工神经网络的卷积在线计算用时。本申请中,通过行卷积表存储表示向量、卷积核标识以及卷积核的行位置共同对应的行卷积结果;目标卷积核滑过输入对象的表示矩阵过程中,针对位于当前卷积窗口的各表示向量,以表示向量为第一级索引、目标卷积核的卷积核标识为第二级索引、表示向量在当前卷积窗口中的行位置为第三级索引,查询行卷积表,得到对应的行卷积结果;将当前卷积窗口内的各表示向量与目标卷积核相应行位置的行向量间的行卷积结果相加,得到目标卷积核在当前卷积窗口对应的卷积结果。目标卷积核在当前卷积窗口对应的卷积结果。目标卷积核在当前卷积窗口对应的卷积结果。


技术研发人员:田荣
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.12.08
技术公布日:2022/4/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献