一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标信息提取方法、电子设备及计算机可读存储介质与流程

2021-10-24 06:13:00 来源:中国专利 TAG:信息 语音 电子设备 提取 谈话

技术特征:
1.一种谈话语音信息的目标信息提取方法,其特征在于,包括:s101、将谈话语音信息转为文字;s102、基于词汇字典对所述文字分割成词汇序列;s103、确定锚点信息,所述锚点信息为由至少一个锚点词以及至少一个关联标志组成的序列;s104、从所述词汇序列中识别出锚点词,并根据所述锚点信息中关联标志与锚点词的位置关系,从所述词汇序列中识别出对应的目标词;s105、根据所述目标词,从所述词汇序列中获取与所述目标词关联的新的锚点信息;s106、以目标词为索引,统计所有锚点信息在所述词汇序列中与目标词的关联次数,建立以目标词为索引的锚点信息统计关系;s107、根据所述以目标词为索引的锚点信息统计关系,对所述目标词进行聚类,得到同类的目标信息。2.根据权利要求1所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述步骤s101进一步包括:对所述谈话语音信息进行预处理:降噪并调整音频音量;将预处理后的谈话语音信息转为文字。3.根据权利要求2所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述步骤s102进一步包括:对所述词汇序列进行清洗。4.根据权利要求3所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述对所述词汇序列进行清洗,进一步包括:删除修饰性词;删除连词,对连词的前后词汇进行合并;删除助词,对助词的前后词汇进行合并。5.根据权利要求4所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述确定锚点信息,进一步包括:接收人工在所述词汇序列中选定的锚点信息;或者读取预设的锚点信息。6.根据权利要求5所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述步骤s105进一步包括:根据所述目标词,从所述词汇序列中获取与所述目标词关联的候选锚点信息;统计所述候选锚点信息的锚点词在所述词汇序列中的出现次数;将所述出现次数超过预设次数的候选锚点信息作为新的锚点信息。7.根据权利要求6所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述步骤s107进一步包括:通过以下公式计算目标词之间的相似度x:
其中,a
i
代表与目标词a和目标词b共同关联的锚点信息i在词汇序列中与目标词a的关联次数,b
i
代表与目标词a和目标词b共同关联的锚点信息i在词汇序列中与目标词b的关联次数,a
j
代表与目标词a和目标词b共同关联的锚点信息j在词汇序列中与目标词a的关联次数,b
j
代表与目标词a和目标词b共同关联的锚点信息j在词汇序列中与目标词b的关联次数,a
k
代表与目标词a关联的锚点信息k在词汇序列中与目标词a的关联次数,b
k
代表与目标词b关联的锚点信息k在词汇序列中与目标词b的关联次数,n代表与目标词a关联的锚点信息的总数,m代表与目标词b关联的锚点信息的总数;将相似度x超过预设相似度的目标词作为同类的目标信息。8.根据权利要求7所述的一种谈话语音信息的目标信息提取方法,其特征在于,所述步骤104还包括:响应于用户的指令,增加锚点信息;或者响应于用户的指令,删除锚点信息以及对应的目标词。9.一种电子设备,其特征在于,包括存储模块,所述存储模块包括由处理器加载并执行的指令,所述指令在被执行时使所述处理器执行根据权利要求1

8任一项所述的一种谈话语音信息的目标信息提取方法。10.一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,其特征在于,所述一个或多个程序当被处理器执行时,实现权利要求1

8任一项所述的一种谈话语音信息的目标信息提取方法。

技术总结
本发明提供一种谈话语音信息的目标信息提取方法、电子设备及计算机可读存储介质,能够快速、高效、准确地从谈话语音信息中提取目标信息,从而针对特定行业场景的业务支撑需求进行分类建模,尤其是针对监所、公安、治安等特定场景,可以针对性地分析暗语、术语,发现新型犯罪特征并固定证据,实现谈话语音信息对各警种侦破案件的支撑。种侦破案件的支撑。种侦破案件的支撑。


技术研发人员:李刚
受保护的技术使用者:李刚
技术研发日:2021.07.08
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜