目标信息提取方法、电子设备及计算机可读存储介质与流程

2021-10-24 06:13:00 来源：中国专利 TAG：信息语音电子设备提取谈话

1.本发明属于语音信息分析技术领域，尤其涉及一种谈话语音信息的目标信息提取方法、电子设备及计算机可读存储介质。

背景技术：

2.目前，针对特定场景，需要快速从谈话语音信息中提取同类的目标信息，从而进行分类建模，如针对监所、公安、治安等特定场景，需要有针对性的分析暗语、术语，发现新型犯罪特征并固定证据，实现谈话语音信息对各警种侦破案件的支撑。
3.因此，如何快速、高效、准确地从谈话语音信息中提取目标信息是亟待解决的问题。

技术实现要素：

4.基于此，针对上述技术问题，提供一种快速、高效、准确的谈话语音信息的目标信息提取方法、电子设备及计算机可读存储介质。
5.本发明采用的技术方案如下：
6.一方面，提供一种谈话语音信息的目标信息提取方法，其特征在于，包括：
7.s101、将谈话语音信息转为文字；
8.s102、基于词汇字典对所述文字分割成词汇序列；
9.s103、确定锚点信息，所述锚点信息为由至少一个锚点词以及至少一个关联标志组成的序列；
10.s104、从所述词汇序列中识别出锚点词，并根据所述锚点信息中关联标志与锚点词的位置关系，从所述词汇序列中识别出对应的目标词；
11.s105、根据所述目标词，从所述词汇序列中获取与所述目标词关联的新的锚点信息；
12.s106、以目标词为索引，统计所有锚点信息在所述词汇序列中与目标词的关联次数，建立以目标词为索引的锚点信息统计关系；
13.s107、根据所述以目标词为索引的锚点信息统计关系，对所述目标词进行聚类，得到同类的目标信息。
14.另一方面，提供一种电子设备，包括存储模块，所述存储模块包括由处理器加载并执行的指令，所述指令在被执行时使所述处理器执行上述一种谈话语音信息的目标信息提取方法。
15.再一方面，提供一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被处理器执行时，实现上述一种谈话语音信息的目标信息提取方法。
16.本发明能够快速、高效、准确地从谈话语音信息中提取目标信息，从而针对特定行业场景的业务支撑需求进行分类建模，尤其是针对监所、公安、治安等特定场景，可以针对
性地分析暗语、术语，发现新型犯罪特征并固定证据，实现谈话语音信息对各警种侦破案件的支撑。
附图说明
17.下面结合附图和具体实施方式对本发明进行详细说明：
18.图1为本发明实施例提供的一种谈话语音信息的目标信息提取方法的流程图；
19.图2为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
20.如图1所示，本说明书实施例提供一种谈话语音信息的目标信息提取方法，包括：
21.s101、将谈话语音信息转为文字。
22.较佳地，步骤s101进一步包括：
23.a、对谈话语音信息进行预处理：降噪并调整音频音量。
24.在一种实施方式中，可以进行回声抑制降噪处理。
25.谈话语音信息的音量过高或过低，都会影响转换文字，故需要对音量进行调整。
26.b、将预处理后的谈话语音信息转为文字。
27.在一种实施方式中，可以通过asr技术将谈话语音信息转为文字。
28.其中，谈话语音信息为由拾音设备采集的信息。例如，对于监所、公安、治安等特定场景，可以在谈话室、审讯室通过数字拾音设备采集谈话语音信息，如麦克风、拾音器或安装了移动警务终端的手机等等。
29.s102、基于词汇字典将文字分割成词汇序列。
30.较佳地，步骤s102进一步包括：
31.对词汇序列进行清洗。清洗的目的为了突出后续步骤的目标词和锚点信息的锚点词，减少运算复杂度。
32.在本实施例中，对词汇序列进行清洗包括：
33.a、删除修饰性词。
34.b、删除连词，对连词的前后词汇进行合并，如将词汇序列：词汇a/和/词汇b中的连词“和”删除，合并成词汇a词汇b。
35.c、删除助词，对助词的前后词汇进行合并，如将词汇序列：词汇a/的/词汇b中的助词“的”删除，合并成词汇a词汇b。
36.s103、确定锚点信息，锚点信息为由至少一个锚点词以及至少一个关联标志组成的序列。锚点信息可以有以下几种形式：
37.锚点词m
…
锚点词n
38.锚点词n
…
锚点词m
39.…
锚点词m
40.锚点词n
…
41.其中，
“…”
为关联标志，需要指出的是，“锚点词m
…
锚点词n”和“锚点词n
…
锚点词m”为不同的锚点信息。
42.当然以上几种形式仅是为了清楚所做的示例性说明而不是对锚点信息的限定。
43.锚点信息可以根据业务场景以及用户关注点来确定。
44.在一种实施方式中，锚点信息可以实时地由人工选定，确定锚点信息时，接收人工在词汇序列中选定的锚点信息，如可以在词汇序列的“我/用/钥匙/打开/房门”中选定锚点信息为“用
…
打开”。
45.在另一种实施方式中，锚点信息也可以预先设置，确定锚点信息时，读取预设的锚点信息即可。
46.s104、从词汇序列中识别出锚点词，并根据锚点信息中关联标志与锚点词的位置关系，从词汇序列中识别出对应的目标词，并进行记录。
47.在一种实施方式中，可以从左至右的顺序对词汇序列依次进行识别。
48.以词汇序列中的“用/螺丝刀/打开/电脑外壳”为例，假设锚点信息为“用
…
打开”，由于关联标志
“…”
在“用”和“打开”之间，故可以识别出对应的目标词为“螺丝刀”。
49.当然，也允许人工增加或者删除锚点信息：
50.响应于用户的指令，增加锚点信息，或者响应于用户的指令，删除锚点信息以及对应的目标词记录。
51.s105、根据目标词，从词汇序列中获取与目标词关联的新的锚点信息。
52.如通过目标词“螺丝刀”，从词汇序列的“用/螺丝刀/撬开/柜子”中获取新的锚点信息“用
…
撬开”。
53.较佳地，步骤s105进一步包括：
54.a、根据目标词，从词汇序列中获取与目标词关联的候选锚点信息。
55.b、统计候选锚点信息的锚点词在词汇序列中的出现次数。
56.c、将出现次数超过预设次数的候选锚点信息作为新的锚点信息。
57.锚点信息也是对目标词特征的一个描述，通过将出现频率较高的候选锚点信息新增为锚点信息，可以提高对同类目标词汇的识别效率。
58.s106、以目标词为索引，统计所有锚点信息在词汇序列中与目标词的关联次数，建立以目标词为索引的所有锚点信息统计关系，该统计关系参见表1。
59.目标词1锚点信息1：次数；锚点信息2：次数目标词2锚点信息1：次数；锚点信息3：次数；锚点信息4：次数：锚点信息5：次数目标词3锚点信息5：次数
60.表1
61.s107、根据以目标词为索引的所有锚点信息统计关系，对目标词进行聚类，得到同类的目标信息。
62.在本实施例中，步骤s107进一步包括：
63.a、通过以下公式计算目标词之间的相似度x：
[0064][0065]
其中，a
i
代表与目标词a和目标词b共同关联的锚点信息i在词汇序列中与目标词a的关联次数，b
i
代表与目标词a和目标词b共同关联的锚点信息i在词汇序列中与目标词b的
关联次数，a
j
代表与目标词a和目标词b共同关联的锚点信息j在词汇序列中与目标词a的关联次数，b
j
代表与目标词a和目标词b共同关联的锚点信息j在词汇序列中与目标词b的关联次数，a
k
代表与目标词a关联的锚点信息k在词汇序列中与目标词a的关联次数，b
k
代表与目标词b关联的锚点信息k在词汇序列中与目标词b的关联次数，n代表与目标词a关联的锚点信息的总数，m代表与目标词b关联的锚点信息的总数，综上，在上述公式中，分子代表与目标词a和目标词b共同关联的每个锚点信息在词汇序列中与目标词a以及目标词b的关联次数乘积的开平方之和，分母代表与目标词a关联的每个锚点信息在词汇序列中与目标词a的关联次数的平方和，加上与目标词b关联的每个锚点信息在词汇序列中与目标词b的关联次数的平方和。
[0066]
b、将相似度x超过预设相似度的目标词作为同类的目标信息。
[0067]
下面结合具体例子对本发明做进一步说明。
[0068]
根据业务需要，现在要通过采访录音对某单位工作人员的通勤方式建立模型，需要从采访录音中提取相应的目标信息进行支撑，经过随机采访“你上班的交通工具是什么？”，得到谈话语音信息。
[0069]
谈话语音信息经过降噪和音量调节，经asr技术处理转换为文字。例如得到的文字为：
[0070]
a)“我每天是坐公交和地铁上班”[0071]
b)“不一定的，有时候乘公共交通，有时候坐单位班车”[0072]
c)“因为家离得近，我都是步行上班”[0073]
d)“坐单位的班车上班”[0074]
e)“搭乘单位班车”[0075]
f)“走路上班多一些”。
[0076]
基于词汇字典将上述文字分割成词汇序列，以a)和d)为例，分割后的词汇序列为“我/每天/是/坐/公交/和/地铁/上班”；“坐/单位/的/班车/上班”，将连词和助词删除，并进行合并，得到“我/每天/是/坐/公交地铁/上班”；“坐/单位班车/上班”。
[0077]
人工标注出词汇序列中的锚点信息，如从“我/每天/是/坐/公交地铁/上班”中标注“坐
…
上班”为锚点信息，后续用该锚点信息筛选目标词。
[0078]
通过锚点信息“坐
…
上班”，依次分析a)和d)清洗后的序列，得到目标词:“公交地铁”和“单位班车”。
[0079]
通过目标词“单位班车”，从“坐/单位班车/上班”中找到新的锚点信息“坐
…”
，和e)清洗后的序列中找到新的锚点信息“搭乘
…”
。
[0080]
以目标词为索引，统计所有锚点信息在词汇序列中与目标词的关联次数，建立以目标词为索引的所有锚点信息统计关系。统计关系参见表2。
[0081]
公交地铁坐
…
上班：2；
…
上班：4单位班车坐
…
上班：2；坐
…
：1；搭乘
…
：1：
…
上班：6自驾
…
上班：2
[0082]
表2
[0083]
最后，根据以目标词为索引的所有锚点信息统计关系，对目标词进行聚类，得到同类的目标信息。以表2为例，经过相似度计算，目标词“公交地铁”和“单位班车”的相似度为
0.629878，目标词“自驾”和“单位班车”的相似度为0.408467，假设预设相似度为0.5，则目标词“公交地铁”和“单位班车”为同类的目标信息。
[0084]
如图2所示，基于同一发明构思，本说明书实施例还提供一种电子设备，包括处理器11；显示组件12，用于进行显示；输入组件13，用于人工输入或者删除锚点信息；存储模块14，用于存储由处理器11加载并执行的指令，指令在被执行时使处理器11执行本说明书上述一种谈话语音信息的目标信息提取方法部分中描述的根据本发明各种示例性实施方式的步骤。
[0085]
其中，存储模块14可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(ram)和/或高速缓存存储单元，还可以进一步包括只读存储单元(rom)。
[0086]
基于同一发明构思，本说明书实施例还提供一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，一个或多个程序当被处理器执行时，实现本说明书上述一种谈话语音信息的目标信息提取方法部分中描述的根据本发明各种示例性实施方式的步骤。
[0087]
计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。计算机可读存储介质的更具体示例包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd
‑
rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0088]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如java、c 等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(lan)或广域网(wan)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0089]
但是，本技术领域中的普通技术人员应当认识到，以上的实施例仅是用来说明本发明，而并非用作为对本发明的限定，只要在本发明的实质精神范围内，对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于条件融合的多模态反讽检测方法与流程

目标信息提取方法、电子设备及计算机可读存储介质与流程

相关文献

最热文献