一种识别恶意语音信息的方法、装置、介质和设备

2022-05-18 10:31:55 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，尤其涉及一种识别恶意语音信息的方法、装置、介质和设备。

背景技术：

2.随着移动互联网的发展，移动端日渐成为人与人交流的平台，特别是近几年来聊天软件以及网络建设的飞速发展，网络的成本也越来越低，用户之间的沟通方式也由传统的短信/电话向微信等主流的聊天软件过渡，导致现在发消息的成本基本为零，与此同时恶意信息包括各种恶意营销信息，骚扰信息等也充斥着整个网络。以微信为例，微信群内的各种语音信息就是用户向群或者个人发送含有恶意信息的消息。如何识别这些恶意信息是目前亟需解决的技术问题。

技术实现要素：

3.本发明所要解决的技术问题是针对现有技术的不足，提供将geojson数据格式转换为三维glb格式的方法、装置、介质和设备。
4.本发明解决上述技术问题的技术方案如下：
5.一种识别恶意语音信息的方法，所述方法包括：
6.采集被监控群组的实时会话数据，并基于所述实时会话数据，绘制所述被监控群组的情绪曲线；
7.按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线；
8.当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员；
9.对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息；
10.根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。
11.在上述技术方案的基础上，本发明还可以做如下改进。
12.进一步地，所述基于所述实时会话数据，绘制所述被监控群组的情绪曲线，具体包括：
13.按照所述实时会话数据的时间顺序，对所述实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕，
14.根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述被监控群组的情绪曲线，其中分别设置所述情绪状态中的各个状态的预设值。
15.进一步地，所述基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线，具体包括：
16.按照所述实时会话数据的时间顺序，对所述会话人员的实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕，
17.根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述会话人员的情绪曲线。
18.进一步地，所述当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员，具体包括：
19.将所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线进行偏差比较，得到时序偏差数据；
20.判断所述时序偏差数据中是否有大于预设偏差值的偏差数据；
21.若是，则将所述会话人员作为重点监控人员。
22.进一步地，所述对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息，具体包括：
23.利用已建立的声纹模型对所述重点监控人员的会话数据进行声纹识别，得到所述重点监控人员的声纹特征信息；
24.将所述重点监控人员的会话数据转换为文本信息，对所述文本信息进行分词，得到多个词汇；
25.将所述词汇分别作为已训练的词模型的输入，得到所述词汇对应的词嵌入特征，从而得到所述重点监控人员的语料特征信息。
26.进一步地，所述根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，具体包括：
27.计算所述重点监控人员的声纹特征信息与所述预设安全规则中预警声纹特征信息之间的相似度，若所述相似度值大于预设相似度阈值，则所述重点监控人员的声纹特征信息中存在恶意语气；
28.判断所述语料特征信息中是否存在所述预设安全规则中的恶意信息，若是，则所述语料特征信息中包括所述恶意信息。
29.本方法发明的有益效果是：提出了一种识别恶意语音信息的方法，包括采集被监控群组的实时会话数据，并基于所述实时会话数据，绘制所述被监控群组的情绪曲线；按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线；当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员；对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息；根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含
恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。本发明实现了对微信群中的语音信息进行恶意信息的识别，以及对利用微信群进行恐吓威胁等行为的识别，保护了微信群的安全。
30.本发明解决上述技术问题的另一技术方案如下：
31.一种识别恶意语音信息的装置，所述装置包括：
32.采集模块，用于采集被监控群组的实时会话数据；
33.分析模块，用于基于所述实时会话数据，绘制所述被监控群组的情绪曲线；按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线；当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员；
34.判定模块，用于对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息；
35.根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。
36.进一步地，所述分析模块，具体用于按照所述实时会话数据的时间顺序，对所述实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕，
37.根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述被监控群组的情绪曲线，其中分别设置所述情绪状态中的各个状态的预设值。
38.此外，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述技术方案中任一项所述的方法的步骤。
39.本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述技术方案中任一项所述的方法的步骤。
40.本发明附加的方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明实践了解到。
附图说明
41.为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
42.图1为本发明实施例所示的一种识别恶意语音信息的方法的流程示意图；
43.图2为本发明另一实施例所示的一种识别恶意语音信息的装置的模块示意图。
具体实施方式
44.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。
45.如图1所示，本发明实施例所述的一种识别恶意语音信息的方法，所述方法包括以下步骤：
46.110、采集被监控群组的实时会话数据，并基于所述实时会话数据，绘制所述被监控群组的情绪曲线。
47.120、按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线。
48.130、当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员。
49.140、对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息。
50.150、根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。
51.基于上述实施例，步骤110中具体包括：
52.111、按照所述实时会话数据的时间顺序，对所述实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕。
53.应理解，情绪状态还包括恐吓、威胁、兴奋等等，将每种情绪状态设置一个预设值，例如将平静设置为0、高兴设置为5、兴奋设置为10、难过设置为-5、恐吓设置为-20。语调识别的方法目前有很多，本技术中不再赘述。
54.112、根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述被监控群组的情绪曲线，其中分别设置所述情绪状态中的各个状态的预设值。
55.进一步地，步骤120中所述基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线，具体包括：
56.121、按照所述实时会话数据的时间顺序，对所述会话人员的实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕。
57.122、根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述会话人员的情绪曲线。
58.进一步地，步骤130中具体包括：
59.将所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线进行偏差比较，得到时序偏差数据。
60.判断所述时序偏差数据中是否有大于预设偏差值的偏差数据。
61.若是，则将所述会话人员作为重点监控人员。
62.应理解，本身群组会话的情绪曲线和会话人员的情绪曲线是有一定偏差的，但是如果会话人员和群组会话的情绪曲线的偏差很大时，需要引起注意。
63.进一步地，步骤140中具体包括：
64.利用已建立的声纹模型对所述重点监控人员的会话数据进行声纹识别，得到所述重点监控人员的声纹特征信息。
65.将所述重点监控人员的会话数据转换为文本信息，对所述文本信息进行分词，得到多个词汇。
66.将所述词汇分别作为已训练的词模型的输入，得到所述词汇对应的词嵌入特征，从而得到所述重点监控人员的语料特征信息。
67.应理解，对会话数据进行声纹识别的方法很多，并且获取重点监控人员的语料特征信息的方法也很多，本技术中就不在赘述。
68.进一步地，步骤150中具体包括：
69.计算所述重点监控人员的声纹特征信息与所述预设安全规则中预警声纹特征信息之间的相似度，若所述相似度值大于预设相似度阈值，则所述重点监控人员的声纹特征信息中存在恶意语气。
70.判断所述语料特征信息中是否存在所述预设安全规则中的恶意信息，若是，则所述语料特征信息中包括所述恶意信息。
71.应理解，预设安全规则中存储了很多的预警声纹特征信息，这些预警声纹信息是关于恐吓、威胁和欺骗等的声纹信息。当语料特征信息中存在恶意信息，并且声纹特征信息中存在恶意语气时，那需要对重点监控人员进行深入调查。
72.基于上述实施例所提出的一种识别恶意语音信息的方法，包括采集被监控群组的实时会话数据，并基于所述实时会话数据，绘制所述被监控群组的情绪曲线；按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线；当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员；对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息；根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。本发明实现了对微信群中的语音信息进行恶意信息的识别，以及对利用微信群进行恐吓威胁等行为的识别，保护了微信群的安全。
73.如图2所示，一种识别恶意语音信息的装置，所述装置包括：
74.采集模块，用于采集被监控群组的实时会话数据。
75.分析模块，用于基于所述实时会话数据，绘制所述被监控群组的情绪曲线；按照参与会话人员将所述实时会话数据进行拆分，得到每一个所述参与会话人员的会话数据，基于各所述会话人员的会话数据，绘制所述会话人员的情绪曲线；当所述被监控群组中存在会话人员的情绪曲线与所述被监控群组的情绪曲线的偏差大于预设偏差值时，将所述会话人员作为重点监控人员。
76.判定模块，用于对所述重点监控人员的会话数据进行声纹特征识别，得到所述重点监控人员的声纹特征信息，并利用预置算法从所述重点监控人员的会话数据中抽取语料特征信息。
77.根据预设安全规则，对所述重点监控人员的声纹特征信息和所述语料特征信息进行安全检查，确定所述重点监控人员的声纹特征信息和所述语料特征信息中是否包含恶意信息或恶意语气，其中所述预设安全规则中包括文字和语气中至少一种类型的规则。
78.进一步地，所述分析模块，具体用于按照所述实时会话数据的时间顺序，对所述实时会话数据进行语调识别，根据所述语调识别结果，确定所述实时会话数据中的情绪状态，所述情绪状态包括平静、高兴、难过、生气和害怕，
79.根据所述情绪状态，按照所述实时会话数据的时间顺序绘制所述被监控群组的情绪曲线，其中分别设置所述情绪状态中的各个状态的预设值。
80.此外，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述技术方案中任一项所述的方法的步骤。
81.本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述技术方案中任一项所述的方法的步骤。
82.在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。
83.本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
84.在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。
85.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
86.另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
87.所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。
88.基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过
计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括是电载波信号和电信信号。
89.以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。
90.以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：利用对抗网络的高保真度语音合成的制作方法

一种识别恶意语音信息的方法、装置、介质和设备

相关文献

最热文献