一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种安全作业监管方法、设备和存储介质与流程

2021-07-16 20:22:00 来源:中国专利 TAG:校核 作业 监管 方法 设备


1.本发明涉及安全校核技术领域,尤其涉及一种安全作业监管方法、设备和存储介质。


背景技术:

2.传统配网调度操作采用声纹识别技术进行安全识别,每个人在说话过程中,由于每个人都有自己的一套发声器官,在发音器官发育成熟后,其解剖结构和生理状态是稳定不变的,因此每个人的语音特征基本稳定,并且由于个人身体状况、情绪等因素的影响,在进行声纹认证时,不能完全保持人的正常发声状态,导致采用声纹识别技术进行安全识别的过程中准确度造成影响。


技术实现要素:

3.本发明目的在于,提供一种安全作业监管方法、设备和存储介质,针对传统的声纹识别技术进行改进,对输入的声音信息进行恢复处理,解决了电网操作过程中安全识别度不高的问题。
4.为实现上述目的,本发明提供一种安全作业监管方法,包括:
5.输入声音信息,构建声纹识别库;
6.录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作;
7.根据拓扑分析和潮流计算对所述电网操作进行约束,实现所述电网操作的安全校核。
8.优选地,所述录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,包括:
9.所述新的声音信息与所述声纹识别库包括隐含编码,根据所述隐含编码提取对应的声纹信息,构建所述新的声音信息s和所述声纹识别库中的声音信息t的对数函数logh(s|t),如下:
[0010][0011]
式中,s为所述新的声音信息,t为所述声纹识别库中的声音信息,n为所述新的声音信息的字数,s
i
为输入的所述新的声音信息的第i个字。
[0012]
优选地,所述录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,包括:
[0013]
将所述新的声音信息与所述声纹识别库进行调度,获取调度后的声音信息f',如
下:
[0014][0015]
式中,a1为所述新的声音信息的音高的最高点,a2为所述新的声音信息的音高的最低点,b为所述新的声音信息的音强,c为所述新的声音信息的音长的均值,a1为所述声纹识别库中的声音信息的音高的最高点,a2为所述声纹识别库中的声音信息的音高的最低点,b为所述声纹识别库中的声音信息的音强,c为所述声纹识别库中的声音信息的音长的均值,a
i
,b
i
,c
i
分别为所述调度后的声音信息f'的音强、音长以及音高。
[0016]
优选地,所述录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,包括:
[0017]
将所述调度后的声音信息f'输入所述预设的cnn模型进行训练,在训练的过程中计算一个嵌入声音a,根据所述嵌入声音a产生两个嵌入,包括相同说话者嵌入声音b与不同说话者嵌入声音d,若所述a与b的声音相似度高于所述a与d的声音相似度,获取声音恢复信息,否则,声音恢复失败。
[0018]
优选地,所述录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,包括:
[0019]
在训练过程中的损失函数l如下:
[0020][0021]
式中,为a与b的声音相似度,为a与d的声音相似度,α为训练参数,n(i=0,1,...,n)为音节总数。
[0022]
优选地,所述录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,包括:
[0023]
根据所述声音恢复信息与所述提取对应的声纹信息进行匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作。
[0024]
优选地,所述根据拓扑分析和潮流计算对所述电网操作进行约束,实现所述电网操作的安全校核,包括:
[0025]
所述拓扑分析包括,根据电网中设备的实时状态,采用节点开关表和拓扑连接关系进行节点之间连接关系的检测;
[0026]
所述潮流计算对节点注入量进行分析,如下:
[0027][0028]
式中,u
i
为节点,p
i
为第i台设备有功时的负荷功率,q
i
为第i台设备无功时的负荷功率,u
i
为第i台设备的电压模值,σ为节点相角,n为设备数,根据所述拓扑分析和潮流计算相结合,实现电网安全校核。
[0029]
优选地,所述根据拓扑分析和潮流计算对所述电网操作进行约束,实现所述电网操作的安全校核,包括:
[0030]
采用三维可视化技术对所述电网操作的安全校核进行展示。
[0031]
本发明还提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的安全作业监管方法。
[0032]
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一实施例所述的安全作业监管方法。
[0033]
本发明首先通过构建声纹识别库,再将新输入的声音信息输入cnn模型中进行训练,进行声音恢复训练,获取训练结果,将与声纹识别库进行匹配,提高安全识别的准确度。
附图说明
[0034]
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]
图1是本发明某一实施例提供的安全作业监管方法的流程示意图;
[0036]
图2是本发明另一实施例提供的安全作业监管方法的流程示意图。
具体实施方式
[0037]
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0038]
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
[0039]
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0040]
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0041]
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0042]
请参阅图1和图2,本发明提供一种安全作业监管方法,包括:
[0043]
s101、输入声音信息,构建声纹识别库。
[0044]
具体的,由于每个人说话的声音不同,在进行声纹识别前,首先让需要进行声纹识别的员工,按规定的文本稿件录入声纹信息,文本稿件以一定规则进行设定,并且每个人的文本信息各不相同,例如以个人的姓名加工号进行输入,录入完成后将信息存储至数据库中,形成声纹识别库。
[0045]
s102、录入新的声音信息,根据预设的cnn模型进行训练,获取声音恢复信息,将所
述声音恢复信息与所述声纹识别库进行语音匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作。
[0046]
具体的,在进行声纹识别的过程中,工作人员以各自的文本稿件信息进行声纹信息的输入,声纹系统首先根据信息内容利用lstm网络从数据库中提取出对应的声纹信息,由于数据库中信息与新输入的声纹信息表达的是同一个意思,因此存在一个隐含编码h,与二者信息相对应,新的声音信息与声纹识别库包括隐含编码,根据隐含编码提取对应的声纹信息,如下:
[0047][0048]
式中,s为新的声音信息,t为声纹识别库中的声音信息,n为新的声音信息的字数,s
i
为输入的新的声音信息的第i个字。
[0049]
在声音信息中,声音的音质、音长、音强以及音高决定了声音的独特性,一般情况下,人的声音产生变化时,会在其音强、音长、音高方面发生改变,而不改变其音质因素,在将新的声音信息转化成声纹波形图之前,将新的声音信息设置为x1,将数据库中提取出的声纹信息提取为x2,从声音信息x1中,提取音高的最高点a1以及最低点a2,音强b,并求取音长的均值c,与声纹信息x2的音高的最高点a1以及最低点a2,音强b,以及音长的均值c进行比较,将声音信息x1调度至与声纹信息x2基本相同,其调度的计算方法如下所示:
[0050][0051]
式中,a1为新的声音信息的音高的最高点,a2为新的声音信息的音高的最低点,b为新的声音信息的音强,c为新的声音信息的音高的音长的均值,a1为声纹识别库中的声音信息的音高的最高点,a2为声纹识别库中的声音信息的音高的最低点,b为声纹识别库中的声音信息的音强,c为声纹识别库中的声音信息的音高的音长的均值,a
i
,b
i
,c
i
分别是调度后的声音信息f'的音强、音长以及音高。
[0052]
再将调整后的信息输入cnn网络模型进行声纹识别的验证,在训练过程中,将调度后的声音信息f'输入预设的cnn模型进行训练,在训练的过程中计算一个嵌入声音a,根据嵌入声音a产生两个嵌入,包括相同说话者嵌入声音b与不同说话者嵌入声音d,若a与b的声音相似度高于a与d的声音相似度,获取声音恢复信息,否则,声音恢复失败。
[0053]
在训练过程中的损失函数如下:
[0054][0055]
式中,为a与b的声音相似度,为a与d的声音相似度,α为训练参数,n(i=0,1,...,n)为音节总数。
[0056]
将原始语音图谱进行转换后,顺序进入长短期记忆网络(lstm)、声纹信息恢复、卷积神经网络(cnn),结合网络进行训练以及声纹特征学习,通过对比cnn、lstm以及dnn网络,验证cnn

lstm网络在声纹识别中具有较少迭代次数情况下高准确率的特性。
[0057]
s103、根据拓扑分析和潮流计算对所述电网操作进行约束,实现所述电网操作的安全校核。
[0058]
具体的,系统以安全监控系统为核心,融合快速的安全分析软件,对人员的安全识别和调度操作指令进行分析,该系统利用拓扑分析和潮流计算实现对每步操作的安全性校核,软件自动实现工作人员的人员校核以及对操作票的预演,形成操作后的模拟电网潮流分布,自动进行“n

1”安全校核以发现安全隐患。
[0059]
通过基于拓扑与潮流的操作票安全校核,对操作进行约束,首先根据电网系统建立拓扑关系,由于每种设备都具有一个或多个端点,因此将设备分为单端元件、两端元件以及多端元件,两设备相连表示他们之间的一个端点相连接,并将连接点称为节点,在系统中,除了独立设备外都会与一个或多个设备相连接,具有一个或多个节点,因此根据设备与节点之间的关系建立整个系统的拓扑连接,另一方面,系统中还包括具有开合特点的设备可以控制连通关系的改变,可以根据开关设备形成开关表,连接相连设备,在进行拓扑分析时,根据设备的实时状态,从电网电源处开始搜索,利用节点开关表和拓扑连接关系,检测连接配合的安全问题,但是拓扑分析仅仅能检测出节点之间的连接问题,对于节点的运行状态具体变化并不能进行细致分析,因此还需要对电网系统进行潮流分析,计算节点注入量。
[0060]
根据声音恢复信息与提取对应的声纹信息进行匹配,若匹配成功则进入电网操作,若匹配不成功,终止操作,拓扑分析包括,根据电网中设备的实时状态,采用节点开关表和拓扑连接关系进行节点之间连接关系的检测。
[0061]
潮流计算对节点注入量进行分析,如下:
[0062][0063]
式中,u
i
为节点,p
i
为第i台设备有功时的负荷功率,q
i
为第i台设备无功时的负荷功率,u
i
为第i台设备的电压模值,σ为节点相角,n为设备数,根据拓扑分析和潮流计算相结合,实现电网安全校核。
[0064]
采用三维可视化技术对操作后的电网安全水平进行展示,为了能使调度员更及时,更清晰的辨别出在调度操作中运行的先后顺序,将可视化技术应用在本发明中,可视化可以对整个作业过程的安全校核进行直观展示,以便调度员迅速识别对调度操作过程中的电网的安全情况有一个整体和宏观的把握,针对与安全相关的数据,在人机界面中,在这几种可视化表达方式和传统的二维主接线图显示方式之间灵活切换。
[0065]
本发明在传统的声纹识别技术上进行改进,结合lstm和cnn网络模型,并对输入的声纹信息进行恢复处理,避免了工作人员由于个人原因造成的声音变化,提高安全识别的准确度,结合工作人员身份识别的安全系统与调度操作票的安全校核,提高安全防控能力,由于语音中通常包含具有个性声音的空间特征,和说话语段之间的时序特征,单独的网络结构无法将两种特征进行提取,将cnn和lstm结合,并在声纹识别的数据库中进行验证,通过语谱图的空间特征和时序特征对模型效果的影响,以及cnn

lstm网络的识别准确率和损失值。
[0066]
在一实施例中,选取传统不经过声音信息调整的cnn、lstm、dnn网络以及cnn

lstm网络与经过声音调整的cnn

lstm网络进行对比。
[0067]
请参照表1,为了保障实验的科学性,保持语音录入时与周围环境噪声的信噪比在15db以上,使用麦克风作为声音采集设备,并且在数据库录入时,语音时长为5s,进行实验
时,随机选取50名20岁以上的成年人进行测试,其中男女比例为5:5,让50名测试人员,分别以正常语调、快速说话、慢速说话、多鼻音说话四种声音参与实验,以匹配度为0.8作为匹配合格标准,分别验证各个方法声纹匹配的准确度。
[0068]
表1对比的实验结果
[0069][0070]
从表格可以看出,本发明在经过调整后的声音准确率最高,达到0.915的效果。
[0071]
本发明结合的网络模型学习声纹识别特征及对其进行身份认证,包括语音输入、语音恢复处理和语音识别,声纹识别是根据语音中所蕴含的说话人的个性特征去识别该段语音所含说话人身份的过程,以达到对现场受令身份人员闻声识人的技术要求。由于语音中通常包含具有个性声音的空间特征,和说话语段之间的时序特征,单独的网络结构无法将两种特征进行提取,将cnn和lstm结合,并在声纹识别的数据库中进行验证,通过语谱图的空间特征和时序特征对模型效果的影响,以及cnn

lstm网络的识别准确率和损失值,本发明在传统的声纹识别技术上进行改进,结合lstm和cnn网络模型,并对输入的声纹信息进行恢复处理,避免了工作人员由于个人原因造成的声音变化,提高安全识别的准确度,结合工作人员身份识别的安全系统与调度操作票的安全校核,提高安全防控能力。
[0072]
本发明提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与处理器耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施例中的安全作业监管方法。
[0073]
处理器用于控制该计算机终端设备的整体操作,以完成上述的安全作业监管方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(static random access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read

only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read

only memory,简称eprom),可编程只读存储器(programmable read

only memory,简称prom),只读存储器(read

only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。
[0074]
在一示例性实施例中,计算机终端设备可以被一个或多个应用专用集成电路(application specific 1ntegrated circuit,简称as1c)、数字信号处理器(digital signal processor,简称dsp)、数字信号处理设备(digital signal processing device,简称dspd)、可编程逻辑器件(programmable logic device,简称pld)、现场可编程门阵列(field programmable gate array,简称fpga)、控制器、微控制器、微处理器或其他电子元
件实现,用于执行上述的安全作业监管方法,并达到如上述方法一致的技术效果。
[0075]
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的安全作业监管方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的安全作业监管方法,并达到如上述方法一致的技术效果。
[0076]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜