一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于语音转录与知识图谱的调度指令质检方法及系统与流程

2022-03-16 12:48:39 来源:中国专利 TAG:

技术特征:
1.一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,包括:对电网调度系统产生的历史调度指令信息标准化,构建调度系统知识图谱;确定调度指令录音文件所属的方言类型,将调度指令录音文件输入至训练好的相应方言类型的语音转录模型,将录音文件转化为文本格式的文件;将文本格式的文件与调度系统知识图谱进行匹配,修正文本中的转录错误,最终得到修正后的语音转录文本。2.如权利要求1所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,构建调度系统知识图谱的过程包括:通过检索相关文献梳理调度相关术语,生成调度系统共词矩阵,对文献信息进行聚类分析,降低共词矩阵维数;将共词矩阵可视化为共词网络,基于蚁群算法将相似术语合并,简化共词网络;以聚类模块值和轮廓值来评估图谱聚类效果,选择剪枝后聚类效果最佳的网络图谱,形成调度系统知识图谱。3.如权利要求2所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,所述聚类模块值具体为:其中,e
ii
为集群i内所有的边数占整个网络所有边数的比值;a
i
为经过集群i内所有节点的边数占整个网络的所有边数的比值;q(i)值在0~1之间,其值越接近1,表示划分网络结构的强度越高。4.如权利要求2所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,所述轮廓值具体为:其中,a(i)为内聚度,即i到同簇其他样本的平均距离;b(i)为分离度,即i到其他类簇的所有样本的平均距离;s(i)接近1,则说明样本i聚类合理轮廓越明显。5.如权利要求1所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,对于语音转录模型的训练过程包括:获取不同地域的历史调度指令录音文件,将录音文件转换成文本格式的文件,形成总样本库;将总样本库按照方言地区和普通话地区进行拆分,形成多个子样本库;分别用子样本库训练语音转录模型,形成多个训练完毕的子语音转录模型;根据新产生的录音所在地域,用对应的训练完毕的子语音转录模型进行转录,形成文本格式的文件。6.如权利要求1所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,将文本格式的文件与调度系统知识图谱进行匹配,修正文本中的转录错误,具体包括:运用对数似然比算法,评估一个词与调度场景类别词的相关程度,提取出具有类别区分能力的标签词;根据标签词,确定录音文件对应的调度场景;根据调度场景,与对应场景的调度系统知识图谱匹配,根据知识图谱里面的调度命令
对文本文件进行修正。7.如权利要求6所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,运用对数似然比算法,评估一个词与调度场景类别词的相关程度,具体包括:假设h1表示元素x1、x2之间是相互独立的;h2表示元素x1、x2之间具有相关性;分别求取h1和h2的似然值l(h1)、l(h2);其中,x1为某一词语,x2为调度场景类别词;基于所述似然值确定x1和x2的关联程度,当关联程度大于阈值时,表明x1为具有类别区分能力的标签词。8.如权利要求1所述的一种基于语音转录与知识图谱的调度指令质检方法,其特征在于,每当有新的录音产生,通过训练过后的语音转录模型转录成文本格式的文件,并经调度系统知识图谱修正后,形成最终的文本格式文件,将其与录音文件一起加入对应的子样本库,持续训练子语音转录模型。9.一种基于语音转录与知识图谱的调度指令质检系统,其特征在于,包括:知识图谱构建模块,用于对电网调度系统产生的历史调度指令信息标准化,构建调度系统知识图谱;文件转化模块,用于确定调度指令录音文件所属的方言类型,将调度指令录音文件输入至训练好的相应方言类型的语音转录模型,将录音文件转化为文本格式的文件;文本修正模块,用于将文本格式的文件与调度系统知识图谱进行匹配,修正文本中的转录错误,最终得到修正后的语音转录文本。10.一种终端设备,其包括处理器和存储器,处理器用于实现各指令;存储器用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行权利要求1-8任一项所述的基于语音转录与知识图谱的调度指令质检方法。

技术总结
本发明公开了一种基于语音转录与知识图谱的调度指令质检方法及系统,包括:对电网调度系统产生的历史调度指令信息标准化,构建调度系统知识图谱;确定调度指令录音文件所属的方言类型,将调度指令录音文件输入至训练好的相应方言类型的语音转录模型,将录音文件转化为文本格式的文件;将文本格式的文件与调度系统知识图谱进行匹配,修正文本中的转录错误,最终得到修正后的语音转录文本。本发明将调度录音语音转文字格式,通过与知识图谱进行匹配,形成修正后的文本格式文件;根据不同方言地区转录对应区域录音文件,同时结合调度场景,匹配调度指令知识图谱,提高转录准确率,有效提高电网调度故障回溯效率、准确度。准确度。准确度。


技术研发人员:卞若晨 翟启 张延童 孙丽丽 翟洪婷 臧丽炜 田兵 李冬 张庆锐 杨坤 卜宪德 罗威 权玮虹 毛恒 张化代 张茜 李青 孟祥鹿
受保护的技术使用者:国家电网有限公司
技术研发日:2021.12.02
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献