一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种提高语音识别精准性的方法和装置与流程

2021-06-04 13:19:00 来源:中国专利 TAG:语音识别 精准 装置 提高 方法


1.本发明涉及语音识别技术领域,尤其涉及一种提高语音识别精准性的方法和装置。


背景技术:

2.随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生,其中,语音数据受到了人们越来越多的重视,也逐渐进入工业、家电、通信、消费电子产品等各个领域,在我们实际生活中也有着越来越广阔的发展前景和应用领域。
3.但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
4.受外部环境及自身局限性等因素的影响,无法对语音进行精准识别,使得语音识别得出的结果与实际的语音内容存在很大的差异。


技术实现要素:

5.本申请实施例通过提供一种提高语音识别精准性的方法和装置,解决了现有的无法对语音进行精确识别的技术问题,达到了通过建立强大的语音识别数据库,同时结合具体的语境,提高语音识别精准性的技术效果。
6.本申请实施例提供了一种提高语音识别精准性的方法,其中,所述方法还包括:获得第一用户的第一语音信息;根据所述第一语音信息,获得第一识别结果;通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获得所述第一用户与所述第二用户的第一亲密度信息;获得预设语音识别数据库;根据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识别语境及第一语境信息集;根据所述第一识别语境及所述第一语境信息集,获得第一调整指令;根据所述第一调整指令对所述第一识别结果进行调整。
7.另一方面,本申请还提供了一种提高语音识别精准性的装置,其中,所述装置包括:第一获得单元:所述第一获得单元用于获得第一用户的第一语音信息;第二获得单元:所述第二获得单元用于根据所述第一语音信息,获得第一识别结果;第三获得单元:所述第三获得单元用于通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;第一判断单元:所述第一判断单元用于判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;第四获得单元:所述第四获得单元用于如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获得所述第一用户与所述第二用户的第一亲密度信息;第五获得单元:所述第五获得单元用于获得预设语音识别数据库;第一确定单元:所述第一确定单元用于根
据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识别语境及第一语境信息集;第六获得单元:所述第六获得单元用于根据所述第一识别语境及所述第一语境信息集,获得第一调整指令;第一调整单元:所述第一调整单元用于根据所述第一调整指令对所述第一识别结果进行调整。
8.本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
9.通过根据所述监控设备获得距离范围之内的视频信息,进而根据视频信息获得所述第一用户讲话的场景信息,并结合具体的语音识别数据库对所述第一语音信息进行调整并智能识别,达到了提高语音识别精准性的技术效果。
10.上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
11.图1为本申请实施例一种提高语音识别精准性的方法的流程示意图;
12.图2为本申请实施例一种提高语音识别精准性的装置的结构示意图;
13.图3为本申请实施例示例性电子设备的结构示意图。
14.附图标记说明:第一获得单元11,第二获得单元12,第三获得单元13,第一判断单元14,第四获得单元15,第五获得单元16,第一确定单元17,第六获得单元18,第一调整单元19,总线300,接收器301,处理器302,发送器303,存储器304,总线接口305。
具体实施方式
15.本申请实施例通过提供一种提高语音识别精准性的方法和装置,解决了现有的无法对语音进行精确识别的技术问题,达到了通过建立强大的语音识别数据库,同时结合具体的语境,提高语音识别精准性的技术效果。
16.下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
17.申请概述
18.随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生,其中,语音数据受到了人们越来越多的重视,也逐渐进入工业、家电、通信、消费电子产品等各个领域,在我们实际生活中也有着越来越广阔的发展前景和应用领域。受外部环境及自身局限性等因素的影响,无法对语音进行精准识别,使得语音识别得出的结果与实际的语音内容存在很大的差异。
19.针对上述技术问题,本申请提供的技术方案总体思路如下:
20.本申请实施例提供了一种提高语音识别精准性的方法,其中,所述方法还包括:获得第一用户的第一语音信息;根据所述第一语音信息,获得第一识别结果;通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获
得所述第一用户与所述第二用户的第一亲密度信息;获得预设语音识别数据库;根据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识别语境及第一语境信息集;根据所述第一识别语境及所述第一语境信息集,获得第一调整指令;根据所述第一调整指令对所述第一识别结果进行调整。
21.为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
22.实施例一
23.如图1所示,本申请实施例提供了一种提高语音识别精准性的方法,其中,所述方法还包括:
24.步骤s100:获得第一用户的第一语音信息;
25.具体而言,所述第一用户为讲话的用户,所述第一语音信息为所述第一用户讲话的语音信息,包括讲话内容、讲话音量、讲话音色等信息,进而对所述第一语音信息进行识别。
26.步骤s200:根据所述第一语音信息,获得第一识别结果;
27.具体而言,已知所述第一语音信息,可对所述第一语音信息进行识别,所述第一识别结果为根据所述第一语音信息识别到的结果,所述第一识别结果包括识别到的内容,以及识别到的内容是否准确等。
28.步骤s300:通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;
29.具体而言,所述监控设备安装在所述第一用户的周围,所述第一视频信息为拍摄到的所述第一用户的第一预设距离范围内的视频信息,进一步可理解为距离所述第一用户方圆五米之内的距离范围,所述第一预设距离范围根据具体情况而定,在此不做详细阐述。
30.步骤s400:判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;
31.具体而言,所述第二用户区别于所述第一用户,判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为,即判断所述第一用户和所述第二用户是否同时出现在所述第一视频信息中,以及所述第一用户和所述第二用户是否正在讲话等。
32.步骤s500:如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获得所述第一用户与所述第二用户的第一亲密度信息;
33.具体而言,所述第一亲密度信息为所述第一用户与所述第二用户之间的亲密度信息,可根据二者的讲话内容、讲话表情、讲话姿态、讲话语气等信息进行判断,当所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,则可获得所述第一用户与所述第二用户的第一亲密度信息。
34.步骤s600:获得预设语音识别数据库;
35.具体而言,所述预设语音识别数据库为预设的各种情景、各种场合通话的语音识别数据库,进一步可理解为开会时,可能会有汇报、总结、方案等字眼信息,以及相应的氛围会比较正式等。
36.步骤s700:根据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识
别语境及第一语境信息集;
37.具体而言,所述第一识别语境为对对话的场景进行确定,确定是开会或是上课学习等,所述第一语境信息集为所述第一识别语境对应的信息集,包括各类有关所述第一识别语境的信息,进一步可理解为当场景是开会时,所述第一语境信息集包括各种会议信息集,小到部门会议,大到群体会议等。
38.步骤s800:根据所述第一识别语境及所述第一语境信息集,获得第一调整指令;
39.具体而言,所述第一调整指令为对所述第一识别结果进行调整,可根据所述第一识别语境及所述第一语境信息集进行调整,使得所述第一识别结果更加准确、更加贴合语境等。
40.步骤s900:根据所述第一调整指令对所述第一识别结果进行调整。
41.具体而言,已知所述第一调整指令,进而根据所述第一调整指令对所述第一识别结果进行调整,进一步可理解为,当一酒厂企业开会时讲到天长地久,则根据具体语境应理解为天尝地酒,应将天尝地酒作为识别结果进行输出。
42.所述获得第一用户的第一语音信息之后,步骤s100还包括:
43.步骤s110:获得所述音频采集装置中第一麦克风的第一属性信息;
44.步骤s120:根据所述第一语音信息,获得所述第一用户的第一语音特征信息;
45.步骤s130:获得所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度;
46.步骤s140:判断所述第一匹配适合度是否满足预设匹配度阈值;
47.步骤s150:如果不满足所述预设匹配度阈值,则根据预设匹配度阈值进行匹配运算之后,获得第一运算结果及第二调整指令;
48.步骤s160:根据所述第二调整指令,按照所述第一运算结果对所述第一属性信息进行调整。
49.具体而言,为了对所述第一语音信息进行精准识别,还可确保所述第一用户讲话使用的音频采集装置工作正常,则获得所述音频采集装置中第一麦克风的第一属性信息,所述第一属性信息包括所述第一麦克风的语速、音量、音调等信息,还可根据所述第一语音信息,获得所述第一用户的第一语音特征信息,所述第一语音特征信息为所述第一用户讲话的音量、音调、音色等信息,进而获得所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度,所述第一匹配适合度为所述第一语音特征信息与所述第一属性信息之间的匹配度信息,并判断所述第一匹配适合度是否满足预设匹配度阈值,即所述第一匹配适合度是否满足预期的匹配值,如果不满足所述预设匹配度阈值,则根据预设匹配度阈值进行匹配运算之后,获得第一运算结果及第二调整指令,所述第一运算结果为根据所述预设匹配度阈值对所述第一匹配适合度进行矫正之后的运算结果,所述第二调整指令为根据所述第一运算结果对所述第一属性信息进行调整,具体可理解为,当所述第一用户为男性讲话时,因男性自身声音比较洪亮,所述第一麦克风的属性较好,音量较高,则当所述第一用户讲话时,会因音量过大导致破音、杂音等现象,不利于音频采集,语音识别等,则应对所述第一属性现象进行调整,使得输出的语音正常可识别,通过根据用户的语音特征信息对所述第一麦克风的属性信息进行调整,达到了使得输出的语音信息清晰,内容清楚,精准识别语音的技术效果。
50.所述获得所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度,步骤s130还包括:
51.步骤s131:将所述第一属性信息、第一语音特征信息输入第一训练模型,其中,所述第一训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一属性信息、第一语音特征信息和用来标识匹配适合度等级的标识信息;
52.步骤s132:获得所述第一训练模型的输出信息,其中,所述输出信息包括所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度信息。
53.具体而言,通过将所述第一属性信息、第一语音特征信息输入第一训练模型不断地进行训练,可以使得输出的训练结果更加精确。所述训练模型是一个神经网络模型即机器学习中的神经网络模型,神经网络(neural networks,nn)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂神经网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络模型是以神经元的数学模型为基础来描述的。人工神经网络(artificial neural networks),是对人类大脑系统的一阶特性的一种描述。简单地讲,它是一个数学模型。在本申请实施例中,将所述第一属性信息、第一语音特征信息输入第一训练模型,用标识的匹配适合度等级信息对所述神经网络模型进行训练。
54.进一步来说,所述训练神经网络模型的过程实质为监督学习的过程。所述多组训练数据具体为:所述第一属性信息、第一语音特征信息和用来标识匹配适合度等级的标识信息。通过输入所述第一属性信息、第一语音特征信息,神经网络模型会输出所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度信息,通过将所述输出信息与所述起标识作用的匹配适合度等级信息进行校验,如果所述输出信息与所述起标识作用的匹配适合度等级信息要求相一致,则本数据监督学习完成,则进行下一组数据监督学习;如果所述输出信息与所述起标识作用的匹配适合度等级信息要求不一致,则神经网络学习模型自身进行调整,直到神经网络学习模型输出结果与所述起标识作用的匹配适合度等级信息要求相一致,进行下一组数据的监督学习。通过训练数据使神经网络学习模型自身不断地修正、优化,通过监督学习的过程来提高神经网络学习模型处理所述信息的准确性,进而达到使得所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度信息更加精确的技术效果。
55.所述获得第一用户的第一语音信息之前,本申请实施例还包括:
56.步骤s1010:获得所述第一用户所处的周围环境信息;
57.步骤s1020:判断所述周围环境信息是否满足第一预设条件;
58.步骤s1030:如果满足所述第一预设条件,获得所述语音识别系统所处的网络环境信息;
59.步骤s1040:判断所述网络环境信息是否满足接收所述第一用户的语音信号的需求;
60.步骤s1050:如果不满足接收所述第一用户的语音信号的需求,获得第一检修指令;
61.步骤s1060:根据所述第一检修指令,对所述网络环境进行检修之后,接收所述第一用户输入的第一语音信息。
62.具体而言,在获得第一用户的第一语音信息之前,还可确保所述第一用户周围环境信息正常,不会对所述第一语音信息产生影响,判断所述周围环境信息是否满足第一预设条件,即当周围存在施工时,噪音会对所述第一语音信息产生影响,需要确保周围环境信息不会对所述第一用户的讲话造成干扰,如果满足所述第一预设条件,即周围环境信息不会对所述第一用户的讲话造成干扰,获得所述语音识别系统所处的网络环境信息,所述网络环境信息包含网络是否通畅,网络速度快慢等信息,进而判断所述网络环境信息是否满足接收所述第一用户的语音信号的需求,即确保所述网络环境信息要满足所述语音信号的接收,如果不满足接收所述第一用户的语音信号的需求,获得第一检修指令,所述第一检修指令为对所述网络环境进行检修之后,接收所述第一用户输入的第一语音信息,通过确保所述第一用户周围环境信息正常,不会对所述第一语音信息产生影响,达到了更好的接收所述第一用户的语音信息,进而对所述语音信息进行精准识别的技术效果。
63.为了提高所述第一用户的语音识别精准性,本申请实施例还包括:
64.步骤s1110:如果所述第一视频信息中不包括所述第二用户时,判断所述第一用户是否使用第一电子设备;
65.步骤s1120:如果所述第一用户使用所述第一电子设备时,将所述第一电子设备与所述语音识别系统相关联之后,获得所述第一电子设备的应用软件使用信息;
66.步骤s1130:根据所述应用软件使用信息,从所述预设语音识别数据库中,确定第二识别语境及第二语境信息集;
67.步骤s1140:根据所述第二识别语境及所述第二语境信息集,获得第二调整指令;
68.步骤s1150:根据所述第二调整指令对所述第一识别结果进行调整。
69.具体而言,在判断所述第一视频信息中是否包括第二用户时,如果所述第一视频信息中不包括所述第二用户,即所述第一视频信息中只包含所述第一用户,则判断所述第一用户是否使用第一电子设备,所述第一电子设备包括是否使用相关语音通话软件,例如使用outlook进行会议、facetime通话等,如果所述第一用户使用所述第一电子设备,则将所述第一电子设备与所述语音识别系统进行关联,进而获得所述第一电子设备的应用软件使用信息,所述应用软件信息为包括可以进行远程会议的软件等,进而根据所述应用软件使用信息,从所述预设语音识别数据库中,确定第二识别语境及第二语境信息集,所述第二识别语境及第二语境信息集为根据所述第一用户的通话内容及所述预设语言识别数据库所得,还可根据所述第二识别语境及所述第二语境信息集,获得第二调整指令,所述第二调整指令为对所述第一识别结果进行调整,通过将所述第一电子设备与所述语音识别系统进行相关联,进而对所述第一识别结果进行调整,达到了提高语音识别精准性的技术效果。
70.为了确保所述第一语音信息的完整连贯,本申请实施例还包括:
71.步骤s1210:根据所述第一调整指令对所述第一识别结果进行调整时,判断所述第一语音信息中的每一句话是否为连贯句子;
72.步骤s1220:如果为非连贯句子,获得第一调取指令;
73.步骤s1230:根据所述第一调取指令,调取第一语句和第二语句,其中,所述第一语句为所述非连贯语句之前的语句信息,所述第二语句为所述非连贯语句之后的语句信息;
74.步骤s1240:根据所述第一语句和第二语句,对所述非连贯句子进行语音识别之后,获得所述非连贯句子对应的第二识别结果。
75.具体而言,为了确保所述第一语音信息的完整连贯,还可根据所述第一调整指令对所述第一识别结果进行调整时,判断所述第一语音信息中的每一句话是否为连贯句子,即需要保证每一句话均为连贯语句,如果为非连贯句子,获得第一调取指令,所述第一调取指令为调取第一语句和第二语句,所述第一语句为所述非连贯语句之前的语句信息,所述第二语句为所述非连贯语句之后的语句信息,进而根据所述第一语句和第二语句,对所述非连贯句子进行语音识别,即通过分析前后语句对所述非连贯句子进行补充,使其连贯起来,进而获得所述非连贯句子对应的第二识别结果,通过对非连贯语句进行补充,使其变得完整,达到了确保所述第一语音信息的完整连贯性,进而提高语音识别精准性的技术效果。
76.所述根据所述第一调整指令对所述第一识别结果进行调整之后,步骤s900还包括:
77.步骤s910:判断调整之后的所述第一识别结果中是否包括所述第一用户的第一隐私信息;
78.步骤s920:如果包括所述第一隐私信息,则根据所述第一隐私信息生成第一验证码,其中,所述第一验证码是与所述第一隐私信息一一对应的;
79.步骤s930:根据第二隐私信息和第一验证码生成第二验证码;以此类推,根据第n隐私信息和第n

1验证码生成第n验证码,其中,n为大于1的自然数;
80.步骤s940:将所有隐私信息和验证码分别复制保存在m台设备上,其中,m为大于1的自然数。
81.具体而言,为了保护所述第一语音信息的内容隐私,在根据所述第一调整指令对所述第一识别结果进行调整之后,判断所述第一识别结果中是否包括所述第一用户的第一隐私信息,所述第一隐私信息为所述第一语音信息中的内容隐私,可理解为包括所述第一用户提及到的银行卡号、账户密码等信息,如果所述第一识别结果中包括所述第一用户的第一隐私信息,可对隐私信息进行基于区块链的加密处理,确保隐私信息的存储安全以及不被篡改。
82.可根据所述第一隐私信息生成第一验证码,其中,所述第一验证码是与所述第一隐私信息一一对应的;根据第二隐私信息和第一验证码生成第二验证码;以此类推,根据第n隐私信息和第n

1验证码生成第n验证码,其中,n为大于1的自然数;将所有隐私信息和验证码分别复制保存在m台设备上,其中,m为大于1的自然数。对所述第一用户的隐私信息进行加密存储,其中,每个设备对应于一个节点,所有节点组合起来形成了区块链,这样的区块链就构成了一个便于验证(只要验证最后一个区块的hash值就相当于验证了整个版本),不可更改(任何一个交易信息的更改,会让所有之后的区块的hash值发生变化,这样在验证时就无法通过)的总账本。
83.区块链系统采用分布式数据形式,让每一个参与节点都能够获得一份完整的数据库备份,除非能够同时控制整个系统中51%的节点,否则单个节点对数据库的修改是无效的,也无法影响其他节点上的数据内容。因此,参与系统中的节点越多,算力越强,系统中的数据安全性也就越高。对所述第一用户的隐私信息基于区块链的加密处理,有效保证了所述第一用户的隐私信息的存储安全,达到了对所述第一用户的隐私信息进行安全的记录并保存的技术效果。
84.为了使得对所述第一用户的隐私信息的存储更加高效快速,本申请实施例还包
括:
85.步骤s840:将所述第n隐私信息和第n

1验证码作为第n区块;
86.步骤s850:获得所述第n区块记录时间,所述第n区块记录时间表示第n区块需要记录的时间;
87.步骤s860:根据所述第n区块记录时间,获得所述m台设备中运速最强的第一设备;
88.步骤s870:将第n区块的记录权发送给所述第一设备。
89.具体而言,在对所述第一用户的隐私信息进行基于区块链的加密操作时,为了获得更加高效的运算、存储速率,可获得所述第n区块记录时间,所述第n区块记录时间表示第n区块需要记录的时间;进而根据所述第n区块记录时间,获得所述m台设备中运速最强的第一设备;将第n区块的记录权发送给所述第一设备,进而保证了去中心化区块链系统的安全、有效和稳定运行,能够保证所述区块能够被快速准确的记录在设备中,进而保证了信息的安全性,进而对所述第一用户的隐私信息进行准确的判断,达到了使得对所述第一用户的隐私信息存储记录更加快速和高效的技术效果。
90.综上所述,本申请实施例所提供的一种提高语音识别精准性的方法和装置具有如下技术效果:
91.1、通过根据所述监控设备获得距离范围之内的视频信息,进而根据视频信息获得所述第一用户讲话的场景信息,并结合具体的语音识别数据库对所述第一语音信息进行调整并智能识别,达到了提高语音识别精准性的技术效果。
92.2、通过根据所述第一用户的语音特征信息对麦克风进行调整,在满足普遍需求的基础上,还能满足个性化的需求,并结合实时的网络环境信息,确保所述第一语音信号可被完整接收,以及通过前后语义对不连贯的语句进行串联,确保所述第一语句信息通顺无误,进而达到了提高语音识别精准性的技术效果。
93.实施例二
94.基于与前述实施例中一种提高语音识别精准性的方法同样发明构思,本发明还提供了一种提高语音识别精准性的装置,如图2所示,所述装置包括:
95.第一获得单元11:所述第一获得单元11用于获得第一用户的第一语音信息;
96.第二获得单元12:所述第二获得单元12用于根据所述第一语音信息,获得第一识别结果;
97.第三获得单元13:所述第三获得单元13用于通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;
98.第一判断单元14:所述第一判断单元14用于判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;
99.第四获得单元15:所述第四获得单元15用于如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获得所述第一用户与所述第二用户的第一亲密度信息;
100.第五获得单元16:所述第五获得单元16用于获得预设语音识别数据库;
101.第一确定单元17:所述第一确定单元17用于根据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识别语境及第一语境信息集;
102.第六获得单元18:所述第六获得单元18用于根据所述第一识别语境及所述第一语
境信息集,获得第一调整指令;
103.第一调整单元19:所述第一调整单元19用于根据所述第一调整指令对所述第一识别结果进行调整。
104.进一步的,所述装置还包括:
105.第七获得单元:所述第七获得单元用于获得所述音频采集装置中第一麦克风的第一属性信息;
106.第八获得单元:所述第八获得单元用于根据所述第一语音信息,获得所述第一用户的第一语音特征信息;
107.第九获得单元:所述第九获得单元用于获得所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度;
108.第二判断单元:所述第二判断单元用于判断所述第一匹配适合度是否满足预设匹配度阈值;
109.第十获得单元:所述第十获得单元用于如果不满足所述预设匹配度阈值,则根据预设匹配度阈值进行匹配运算之后,获得第一运算结果及第二调整指令;
110.第二调整单元:所述第二调整单元用于根据所述第二调整指令,按照所述第一运算结果对所述第一属性信息进行调整。
111.进一步的,所述装置还包括:
112.第一输入单元:所述第一输入单元用于将所述第一属性信息、第一语音特征信息输入第一训练模型,其中,所述第一训练模型通过多组训练数据训练获得,所述多组中的训练数据中的每一组训练数据均包括:所述第一属性信息、第一语音特征信息和用来标识匹配适合度等级的标识信息;
113.第十一获得单元:所述第十一获得单元用于获得所述第一训练模型的输出信息,其中,所述输出信息包括所述第一语音特征信息与所述第一属性信息之间的第一匹配适合度信息。
114.进一步的,所述装置还包括:
115.第十二获得单元:所述第十二获得单元用于获得所述第一用户所处的周围环境信息;
116.第三判断单元:所述第三判断单元用于判断所述周围环境信息是否满足第一预设条件;
117.第十三获得单元:所述第十三获得单元用于如果满足所述第一预设条件,获得所述语音识别系统所处的网络环境信息;
118.第四判断单元:所述第四判断单元用于判断所述网络环境信息是否满足接收所述第一用户的语音信号的需求;
119.第十四获得单元:所述第十四获得单元用于如果不满足接收所述第一用户的语音信号的需求,获得第一检修指令;
120.第一检修单元:所述第一检修单元用于根据所述第一检修指令,对所述网络环境进行检修之后,接收所述第一用户输入的第一语音信息。
121.进一步的,所述装置还包括:
122.第五判断单元:所述第五判断单元用于如果所述第一视频信息中不包括所述第二
用户时,判断所述第一用户是否使用第一电子设备;
123.第十五获得单元:所述第十五获得单元用于如果所述第一用户使用所述第一电子设备时,将所述第一电子设备与所述语音识别系统相关联之后,获得所述第一电子设备的应用软件使用信息;
124.第二确定单元:所述第二确定单元用于根据所述应用软件使用信息,从所述预设语音识别数据库中,确定第二识别语境及第二语境信息集;
125.第十六获得单元:所述第十六获得单元用于根据所述第二识别语境及所述第二语境信息集,获得第二调整指令;
126.第三调整单元:所述第三调整单元用于根据所述第二调整指令对所述第一识别结果进行调整。
127.进一步的,所述装置还包括:
128.第六判断单元:所述第六判断单元用于根据所述第一调整指令对所述第一识别结果进行调整时,判断所述第一语音信息中的每一句话是否为连贯句子;
129.第十七获得单元:所述第十七获得单元用于如果为非连贯句子,获得第一调取指令;
130.第一调取单元:所述第一调取单元用于根据所述第一调取指令,调取第一语句和第二语句,其中,所述第一语句为所述非连贯语句之前的语句信息,所述第二语句为所述非连贯语句之后的语句信息;
131.第十八获得单元:所述第十八获得单元用于根据所述第一语句和第二语句,对所述非连贯句子进行语音识别之后,获得所述非连贯句子对应的第二识别结果。
132.进一步的,所述装置还包括:
133.第七判断单元:所述第七判断单元用于判断调整之后的所述第一识别结果中是否包括所述第一用户的第一隐私信息;
134.第一生成单元:所述第一生成单元用于如果包括所述第一隐私信息,则根据所述第一隐私信息生成第一验证码,其中,所述第一验证码是与所述第一隐私信息一一对应的;
135.第二生成单元:所述第二生成单元用于根据第二隐私信息和第一验证码生成第二验证码;以此类推,根据第n隐私信息和第n

1验证码生成第n验证码,其中,n为大于1的自然数;
136.第一保存单元:所述第一保存单元用于将所有隐私信息和验证码分别复制保存在m台设备上,其中,m为大于1的自然数。
137.前述图1实施例一中的一种提高语音识别精准性的方法的各种变化方式和具体实例同样适用于本实施例的一种提高语音识别精准性的装置,通过前述对一种提高语音识别精准性的方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种提高语音识别精准性的装置的实施方法,所以为了说明书的简洁,再次不再详述。
138.实施例三
139.下面参考图3来描述本申请实施例的电子设备。
140.图3图示了根据本申请实施例的电子设备的结构示意图。
141.基于与前述实施例中一种提高语音识别精准性的方法的发明构思,本发明还提供一种提高语音识别精准性的系统,其上存储有计算机程序,该程序被处理器执行时实现前
文所述一种提高语音识别精准性的方法的任一方法的步骤。
142.其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口305在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
143.本申请实施例提供了一种提高语音识别精准性的方法,其中,所述方法还包括:获得第一用户的第一语音信息;根据所述第一语音信息,获得第一识别结果;通过所述监控设备获得所述第一用户的第一预设距离范围内的第一视频信息;判断所述第一视频信息中是否包括第二用户,且所述第一用户与所述第二用户是否存在语音交互行为;如果所述第一视频信息中包括所述第二用户,且所述第一用户与所述第二用户存在语音交互行为时,获得所述第一用户与所述第二用户的第一亲密度信息;获得预设语音识别数据库;根据所述第一亲密度信息,从所述预设语音识别数据库中,确定第一识别语境及第一语境信息集;根据所述第一识别语境及所述第一语境信息集,获得第一调整指令;根据所述第一调整指令对所述第一识别结果进行调整。
144.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
145.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
146.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
147.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
148.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优
选实施例以及落入本发明范围的所有变更和修改。
149.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜