一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

财务系统的语音控制方法、装置、存储介质及设备与流程

2022-09-01 08:51:30 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体而言,涉及一种财务系统的语音控制方法、装置、存储介质及设备。


背景技术:

2.现有的财务信息管理系统的交互方式大多都基于传统的硬件设备。用户可以通过鼠标或键盘选中图像中的某个点或区域,完成对该点或区域处虚拟物体的点击、缩放、拖拽等操作。
3.现有方法需要外部输入设备的支持,不能为用户提供自然的交互体验,降低了增强现实系统的沉没感。并且通过外部设备进行输入传递的信息量较小,对于部分用户也存在不便于操作的情况。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种财务系统的语音控制方法、装置、存储介质及设备,以至少解决现有技术中人机交互方式输入指令的效率较低,传递的消息量较小的技术问题。
6.根据本发明实施例的一个方面,提供了一种财务系统的语音控制方法,包括:采用语音采集设备获取语音信号;对上述语音信号进行分析处理,得到目标语音信号;对上述目标语音信号进行识别处理,得到控制指令;返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
7.可选的,上述采用语音采集设备获取语音信号,包括:选择目标语音识别器和目标监听器;对上述目标监听器进行初始化处理;采用初始化处理后的上述目标监听器对上述目标语音识别器进行初始化处理;采用初始化处理后的上述目标语音识别器接收上述语音信号。
8.可选的,对上述语音信号进行分析处理,得到目标语音信号之前,上述方法还包括:对上述语音信号进行预处理,其中,上述预处理包括以下至少之一:滤波处理、模拟信号转换为数字信号处理、量化处理、预加重处理、端点检测处理。
9.可选的,对上述语音信号进行分析处理,得到目标语音信号,包括:采用预设特征提取规则对上述语音信号进行特征提取,得到初始语音特征集合;对上述初始语音特征集合进行向量量化处理,得到目标语音特征集合;将上述目标语音特征集合作为上述目标语音信号。
10.可选的,上述对上述目标语音信号进行识别处理,得到控制指令,包括以下至少之一:采用预设匹配模板对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用预设统计模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用预设概率分析模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令。
11.可选的,在上述返回上述控制指令,并在接收到对上述控制指令的确认信息后,对
上述控制指令执行控制处理之前,上述方法还包括:将上述控制指令转换成音韵序列;根据上述音韵序列生成语音波形;对上述语音波形进行语音合成处理,得到语音控制指令。
12.可选的,返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理,包括:将上述语音控制指令通过语音播报的形式进行返回;接收对上述控制指令的确认信息,其中,上述确认信息包括:确认处理、取消处理;基于上述确认信息和上述控制指令控制目标设备执行控制处理。
13.根据本发明实施例的另一方面,还提供了一种财务系统的语音控制装置,包括:获取模块,用于采用语音采集设备获取语音信号;分析模块,用于对上述语音信号进行分析处理,得到目标语音信号;识别模块,用于对上述目标语音信号进行识别处理,得到控制指令;控制模块,用于返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
14.根据本发明实施例的另一方面,还提供了一种非易失性存储介质,上述非易失性存储介质存储有多条指令,上述指令适于由处理器加载并执行任意一项上述的财务系统的语音控制方法。
15.根据本发明实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行任意一项上述的财务系统的语音控制方法。
16.在本发明实施例中,通过采用语音采集设备获取语音信号;对上述语音信号进行分析处理,得到目标语音信号;对上述目标语音信号进行识别处理,得到控制指令;返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理,达到了通过语音对话功能录入指令,完成原始凭证录入、数据查询等工作的目的,从而实现了语音控制的方式对财务信息进行管理,方便用户管理账务信息的技术效果,进而解决了现有技术中人机交互方式输入指令的效率较低,传递的消息量较小的技术问题。
附图说明
17.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
18.图1是根据本发明实施例的财务系统的语音控制方法流程图;
19.图2是根据本发明实施例的一种可选的财务系统的语音控制结构示意图;
20.图3是根据本发明实施例的一种可选的语音交互流程示意图;
21.图4是根据本发明实施例的一种可选的语音交互数据录入流程示意图;
22.图5是根据本发明实施例的一种财务系统的语音控制装置的结构示意图;
23.图6是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
24.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范
围。
25.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
26.术语说明
27.语音识别:也称为自动语音识别(asr,automatic speech recognition),其目标是将语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
28.语音合成:即合成语音,又称为文语转换(text to speech,tts)技术,语音合成技术所解决的主要问题是将文字信息转化为可听的声音信息。
29.财务管理:是在一定的整体目标下,关于资产的购置,资本的融通和经营中现金流量以及利润分配的管理。财务管理是企业管理的一个组成部分,他是根据财经法规制度,按照财务管理的原则,组织企业财务活动,处理财务关系的一项经济管理活动。
30.实施例1
31.根据本发明实施例,提供了一种财务系统的语音控制方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
32.图1是根据本发明实施例的财务系统的语音控制方法流程图,如图1所示,该方法包括如下步骤:
33.步骤s102,采用语音采集设备获取语音信号;
34.步骤s104,对上述语音信号进行分析处理,得到目标语音信号;
35.步骤s106,对上述目标语音信号进行识别处理,得到控制指令;
36.步骤s108,返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
37.在本发明实施例中,上述步骤s102至s108中提供的财务系统的语音控制方法的执行主体为财务管理系统的人机交互设备,采用安装在上述人机交互设备上的语音采集设备获取语音信号;采用分析处理设备对获取到的语音信号进行分析处理,得到目标语音信号,并对目标语音信号进行识别处理,得到语音信号中包含的控制指令;将控制指令通过语音播报的方式进行返回,并接收对上述控制指令的确认信息,得到确认后控制财务管理系统根据控制指令执行控制处理。
38.需要说明的是,上述语音采集设备安装在上述财务管理系统的人机交互设备中,上述语音信号为目标用户发出的语音信号,可以包括控制指令、业务咨询等语音信息;语音采集设备在使用时可以根据实际情况设定语音采集范围,防止采集到过多杂音、噪音。
39.作为一种可选的实施例,如图2所示的财务系统的语音控制结构示意图,用户登录系统后,可点击页面按钮触发语音交互功能,并进行语音输入,通过系统语音信号预处理、
特征提取、识别、模式匹配等完整语音识别完成后返回识别结果,并将该结果作为查询输入条件,在后台数据库功能菜单数据中执行模糊查询,返回匹配到的所有数据到前台页面,供用户确认后返回所需页面。
40.通过本发明实施例,采用语音交互的形式,定位到具体的功能模块并返回其页面。解决传统系统下在众多模块中手工点击逐一查找具体功能,操作过程繁琐影响用户体验的问题,实现了通过语音交互替代键盘输入实现查询功能。
41.在一种可选的实施例中,上述采用语音采集设备获取语音信号,包括:选择目标语音识别器和目标监听器;对上述目标监听器进行初始化处理;采用初始化处理后的上述目标监听器对上述目标语音识别器进行初始化处理;采用初始化处理后的上述目标语音识别器接收上述语音信号。
42.在本发明实施例中,在采用语音采集设备获取语音信号之前,首先需要对采集设备进行设定,可以预先选择好目标语音识别器和目标监听器;并对上述目标监听器、目标语音识别器进行初始化处理;采用初始化处理后的上述目标语音识别器接收上述语音信号。
43.作为一种可选的实施例,首先需要在任意语音平台申请语音账号,包括:用户id(app id)、用户密码(app key)和秘钥(secret key)等,进入语音平台后登陆语音账号,选择创建新应用并选择需要开通的服务,即语音识别和语音合成,其次还需要所开发应用的完整包名。在实际采用语音采集设备获取语音信号的过程中,需要下载语音识别的对应软件开发工具包sdk,其中包括完整的接口集成文档,可按照文档说明将核心接口文件导入系统项目,便可应用相关的程序编程接口api。
44.可选的,在接口接入成功后,在主类中声明语音识别对象并初始化,同时设置监听以完成输出功能,最后直接调用start()方法实现语音识别;声明语音识别对象并初始化过程中,首先声明识别器对象,同时声明并初始化一个监听器,将识别结果返回到页面弹出框,用上述监听器初始化识别器对象,识别器将语音输入结果作为识别入参params并调用start方法开始识别,完成后将结果返回页面弹框。
45.在一种可选的实施例中,对上述语音信号进行分析处理,得到目标语音信号之前,上述方法还包括:对上述语音信号进行预处理,其中,上述预处理包括以下至少之一:滤波处理、模拟信号转换为数字信号处理、量化处理、预加重处理、端点检测处理。
46.在本发明实施例中,在采集到上述语音信号后,首先需要对上述语音信号进行预处理,上述预处理包括:滤波处理、模拟信号转换为数字信号处理、量化处理、预加重处理、端点检测处理等。
47.作为一种可选的实施例,语音通常通过话筒输入计算机,话筒将声波转换为电压信号,然后通过a/d装置(如声卡)进行采样,从而将连续的电压信号转化成为计算机能够处理的数字信号;语音信号在采集后还要进行滤波、预加重和端点检测等预处理,处理完成后才能进入识别、合成、增强等实际应用。
48.需要说明的是,上述预处理操作可以抑制输入信号中超出一定频率的所有分量,以防止混叠干扰;还可以抑制50hz的电源工频干扰。模数转换(a/d转换)是将语音模拟信号转换为数字信号,转换的同时对信号进行量化处理,量化后的信号值与原信号值之间的差值为量化误差,又称为量化噪声。预加重处理可以提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,便于频谱分析。端点检测是从
包含语音的一段信号中确定出语音的起点和终点,有效的端点检测不仅能减少处理时间,而且能排除无声段的噪声干扰。
49.在一种可选的实施例中,对上述语音信号进行分析处理,得到目标语音信号,包括:采用预设特征提取规则对上述语音信号进行特征提取,得到初始语音特征集合;对上述初始语音特征集合进行向量量化处理,得到目标语音特征集合;将上述目标语音特征集合作为上述目标语音信号。
50.在本发明实施例中,话筒等语音输入设备可以采集到声波波形,需要从采集到数据中抽取那些能够帮助辨别单词的特征信息,可以通过线性预测编码技术抽取语音特征,,得到初始语音特征集合。
51.需要说明的是,线性预测编码根据语音信号采样点之间存在相关性,用过去的若干采样点的线性组合预测当前和将来的采样点值;线性预测系数通过预测信号和实际信号之间的均方误差最小来唯一确定。
52.还需要说明的是,根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。可以将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢失,应该使帧有重叠部分。例如,当使用20kh*的采样频率时,标准的一帧为10ms,包含200个采样值。
53.在本发明实施例中,对上述初始语音特征集合进行向量量化处理,在标量量化中,整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入的标量信号,量化时落入小区间的值就用这个代表值代替,信号量是一维的标量,这个过程称为标量量化,将若干个标量数据组成一个向量(或者是从一帧语音数据中提取的特征向量)在多维空间给予整体量化,完成向量量化,从而可以在信息量损失较小的情况下压缩数据量,得到目标语音特征集合;最后将上述目标语音特征集合作为上述目标语音信号。
54.在一种可选的实施例中,上述对上述目标语音信号进行识别处理,得到控制指令,包括以下至少之一:采用预设匹配模板对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用预设统计模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用预设概率分析模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令。
55.在本发明实施例中,当提取声音特征集合(即上述目标语音信号)后,就可以识别这些特征所代表的词汇,识别系统的输入是从语音信号中提取出的特征参数,如预测编码参数lpc。上述语音识别所处理采用的方法包括但不限于:模板匹配法、随机模型法(上述预设统计模型)和概率语法分析法等三种。
56.可选的,模板(template)匹配法:在训练阶段,用户将词汇表中的每一个词依次说一遍,并且将其特征向量作为模板存入模板库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
57.可选的,随机模型法:随机模型法是目前语音识别研究的主流。其突出的代表是隐马尔可夫模型。语音信号在足够短的时间段上的信号特征近似于稳定,而总的过程可看成是依次相对稳定的某一特性过渡到另一特性。隐马尔可夫模型则用概率统计的方法来描述这样一种时变的过程。
58.可选的,概率语法分析法:这种方法是用于大长度范围的连续语音识别。语音学家通过研究不同的语音语谱图及其变化发现,虽然不同的人说同一些语音时,相应的语谱及其变化有种种差异,但是总有一些共同的特点足以使他们区别于其他语音,也即语音学家提出的“区别性特征”。另一方面,人类的语言要受词法、语法、语义等约束,人在识别语音的过程中充分应用了这些约束以及对话环境的有关信息。于是,将语音识别专家提出的“区别性特征”与来自构词、句法、语义等语用约束相互结合,就可以构成一个“自底向上”或“自顶向下”的交互作用的知识系统,不同层次的知识可以用若干规则来描述。
59.在一种可选的实施例中,在上述返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理之前,上述方法还包括:将上述控制指令转换成音韵序列;根据上述音韵序列生成语音波形;对上述语音波形进行语音合成处理,得到语音控制指令。
60.在本发明实施例中,在上述返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理之前,可以将返回的控制指令通过语音合成技术处理为语音控制指令。
61.需要说明的是,上述语音控制指令合成步骤如下:将上述控制指令转换成音韵序列;根据上述音韵序列生成语音波形;对上述语音波形进行语音合成处理,得到语音控制指令。
62.作为一种可选的实施例,语音合成同语音识别接口集成,在接口成功接入项目后,只需在主类中声明语音合成对象初始化获取实例,设置监听,最后直接调用接口中的speak()方法既可语音合成并播放。步骤如下:声明语音合成器对象,获取实例对合成器初始化,设置当前上下文,设置合成监听器listener,语音合成并自动播放,调用speak()方法实现语音合成。
63.可选的,文语转换过程是先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。其中第一步涉及语言学处理,例如分词、字音转换、多音字消歧等,以及一整套有效的韵律控制规则;通过语音合成技术,按要求实时合成出高质量的语音流。
64.需要说明的是,文语转换系统都需要一套复杂的文字序列到音素序列的转换程序,文语转换系统不仅要应用数字信号处理技术,而且必须有大量的语言学知识的支持。
65.可选的,完整合成过程主要分为前端处理和后端处理,前端处理根据先验知识对文本进行语言及语法层面的分析;后端合成部分是波形拼接和参数合成,波形拼接方法是根据文本分析从语料库中选取相应的语音单元片段,然后进行单元片段的拼接完成语音合成;参数合成方法是从数字信号处理、统计学等角度,对声码器提取的声学特征参数进行统计建模,然后把模型预测得到的声学特征参数输入声码器完成语音合成。
66.在一种可选的实施例中,返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理,包括:将上述语音控制指令通过语音播报的形式进行返回;接收对上述控制指令的确认信息,其中,上述确认信息包括:确认处理、取消处理;基于上述确认信息和上述控制指令控制目标设备执行控制处理。
67.在本发明实施例中,语音识别完成后返回识别结果,并将该结果作为查询输入条件,在后台数据库功能菜单数据中执行模糊查询,返回匹配到的所有数据到前台页面,供用户确认后返回所需页面。
68.作为一种可选的实施例,将语音识别结果作为查询条件,在保存有系统全部菜单名称信息的数据库表中执行模糊匹配查询,并返回匹配结果,提示用户确认;可以引用语音合成接口,以语音提示的方式提供给用户确认;最后根据用户确认情况跳转到指定功能模块。
69.可选的,上述语音交互步骤如下:声明识别器对象,声明并初始化一个监听器,将识别结果返回到页面弹出框,用上述监听器初始化识别器对象,识别器将语音输入结果作为识别入参params,调用start方法开始识别,并将结果返回保存到result中;再将识别结果result作为查询参数,在功能模块菜单表中执行模糊匹配,将返回与语音输入的待查询菜单匹配的所有菜单名称详情,用户确认后点击对应名称链接跳转至具体功能模块下。
70.作为一种可选的实施例,如图3所示的语音交互流程示意图,选择语音交互方式后,应用语音合成,将任务模板中待填充的所有槽位字段内容生成提示文本合成语音后输出,根据语音提示,再应用语音识别,根据语音输入提取关键信息作为目标信息,执行相关校验并填充至模板对应槽位。循环上述逻辑至完成全部槽位填充,实现基于语音交互的数据录入。
71.作为一种可选的实施例,如图4所示的语音交互数据录入流程示意图,上述财务管理系统还包括模板槽位获取、输入提示、字段规则校验、字段填充等功能。
72.可选的,模板槽位字段获取模块:在任意需录入数据的功能模块下,可先将所有字段存入列表,以该列表长度为最大循环次数,按从左到右从上到下的顺序依次生成对应字段的提示文本关键字,如“输入金额”。具体步骤如下:声明语音合成器对象;获取实例对合成器初始化;设置当前上下文;设置合成监听器listener,语音合成并自动播放;声明识别器对象;声明并初始化一个监听器,将识别结果返回到页面弹出框;用上述监听器初始化识别器对象;调用speak()方法实现语音输入提示语语音合成。调用start方法开始识别,并将结果返回保存到result中。字段值合法性验证,校验通过后,模板字段填充;语音合成校验结果并提示重新输入,进入下一循环。
73.可选的,语音交互模块:即完整的语音合成和语音识别流程。首先将上一步生成的提示文本关键信息简要加工后合成语音,播报给用户,如“请说出想要输入的金额数量”,用户根据提示语音输入,经完整的语音识别过程,提取识别结果。
74.可选的,字段规则校验模块:将语音识别结果作为待填充的字段值,进一步进行相关校验,如金额数值的合法性校验等。
75.可选的,字段填充模块:经过上述步骤得到的结果便是语音交互获取到的最终结果,填充至对应的模板槽位,即完成了该字段的语音输入。依次循环直至完成全部槽位的填充。
76.上述功能模块均为核心模块的简要介绍,实际实施过程中可进一步优化,如校验失败,可再次应用语音合成,生成相应的提示语,如“金额必须为数字,请重新输入”,进而再次进入循环,重新语音输入。以上仅以数据录入为例,实现语音交互的创新应用,实际还可以类似方法实现数据提交、修改、审批、查看、导出等等功能。
77.通过上述步骤,可以实现通过语言对话功能获取指令关键字,快速定位功能模块,解决了传统交互方式下,功能模块太多,用户需要一一点击,层层查找功能点的问题痛点。并且在具体功能模块下,通过与用户进行多轮语音交互获取任务模板中待填充的所有槽位
字段内容生成目标信息,完成数据录入、数据查询导出等工作,在一定程度上消除了对鼠标键盘等硬件设备的依赖,实现通过语音方式对账务信息进行管理,方便用户管理账务信息。还能省去学习新系统操作方法的时间。
78.实施例2
79.根据本发明实施例,还提供了一种用于实施上述财务系统的语音控制方法的装置实施例,图5是根据本发明实施例的一种财务系统的语音控制装置的结构示意图,如图5所示,上述装置包括:获取模块50、分析模块52、识别模块54和控制模块56,其中:
80.获取模块50,用于采用语音采集设备获取语音信号;
81.分析模块52,用于对上述语音信号进行分析处理,得到目标语音信号;
82.识别模块54,用于对上述目标语音信号进行识别处理,得到控制指令;
83.控制模块56,用于返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
84.此处需要说明的是,上述获取模块50、分析模块52、识别模块54和控制模块56对应于实施例1中的步骤s102至步骤s108,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。
85.需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
86.根据本发明的实施例,还提供了一种计算机可读存储介质的实施例。可选的,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的财务系统的语音控制方法所执行的程序代码。
87.可选的,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
88.可选的,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用语音采集设备获取语音信号;对上述语音信号进行分析处理,得到目标语音信号;对上述目标语音信号进行识别处理,得到控制指令;返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
89.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:选择目标语音识别器和目标监听器;对上述目标监听器进行初始化处理;采用初始化处理后的上述目标监听器对上述目标语音识别器进行初始化处理;采用初始化处理后的上述目标语音识别器接收上述语音信号。
90.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:对上述语音信号进行预处理,其中,上述预处理包括以下至少之一:滤波处理、模拟信号转换为数字信号处理、量化处理、预加重处理、端点检测处理。
91.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用预设特征提取规则对上述语音信号进行特征提取,得到初始语音特征集合;对上述初始语音特征集合进行向量量化处理,得到目标语音特征集合;将上述目标语音特征集合作为上述目标语音信号。
92.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用预设匹配模板对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用
预设统计模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令;采用预设概率分析模型对上述目标语音特征集合进行语音识别处理,得到上述控制指令。
93.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将上述控制指令转换成音韵序列;根据上述音韵序列生成语音波形;对上述语音波形进行语音合成处理,得到语音控制指令。
94.可选的,上述计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将上述语音控制指令通过语音播报的形式进行返回;接收对上述控制指令的确认信息,其中,上述确认信息包括:确认处理、取消处理;基于上述确认信息和上述控制指令控制目标设备执行控制处理。
95.根据本发明的实施例,还提供了一种处理器的实施例。可选的,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的财务系统的语音控制方法所执行的程序代码。
96.如图6所示,本发明实施例提供了一种电子设备,电子设备10包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:采用语音采集设备获取语音信号;对上述语音信号进行分析处理,得到目标语音信号;对上述目标语音信号进行识别处理,得到控制指令;返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
97.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:采用语音采集设备获取语音信号;对上述语音信号进行分析处理,得到目标语音信号;对上述目标语音信号进行识别处理,得到控制指令;返回上述控制指令,并在接收到对上述控制指令的确认信息后,对上述控制指令执行控制处理。
98.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
99.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
100.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
101.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
102.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
103.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
104.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
105.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
106.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
107.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献