一种语音处理方法、装置及电子设备与流程

2021-11-03 11:52:00 来源：中国专利 TAG：

1.本发明涉及互联网技术领域，更具体地，涉及一种语音处理方法、一种语音处理装置、一种电子设备、及一种计算机可读存储介质。

背景技术：

2.随着科技的飞速发展，弹唱成为了一种新的唱歌娱乐方式。用户可以在清唱的同时，通过点击对应的和弦按键，来播放对应的和弦，为用户进行伴奏。
3.传统的弹唱界面中，通常是给出所有的和弦按键，对下一个即将点击的按键做特殊显示。当用户唱到对应的歌词，需要点击对应的和弦按键，才能播放对应的和弦。
4.但是，传统的弹唱方式需要用户自己去把握点击的时机，对于有些入门用户，协调能力不强，一边唱歌一边看提示点击和弦，难度太大。

技术实现要素：

5.本发明的一个目的是提供一种自动为用户伴奏的新技术方案。
6.根据本发明的第一方面，提供了一种语音处理方法，包括：
7.获取用户根据预设的基准文字输入的目标语音，并将所述目标语音识别为目标文字；
8.根据所述目标文字和所述基准文字，确定所述用户的语音输入进度；
9.根据所述语音输入进度确定触发和弦的事件；
10.播放与所述语音输入进度所对应的和弦。
11.可选的，还包括：
12.提供开启伴奏的第一入口；
13.响应于通过所述第一入口触发的开启伴奏的操作，执行所述获取用户输入的目标语音，并将所述目标语音识别为目标文字的步骤。
14.可选的，还包括：
15.检测结束伴奏的事件是否发生；
16.在所述结束伴奏的事件发生的情况下，根据所述目标语音和对应的和弦，生成目标音频。
17.可选的，所述结束伴奏的事件包括：
18.所述语音输入进度达到预设的结束进度；和/或，
19.接收到通过预先提供的结束伴奏的第二入口所触发的结束伴奏的操作。
20.可选的，所述根据所述目标语音和对应的和弦，生成目标音频包括：
21.录制所述目标语音和播放的所述和弦，得到所述目标音频；或者，
22.根据与目标语音对应的和弦，生成伴奏；
23.根据所述伴奏和所述目标语音，生成所述目标音频。
24.可选的，还包括：
25.响应于播放所述目标音频的操作，播放所述目标音频。
26.可选的，还包括：
27.响应于发布所述目标音频的操作，将所述目标音频发布至指定平台中。
28.可选的，还包括：
29.展示所述基准文字，以供所述用户根据所述基准文字输入所述目标语音。
30.可选的，还包括：
31.提供与每一种和弦一一对应的和弦触发按钮，
32.所述播放与所述语音输入进度所对应的和弦包括：
33.确定与所述语音输入进度所对应的和弦，作为目标和弦；
34.按照预设方式展示与所述目标和弦对应的和弦触发按钮，并播放与所述目标和弦。
35.可选的，所述根据所述目标文字和所述基准文字，确定所述用户的语音输入进度包括：
36.获取用户输入每个文字的速度、及得到所述目标语音后所经过的时间，以还根据所述速度和得到所述目标语音后所经过的时间，确定所述语音输入进度。
37.根据本发明的第二方面，提供了一种语音处理装置，其中，包括：
38.语音识别模块，用于获取用户根据预设的基准文字输入的目标语音，并将所述目标语音识别为目标文字；
39.进度确定模块，用于根据所述目标文字和所述基准文字，确定所述用户的语音输入进度；
40.事件确定模块，用于根据所述语音输入进度确定触发和弦的事件；
41.和弦播放模块，用于播放与所述语音输入进度所对应的和弦。
42.根据本发明的第三方面，提供了一种电子设备，包括：
43.根据本发明第二方面所述的装置；或者，
44.处理器和存储器，所述存储器用于存储指令，所述指令用于控制所述处理器执行根据本发明第一方面所述的方法。
45.根据本发明的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在被处理器执行时实现如本发明第一方面所述的方法。
46.在本发明的实施例中，通过将用户输入的目标语音识别为目标文字，根据目标文字和预设的基准文字确定用户的语音输入进度；在根据语音输入进度确定触发和弦的事件发生的情况下，播放与语音输入进度所对应的和弦。这样，可以根据用户输入目标语音的进度，自动为用户进行伴奏，无需用户自行操作，可以提升用户体验。
47.通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。
附图说明
48.被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。
49.图1是显示可用于实现本发明的实施例的电子设备的硬件配置的例子的框图。
50.图2示出了本发明的实施例的语音处理方法的应用场景的示意图。
51.图3示出了本发明的实施例的语音处理方法的流程示意图。
52.图4示出了本发明的实施例的电子设备的展示界面的示意图。
53.图5示出了本发明的实施例的语音处理装置的框图。
54.图6示出了本发明的实施例的电子设备的一个例子的框图。
具体实施方式
55.现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
56.以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。
57.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。
58.在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。
59.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。
60.<硬件配置>
61.图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。
62.电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑、音箱、耳机等。如图1所示，电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中，处理器1100可以是中央处理器cpu、微处理器mcu等。存储器1200例如包括rom(只读存储器)、ram(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括usb接口、耳机接口等。通信装置1400例如能够进行有线或无线通信，具体地可以包括wifi通信、蓝牙通信、2g/3g/4g/5g通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
63.图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中，电子设备1000的所述存储器1200用于存储指令，所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项语音处理方法。本领域技术人员应当理解，尽管在图1中对电子设备1000示出了多个装置，但是，本发明可以仅涉及其中的部分装置，例如，电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。
64.<应用场景>
65.图2为本发明实施例的语音处理方法的应用场景的示意图。
66.本实施例的语音处理方法具体可以应用于弹唱场景，直播场景，虚拟主播场景等为用户进行伴奏的场景中。
67.如图2所示，电子设备中提供基准文字，供用户根据基准文字输入目标语音。电子设备获取用户所输入的目标语音，并将目标语音识别为目标文字，根据目标文字和基准文字，确定用户的语音输入进度，并在根据语音输入进度确定触发和弦的事件发生的情况下，播放与语音输入进度所对应的和弦。
68.这样，可以根据用户输入目标语音的进度，自动为用户进行伴奏，无需用户自行操作，可以提升用户体验。
69.例如，在弹唱场景中，电子设备所提供的基准文字可以是歌词，用户根据该歌词进行演唱，其演唱内容可以是电子设备所提供的歌词。电子设备获取用户的演唱语音，即目标语音，并将该目标语音识别为目标文字，根据该目标文字和预先提供的歌词进行比对，确定用户的演唱进度，即语音输入进度，并播放与用户的演唱进度所对应的和弦。这样，就可以根据用户的演唱进度为自动用户进行伴奏。
70.再例如，在直播场景中，电子设备所提供的基准文字可以是直播文稿，主播在直播过程中，可以根据该直播文稿输入目标语音。电子设备获取主播输入的目标语音，并将该目标语音识别为目标文字，根据该目标文字和预先提供的直播文稿进行比对，确定主播的直播进度，即语音输入进度，并播放与主播的直播进度所对应的和弦。这样，就可以根据主播的直播进度为自动为主播进行伴奏。
71.再例如，在虚拟主播场景中，电子设备所提供的基准文字可以是配音文稿，配音人员在配音的过程中，可以是根据该配音文稿进行配音，即输入目标语音。电子设备获取配音人员输入的目标语音，并将该目标语音识别为目标文字，根据该目标文字和预先提供的配音文稿进行比对，确定配音人员的配音进度，即语音输入进度，并播放与配音人员的配音进度所对应的和弦。这样，就可以根据配音人员的配音进度为自动为配音人员进行伴奏。
72.<方法实施例>
73.在本实施例中，提供一种语音处理方法。该语音处理方法可以是由电子设备实施。该电子设备可以是如图1所示的电子设备1000。
74.根据图3所示，本实施例的语音处理方法可以包括如下步骤s1000～s4000：
75.步骤s1000，获取用户根据预设的基准文字输入的目标语音，并将目标语音识别为目标文字。
76.在本发明的一个实施例中，在执行步骤s1000之前，该方法还可以包括：
77.提供基准文字，以供用户根据该基准文字输入目标语音。
78.具体可以是如图4所示，在电子设备的展示界面上展示基准文字。其中，用户输入的目标语音和基准文字可以是一致。其中，基准文字可以是由至少一个语句构成，每个语句中可以包括至少一个词语，每个词语中可以包括至少一个文字。
79.在一个例子中，基准文字可以是歌词，诗句，或文章等。
80.在本发明的一个实施例中，可以是通过执行本发明的电子设备上所设置的麦克风，获取用户输入的目标语音，再由该电子设备将目标语音识别为目标文字。
81.在本发明的一个实施例中，电子设备可以是逐字、逐词、或逐句对用户输入的目标语音进行识别，得到目标文字。
82.在本发明的一个实施例中，在执行上述步骤s1000之前，该方法还可以包括：
83.提供开启伴奏的第一入口；响应于通过第一入口触发的开启伴奏的操作，执行获
取用户输入的目标语音，并将目标语音识别为目标文字的步骤。
84.其中，第一入口可以是电子设备中的按钮，例如可以是物理按钮，也可以是如图4所示的虚拟按钮。用户可以是通过点击该第一入口，触发开启伴奏的操作。执行本发明方法的电子设备可以是响应于该开启伴奏的操作，开启麦克风，并通过麦克风获取用户输入的目标语音，并将目标语音识别为目标文字。
85.在用户未通过第一入口触发开启伴奏的操作的情况下，执行本发明实施例的电子设备可以是关闭麦克风，无需获取用户的语音。
86.在本发明的一个实施例中，可以是基于预先得到的语音识别模型，将目标语音识别为目标文字。
87.该语音识别模型可以是预先从其他电子设备中获取的，也可以是执行本发明方法实施例的电子设备训练得到的。
88.在由该电子设备训练得到语音识别模型的实施例中，可以是将多个用户根据至少一份基准文字输入的语音作为训练样本，基于预设的机器学习算法，根据多个训练样本和对应的基准文字进行机器学习训练，得到该语音识别模型。
89.步骤s2000，根据目标文字和基准文字，确定用户的语音输入进度。
90.根据目标文字和基准文字，确定用户的语音输入进度可以是根据目标文字在基准文字中的位置，得到语音输入进度。
91.在本发明的一个实施例中，可以是根据由用户本次伴奏过程中所输入的所有目标语音识别得到的所有目标文字，来确定语音输入进度。
92.在逐字对用户输入的目标语音进行识别，得到目标文字的实施例中，可以将目标文字中最后一个字在基准文字中的进度，作为用户的语音输入进度。还可以是将目标位置中最后一个字的下一个字在基准文字中的进度，作为用户的语音输入进度。
93.例如，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，那么，在目标文字包括“没有一点点防备，也没有一”的情况下，语音输入进度可以是“也没有一丝顾虑”中“一”在基准文字中的进度，也可以是“也没有一丝顾虑”中“丝”在基准文字中的进度。
94.在逐词对用户输入的目标语音进行识别，得到目标文字的实施例中，可以将目标文字中最后一个词语的最后一个字在基准文字中的进度，作为用户的语音输入进度。也可以是将目标文字中最后一个词语的下一个字在基准文字中的进度，作为用户的语音输入进度。
95.例如，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，那么，在目标文字包括“没有一点点防备，也没有一丝”的情况下，语音输入进度可以是“也没有一丝顾虑”中“丝”在基准文字中的进度，也可以是“也没有一丝顾虑”中“顾”在基准文字中的进度。
96.在逐句对用户输入的目标语音进行识别，得到目标文字的实施例中，可以将目标文字中最后一个语句的最后一个字在基准文字中的进度，作为用户的语音输入进度。也可以是将目标文字中最后一个语句的下一个字在基准文字中的进度，作为用户的语音输入进度。
97.例如，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世
界里，带给我惊喜，情不自已”，那么，在目标文字包括“没有一点点防备，也没有一丝顾虑”的情况下，语音输入进度可以是“也没有一丝顾虑”中的“虑”在基准文字中的进度，也可以是“你就这样出现”中的“你”在基准文字中的进度。
98.在本发明的一个实施例中，还可以是获取用户输入目标语音的速度、及得到目标语音后所经过的时间，以还根据该速度和得到目标语音后所经过的时间，确定语音输入进度。
99.具体的，可以是确定用户输入的目标语音中每个文字的速度的平均值，作为用户输入目标语音的速度。根据该速度和用户输入目标语音中最后一个文字之后所经过的时间，可以确定语音输入进度。
100.在逐词对用户输入的目标语音进行识别，得到目标文字的实施例中，可以是根据目标文字中最后一个语句在基准文字中的进度和用户输入目标语音的速度，确定用户的语音输入进度。
101.具体的，根据用户输入目标语音的速度、及得到目标语音后所经过的时间，可以确定用户当前应该输入的下一词语中的文字在下一词语中的位置，根据该位置可以得到用户的语音输入进度。
102.例如，用户输入一个文字的间隔时间为1s，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，那么，在目标文字包括“没有一点点防备，也没有一丝”、且在得到目标文字“一丝”后1s的情况下，语音输入进度可以是“也没有一丝顾虑”中“顾”在基准文字中的进度，也可以是“也没有一丝顾虑”中“虑”在基准文字中的进度。
103.在逐句对用户输入的目标语音进行识别，得到目标文字的实施例中，可以是根据目标文字中最后一个语句在基准文字中的进度和用户输入目标语音的速度，确定用户的语音输入进度。
104.具体的，根据用户输入目标语音的速度、及得到目标语音后所经过的时间，可以确定用户当前应该输入的下一语句中的文字在下一语句中的位置，根据该位置可以得到用户的语音输入进度。
105.例如，用户输入一个文字的间隔时间为1s，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，那么，在目标文字包括“没有一点点防备，也没有一丝顾虑”、且在得到文字“也没有一丝顾虑”后4s的情况下，语音输入进度可以是“你就这样出现”中“样”在基准文字中的进度；也可以是“你就这样出现”中“出”在基准文字中的进度。
106.步骤s3000，根据语音输入进度确定触发和弦的事件。
107.在本发明的一个实施例中，可以是预先基于基准文字，设定至少一个用于触发和弦的事件的指定进度。在语音输入进度达到指定进度的情况下，可以确定触发和弦的事件发生。
108.例如，基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，该指定进度可以包括：“没有一点点防备”中的“没”在基准文字中的进度，“也没有一丝顾虑”中的“也”在基准文字中的进度，“带给我惊喜”中的“我”在基准文字中的进度，“情不自已”中的“情”在基准文字中的进度，和“情不自已”中的“已”在
基准文字中的进度。
109.步骤s4000，播放与该语音输入进度所对应的和弦。
110.在本发明的一个实施例中，可以是预先针对每个指定进度，设定对应的和弦。其中，每个指定进度所对应的和弦可以相同，也可以不同。
111.在本发明的一个实施例中，可以是在触发和弦的事件发生的情况下，播放与该语音输入进度所对应的和弦。
112.例如，在基准文字包括“没有一点点防备，也没有一丝顾虑，你就这样出现，在我的世界里，带给我惊喜，情不自已”，“没有一点点防备”中的“没”在基准文字中的进度所对应的和弦为和弦1，“也没有一丝顾虑”中的“也”在基准文字中的进度所对应的和弦为和弦2，“带给我惊喜”中的“我”在基准文字中的进度所对应的和弦为和弦3，“情不自已”中的“情”在基准文字中的进度所对应的和弦为和弦4，和“情不自已”中的“已”在基准文字中的进度所对应的和弦为和弦5，的情况下，如果通过步骤s3000得到的语言输入进度为“情不自已”中的“情”在基准文字中的进度，那么，可以是播放与该进度所对应的和弦4。
113.通过本发明的实施例，可以根据用户输入目标语音的进度，来自动为用户进行伴奏，无需用户自行操作，可以提升用户体验。
114.在本发明的一个实施例中，该方法还可以包括：
115.检测结束伴奏的事件是否发生；在该结束伴奏的事件发生的情况下，根据目标语音和对应的和弦，生成目标音频。
116.其中，结束伴奏的事件可以包括：
117.语音输入进度达到预设的结束进度；和/或，
118.接收到通过预先提供的结束伴奏的第二入口所触发的结束伴奏的操作。
119.在结束伴奏的事件包括语音输入进度达到预设的结束进度的实施例中，该结束进度可以是基准文字中的最后一个文字在基准文字中的进度。那么，可以是在语音输入进度达到该结束进度的情况下，确定结束伴奏的事件发生。
120.在结束伴奏的事件包括接收到通过第二入口所触发的结束伴奏的操作的实施例中，该第二入口可以是电子设备中的按钮，例如可以是物理按钮，也可以是如图4所示的虚拟按钮。用户可以是通过点击该第二入口，触发结束伴奏的操作。执行本发明方法的电子设备可以是在接收到该结束伴奏的操作的情况下，确定结束伴奏的事件发生。
121.在本发明的一个实施例中，根据目标语音和对应的和弦，生成目标音频的方式可以包括：录制目标语音和播放的和弦，得到目标音频。
122.在本实施例中，目标语音和根据语音输入进度所播放的和弦，可以是同时由电子设备进行录制，得到包含目标语音和和弦的目标音频。
123.在本发明的另一个实施例中，根据目标语音和对应的和弦，生成目标音频的方式可以包括：根据与目标语音对应的和弦，生成伴奏；根据伴奏和录制的目标语音，生成目标音频。
124.在本实施例中，目标语音由电子设备录制得到，而与目标语音对应的和弦，即根据目标语音的语音输入进度所对应的和弦，可以是按照与每个语音输入进度所对应的时刻和和弦，生成伴奏，再对伴奏和目标语音进行合成，得到目标音频。
125.在本发明的一个实施例中，该方法还可以包括：保存目标音频。这样，用户就可以
随时播放目标音频。具体的，可以是将目标音频保存在电子设备中，还可以是将目标音频保存在服务器中。
126.在本发明的一个实施例中，该方法还可以包括：响应于播放目标音频的操作，播放目标音频。
127.在本实施例中，可以是在电子设备的交互界面中提供播放按钮，用户可以点击该播放按钮，触发播放目标音频的操作。
128.在本发明的一个实施例中，该方法还可以包括：响应于发布目标音频的操作，将目标音频发布至指定平台中。
129.在本实施例中，可以是在电子设备的交互界面中提供发布按钮，用户可以点击该发布按钮，触发发布目标音频的操作。执行本发明方法的电子设备可以是响应于发布目标音频的操作，提供至少一个发布平台，供用户选择。该电子设备可以是将用户所选择的发布平台作为指定平台，将目标音频发布至指定平台中。
130.在本发明的一个实施例中，该方法还可以包括：提供与每一种和弦一一对应的和弦触发按钮。
131.其中，每个和弦触发按钮可以是具有不同的颜色和/或不同的标识，以区分和弦触发按钮所对应的不同和弦，例如可以是如4所示。
132.在此基础上，播放与语音输入进度所对应的和弦可以包括：
133.确定与语音输入进度所对应的和弦，作为目标和弦；按照预设方式展示与目标和弦对应的和弦触发按钮，并播放目标和弦。
134.该预设方式可以预先根据应用场景或具体需求设定，例如，该预设方式可以为镂空和/或高亮。
135.这样，用户就可以根据按照预设方式展示的与目标和弦所对应的和弦触发按钮，得知对应的语音输入进度所应该点击的和弦触发按钮，以进一步熟练弹唱操作。
136.在本发明的一个实施例中，该方法还可以提供伴奏乐器的选择入口，例如可以是如4所示。电子设备响应于用户点击才选择入口的操作，提供至少两种伴奏乐器，获取用户通过该选择入口所选择的目标伴奏乐器，并提供与目标伴奏乐器所对应的、每一指定进度的和弦。其中，伴奏乐器例如可以包括钢琴或吉他等乐器。
137.这样，可以使得为用户伴奏的方式具有多样性。
138.<装置实施例>
139.在本实施例中，提供一种语音处理装置5000，如图5所示，包括语音识别模块5100、进度确定模块5200、事件确定模块5300和和弦播放模块5400。该语音识别模块5100用于获取用户根据预设的基准文字输入的目标语音，并将目标语音识别为目标文字；该进度确定模块5200用于根据目标文字和基准文字，确定用户的语音输入进度；该事件确定模块5300用于根据语音输入进度确定触发和弦的事件；该和弦播放模块5400用于播放与语音输入进度所对应的和弦。
140.在本发明的一个实施例中，该语音处理装置5000还可以包括：
141.用于提供开启伴奏的第一入口的模块；
142.用于响应于通过第一入口触发的开启伴奏的操作，控制语音识别模块5100执行获取用户输入的目标语音，并将目标语音识别为目标文字的步骤的模块。
143.在本发明的一个实施例中，该语音处理装置5000还可以包括：
144.用于检测结束伴奏的事件是否发生的模块；
145.用于在结束伴奏的事件发生的情况下，根据目标语音和对应的和弦，生成目标音频的模块。
146.在本发明的一个实施例中，结束伴奏的事件包括：
147.语音输入进度达到预设的结束进度；和/或，
148.接收到通过预先提供的结束伴奏的第二入口所触发的结束伴奏的操作。
149.在本发明的一个实施例中，根据目标语音和对应的和弦，生成目标音频包括：
150.录制目标语音和播放的和弦，得到目标音频；或者，
151.根据与目标语音对应的和弦，生成伴奏；
152.根据伴奏和目标语音，生成目标音频。
153.在本发明的一个实施例中，该语音处理装置5000还可以包括：
154.用于响应于播放目标音频的操作，播放目标音频的模块。
155.在本发明的一个实施例中，该语音处理装置5000还可以包括：
156.用于响应于发布目标音频的操作，将目标音频发布至指定平台中的模块。
157.在本发明的一个实施例中，该语音处理装置5000还可以包括：
158.用于展示基准文字，以供用户根据基准文字输入目标语音的模块。
159.在本发明的一个实施例中，该语音处理装置5000还可以包括：
160.用于提供与每一种和弦一一对应的和弦触发按钮的模块，
161.和弦播放模块5400还可以用于：
162.确定与语音输入进度所对应的和弦，作为目标和弦；
163.按照预设方式展示与目标和弦对应的和弦触发按钮，并播放与目标和弦。
164.在本发明的一个实施例中，进度确定模块5200还可以用于：
165.获取用户输入每个文字的速度、及得到目标语音后所经过的时间，以还根据速度和得到目标语音后所经过的时间，确定语音输入进度。
166.本领域技术人员应当明白，可以通过各种方式来实现语音处理装置5000。例如，可以通过指令配置处理器来实现语音处理装置5000。例如，可以将指令存储在rom中，并且当启动设备时，将指令从rom读取到可编程器件中来实现语音处理装置5000。例如，可以将语音处理装置5000固化到专用器件(例如asic)中。可以将语音处理装置5000分成相互独立的单元，或者可以将它们合并在一起实现。语音处理装置5000可以通过上述各种实现方式中的一种来实现，或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
167.在本实施例中，语音处理装置5000可以具有多种实现形式，例如，语音处理装置5000可以是任何的提供语音处理服务的软件产品或者应用程序中运行的功能模块，或者是这些软件产品或者应用程序的外设嵌入件、插件、补丁件等，还可以是这些软件产品或者应用程序本身。
168.<电子设备>
169.在本实施例中，还提供一种电子设备6000。该电子设备6000可以是图1所示的电子设备1000。
170.在一方面，该电子设备6000可以包括前述的语音处理装置5000，用于实施本发明
任意实施例的语音处理方法。
171.在另一方面，如图6所示，电子设备6000还可以包括处理器6100和存储器6200，该存储器6200用于存储可执行的指令；该处理器6100用于根据指令的控制运行电子设备6000执行根据本发明任意实施例的语音处理方法。
172.在本实施例中，该电子设备6000可以是智能音箱、耳机、手机、平板电脑、掌上电脑、台式机、笔记本电脑等设备。例如，电子设备6000可以是具有语音处理功能的电子产品。
173.<计算机可读存储介质>
174.在本实施例中，还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序在被处理器执行时实现如本发明任意实施例的语音处理方法。
175.本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
176.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
177.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。
178.用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如smalltalk、c 等，以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。
179.这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。
180.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
181.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
182.附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
183.以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种语音处理方法、装置及电子设备与流程

相关文献

最热文献