语音转换方法、装置、计算机设备、存储介质和程序产品与流程

2022-06-22 17:43:09 来源：中国专利 TAG：

1.本技术涉及语音数据处理技术领域，特别是涉及一种语音转换方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

2.随着计算机技术的发展，语音转换被越来越多的应用到人们的日常生活中。实际应用中，语音转换包括多种类型，常见得有不同语种之间的语音转换、不同口音之间的语音转换、不同音色之间的语音转换等等。
3.对于不同音色之间的语音转换，传统技术中，通常采用由大量源说话人的语音数据和目标说话人的语音数据训练得到的语音转换模型来实现。具体实现过程是将源说话人的语音数据输入该语音转换模型，由语音转换模型对于源说话人的语音数据进行一些系列地特征提取和转换，以输出转换为目标说话人音色的语音数据，实现源说话人到目标说话人的音色转换。
4.然而，上述语音转换模型结构复杂，转换过程计算量大，转换耗时久，效率低。

技术实现要素：

5.基于此，有必要针对上述技术问题，提供一种语音转换方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
6.第一方面，本技术提供了一种语音转换方法，包括：
7.获取待转换语音，提取待转换语音的语音特征和语义信息；
8.根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
9.根据目标语音特征和待转换语音的语义信息生成目标转换语音。
10.在其中一个实施例中，若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系；
11.根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，包括：
12.计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；
13.在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
14.在其中一个实施例中，若语音特征对应关系中包括多组语音特征对应关系，语音特征对应关系的构建过程包括：
15.获取多个源语音和各源语音对应的目标语音；
16.提取各源语音的第一语音特征和各目标语音的第二语音特征；
17.将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
18.在其中一个实施例中，根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，包括：
19.根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系；
20.根据目标对应关系确定目标语音特征。
21.在其中一个实施例中，根据待转换语音的语音特征与特征转换关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系，包括：
22.获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；
23.确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；
24.在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
25.在其中一个实施例中，提取待转换语音的语音特征和语义信息，包括：
26.将待转换语音输入特征提取模型，得到待转换语音的语音特征；
27.将待转换语音输入语义提取模型，得到待转换语音的语义信息。
28.第二方面，本技术还提供了一种语音转换装置，包括：
29.语音处理模块，用于获取待转换语音，提取待转换语音的语音特征和语义信息；
30.目标确定模块，用于根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
31.语音生成模块，用于根据目标语音特征和待转换语音的语义信息生成目标转换语音。
32.第三方面，本技术还提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现以下步骤：
33.获取待转换语音，提取待转换语音的语音特征和语义信息；
34.根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
35.根据目标语音特征和待转换语音的语义信息生成目标转换语音。
36.第四方面，本技术还提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：
37.获取待转换语音，提取待转换语音的语音特征和语义信息；
38.根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
39.根据目标语音特征和待转换语音的语义信息生成目标转换语音。
40.第五方面，本技术还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：
41.获取待转换语音，提取待转换语音的语音特征和语义信息；
42.根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
43.根据目标语音特征和待转换语音的语义信息生成目标转换语音。
44.上述语音转换方法、装置、计算机设备、存储介质和计算机程序产品，通过获取待转换语音，提取待转换语音的语音特征和语义信息，以根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，进而根据目标语音特征和待转换语音的语义信息生成目标转换语音。通过上述方法即可保持待转换语音的语义信息仅替换语音特征，实现待转换语音到目标转换语音的转换，无需基于神经网络语音转换模型进行语音转换，降低了转换过程中的计算量，进而缩短了转换耗时，提高了效率。
附图说明
45.图1为一个实施例中语音转换方法的流程示意图；
46.图2为一个实施例中确定目标语音特征的流程示意图；
47.图3为一个实施例中构建语音特征对应关系的流程示意图；
48.图4为一个实施例中转换设备的结构示意图；
49.图5为另一个实施例中确定目标语音特征的流程示意图；
50.图6为一个实施例中确定目标对应关系的流程示意图；
51.图7为一个实施例中得到语音特征和语义信息的流程示意图；
52.图8为另一个实施例中确定目标语音特征的流程示意图；
53.图9为一个实施例中语音转换装置的结构框图；
54.图10为一个实施例中计算机设备的内部结构图。
具体实施方式
55.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
56.在一个实施例中，如图1所示，提供了一种语音转换方法，本实施例以该方法应用于计算机设备进行举例说明，可以理解的是，该计算机设备可以是众终端，也可以是服务器。本实施例中，该方法包括以下步骤：
57.s110、接收待转换语音，提取待转换语音的语音特征和语义信息。
58.其中，语音特征用于表征语音的声音特征，可以是语音特征向量。语义信息用于表征语音的语言含义，即语音所表达的具体含义。
59.可选地，待转换语音可以是计算机设备内本地存储的语音数据，也可以是实时接收到的语音数据。
60.可选地，计算机设备接收到待转换语音后，可采用预设的分离模型将待转换语音的特征和语音分离并提取，分别得到待转换语音的语音特征和语义信息。其中，分离模型为预先训练得到的用于对语音数据进行特征和语义分离并提取的网络模型。
61.s120、根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征。
62.其中，语音特征对应关系中包括至少一组语音特征对应关系。每一组语音特征对应关系包括两种语音特征，对应语音特征对应关系用于表征这两种语音特征相对应，可进行相互转换。例如，语音特征对应关系包括语音特征a和语音特征b，该语音特征对应关系即
可实现将语音特征a转换为语音特征b，也可以实现将语音特征b转换为语音特征a。
63.可选地，语音特征对应关系基于语音转换前的用户的语音信息录入操作确定，并预先存储在计算机设备中。在执行语音转换时，计算机设备则直接获取该语音特征对应关系，并根据该语音特征对应关系以及待转换语音的语音特征确定对应的目标语音特征。
64.s130、根据目标语音特征和待转换语音的语义信息生成目标转换语音。
65.可选地，计算机设备在确定待转换语音的语音特征所对应的目标语音特征和语义信息后，则将目标语音特征与语义信息结合，得到保持待转换语音的语义信息不变，但具有目标语音特征的目标转换语音。即计算机设备进行前述分离提取过程的逆过程，得到组合了目标语音特征和待转换语音的语义信息的目标转换语音。
66.本实施例中，计算机设备通过获取待转换语音，提取待转换语音的语音特征和语义信息，以根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，进而根据目标语音特征和待转换语音的语义信息生成目标转换语音。通过上述方法即可保持待转换语音的语义信息仅替换语音特征，实现待转换语音到目标转换语音的转换，无需基于神经网络语音转换模型进行语音转换，降低了转换过程中的计算量，进而缩短了转换耗时，提高了效率。
67.在其中一个实施例中，在语音特征对应关系中仅包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系的情况下，如图2所示，上述s120、根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，则包括：
68.s210、计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度。
69.在语音特征对应关系中仅包括一组语音特征对应关系的情况下，如前所述，该语音特征对应关系即可实现将语音特征a转换为语音特征b，也可以实现将语音特征b转换为语音特征a，此时，计算机设备在需确定具体转换方式，即到底是将待转换语音的语音特征转换为语音特征a还是语音特征b。上述语音特征a即第一语音特征，上述语音特征b即第二语音特征。
70.可选地，在不清楚语音特征对应关系中谁是源语音特征，谁是目标语音特征的情况下，计算机设备可计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度，以根据得到的特征相似度确定转换的目标语音特征。其中，以语音特征为语音特征向量为例，可采用向量之间的余弦值来表征上述特征相似度。计算机设备则计算待转换语音的语音特征向量与第一语音特征向量之间的余弦值，并计算待转换语音的语音特征向量与第二语音特征向量之间的余弦值。余弦值越大，表征两语音特征之间的特征相似度越大，反之，余弦值越小，表征两语音特征之间的特征相似度越小。
71.s220、在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
72.具体地，计算机设备根据前述得到的特征相似度在第一语音特征和第二语音特征中确定目标语音特征，具体是以得到最小特征相似度的语音特征作为上述目标语音特征。例如，待转换语音的语音特征向量与第一语音特征向量之间的余弦值大于待转换语音的语音特征向量与第二语音特征向量之间的余弦值，待转换语音的语音特征向量与第二语音特
征向量之间的余弦值即为上述最小特征相似度，得到该最小特征相似度的第二语音特征向量即为上述目标语音特征。
73.本实施例中，在语音特征对应关系中仅包括一组语音特征对应关系的情况下，为明确具体转换方式，计算机设备则通过计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度，进而在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。基于特征相似度的判断即可确定转换的目标语音特征，方便快捷且便于计算机程序实现，进而提高了语音转换效率。
74.在其中一个实施例中，在语音特征对应关系中包括多组语音特征对应关系的情况下，如图3所示，语音特征对应关系的构建过程，则包括：
75.s310、获取多个源语音和各源语音对应的目标语音。
76.其中，语音转换即保持源语音的语音信息，而将源语音的语音特征转换为目标语音的语音特征。
77.可选地，以实现上述语音转换方法的计算机设备为图4所示的转换设备为例进行说明，该转换设备包括箱壳1，箱壳1的顶部设置有安装顶槽3，安装顶槽3的内部通过转轴转动安装有话筒杆4，话筒杆4的一端固定安装有收音话筒2，箱壳1的侧壁上固定安装有喇叭5与接头口6，箱壳1的正面外壁上设置有usb接口7。
78.如图4所示，上述转换设备包括两组收音组件(m1和m2)，每组收音组件均包括连接有话筒杆4的收音话筒2，话筒杆4的另一端与转换设备的内部电路连接。上述收音组件用于采集语音数据，内部电路用于基于收音组件所采集到的语音数据构建语音特征对应关系，以及实现语音转换。
79.可选地，转换设备中的收音组件m1用于采集源语音，即由收音组件m1所采集到的语音数据即为源语音；转换设备中的收音组件m2用于采集目标语音，即由收音组件m2所采集到的语音数据即为目标语音。
80.如图4所示，上述转换设备包括两组输入接口(e1和e2)，每组输入接口均包括至少一个usb接口7，每一usb接口7对应与转换设备的内部电路连接。上述输入接口用于接收外部传输的语音数据，以供内部电路使用。
81.可选地，转换设备中与收音组件m1位于同侧的输入接口e1用于输入源语音，即由输入接口e1输入的语音数据即为源语音；转换设备中与收音组件m2位于同侧的收音组件m2用于输入目标语音，即由输入接口e2输入的语音数据即为目标语音。
82.可选地，转换设备上的喇叭5用于播放转换得到的目标转换语音；接头口6则用于向外部输出目标转换语音的语音数据。转换设备还可以包括散热网，以为整个转换设备散热。
83.在语音特征对应关系中包括一组语音特征对应关系时，用户可同时使用上述收音组件m1和收音组件m2进行源语音和目标语音的录入，也可以按照一定的先后顺序录入，以供内部电路对分别对源语音和目标语音进行特征提取后建立两者之间的对应关系。
84.在语音特征对应关系中包括多组语音特征对应关系时，用户可同时使用上述收音组件m1和收音组件m2进行源语音和目标语音的录入，并根据同时录入的源语音和目标语音构建一组语音特征对应关系，再进行下一组源语音和目标语音的录入，并建立对应的一组语音特征对应关系。
85.具体地，利用上述转换设备上的两组收音组件即可得到多个源语音和和源语音所对应的目标语音。
86.s320、提取各源语音的第一语音特征和各目标语音的第二语音特征。
87.具体地，转换设备中收音组件将采集到的每组源语音和对应的目标语音传输至内部电路，由内部电路进行语音特征提取，分别得到源语音的第一语音特征，和对应目标语音的第二语音特征。
88.s330、将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
89.具体地，转换设备进一步将得到的对应的第一语音特征和第二语音特征关联，即得到两语音特征之间的对应关系，并作为一组语音特征对应关系，多组源语音和对应的目标语音可对应提取得到多组第一语音特征和对应的第二语音特征，相应关联后即可得到多组语音特征对应关系。
90.本实施例中，计算机设备通过获取多个源语音和各源语音对应的目标语音，并提取各源语音的第一语音特征和各目标语音的第二语音特征，以将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系，即可实现多组语音特征对应关系的构建，提高了语音转换的多样性。
91.在其中一个实施例中，在语音特征对应关系中包括多组语音特征对应关系的情况下，如图5所示，上述120、根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征，则包括：
92.s510、根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系。
93.在语音特征对应关系中包括多组语音特征对应关系的情况下，计算机设备则需要确定待转换语音的语音特征所对应的目标对应关系，以根据该目标对应关系确定转换的目标语音特征。
94.s520、根据目标对应关系确定目标语音特征。
95.具体地，在明确了每组语音特征对应关系中源语音的语音特征和目标语音的语音特征的基础上，计算机设备可根据待转换语音的语音特征与多组语音特征对应关系中源语音的语音特征(即第一语音特征)之间的特征相似度在多组语音特征对应关系中确定目标对应关系，进而确定该目标对应关系中的第二语音特征为上述目标语音特征。
96.在一可选地实施例中，如图6所示，上述确定s510、根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系，包括：
97.s610、获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度。
98.具体地，每一组语音特征对应关系中均源语音的第一语音特征和目标语音的第二语音特征，计算机设备可计算待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度，进而根据该特征相似度确定目标对应关系。例如，语音特征对应关系包括3组语音特征对应关系，分别为：
①
第一语音特征s1对应第二语音特征t1，
②
第一语音特征s2对应第二语音特征t3，
③
第一语音特征s3对应第二语音特征t2。计算机设备则计算待转换语音的语音特征s分别与第一语音特征s1、s2以及s3之间的特征相似度，对应得
到特征相似度c1，c2以及c3。
99.s620、确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征。
100.具体地，计算机比较得到的特征相似度，从中确定大于相似度阈值的特征相似度，并确定得到该特征相似度的第一语音特征为目标第一语音特征。例如，继续上述举例，得到的特征相似度c1，c2以及c3中特征相似度c1大于相似度阈值c，计算机设备则确定得到该特征相似度c1的第一语音特征s1为目标第一语音特征。
101.可选地，在得到的特征相似度中存在多个特征相似度均大于相似度阈值，则确定得到最大特征相似度作的第一语音特征为目标第一语音特征。
102.可选地，若还包括多个最大特征相似度时，计算机设备则提取得到该最大特征相似度的第一语音特征的特征表示以供用户选择，并基于用户的选择操作确定目标语音特征。
103.s630、在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
104.具体地，计算机设备在根据特征相似度确定了目标第一语音特征后，即可在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的语音特征对应关系为目标对应关系，如直接确定在多组语音特征对应关系中确定第一语音特征与目标第一语音特征相同的语音特征对应关系为目标对应关系。继续上述举例，目标第一语音特征为第一语音特征s1，上述3组语音特征对应关系中对应关系
①
中第一语音特征s1即与目标第一语音特征s1相同，计算机设备即可确定该对应关系
①
第一语音特征s1对应第二语音特征t1即为上述目标对应关系。
105.本实施例中，在语音特征对应关系中包括多组语音特征对应关系的情况下，计算机设备可根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系，进而根据目标对应关系确定目标语音特征。其中，具体是通过获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度，确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征，以在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。通过上述方式即可在多组语音特征对应关系中快速而准确确定与待转换语音的语音特征所对应的目标对应关系，在提高转换效率的同时提高了转换的准确性。
106.在其中一个实施例中，为提高提取语音特征和语义信息的准确性，如图7，上述s110中提取待转换语音的语音特征和语义信息，包括：
107.s710、将待转换语音输入特征提取模型，得到待转换语音的语音特征。
108.其中，特征提取模型即用于提取语音数据中语音特征的网络模型，可采用大量语音数据训练得到。
109.具体地，计算机设备可将待转换语音输入特征提取模型，通过该特征提取模型对待转换语音进行语音特征提取，以得到待转换语音的语音特征。
110.s720、将待转换语音输入语义提取模型，得到待转换语音的语义信息。
111.其中，语义提取模型即用于提取语音数据中语音信息的网络模型，可采用大量语音数据训练得到。
112.具体地，计算机设备可将待转换语音输入语义提取模型，通过该语义提取模型对待转换语音进行语义信息提取，以得到待转换语音的语义信息。
113.可选地，上述特征提取模型和语义提取模型可以是两个独立的模型，也可以是同一模型中的两个子模型，可以并行提取，也可以按照一定先后顺序进行提取。
114.本实施例中，计算机设备通过训练得到的特征提取模型和语义提取模型，对待转换文件分别进行语音特征和语义信息的提取，以对应得到待转换语音的语音特征和语义信息，可有效提高提取的准确性，进而提高了整体语音转换的准确性。
115.为了便于本领域技术人员的理解，以下对本技术提供的语音转换方法进行详细介绍，如图8所示，该方法可以包括：
116.s801、获取待转换语音，并将待转换语音输入特征提取模型，得到待转换语音的语音特征；将待转换语音输入语义提取模型，得到待转换语音的语义信息；
117.s802、若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系，则计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；
118.s803、在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征；
119.s804、若语音特征对应关系中包括多组语音特征对应关系，语音特征对应关系的构建过程包括：
120.获取多个源语音和各源语音对应的目标语音；提取各源语音的第一语音特征和各目标语音的第二语音特征；将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系；
121.s805、获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；
122.s806、确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；
123.s807、在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系；
124.s808、根据目标对应关系确定目标语音特征；
125.s809、根据目标语音特征和待转换语音的语义信息生成目标转换语音。
126.需要说明的是，针对上述s801-s809中的描述可以参见上述实施例中相关的描述，且其效果类似，本实施例在此不再赘述。
127.应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
128.在一个实施例中，如图9所示，提供了一种语音转换装置，包括：语音处理模块901、
目标确定模块902和语音生成模块903，其中：
129.语音处理模块901用于获取待转换语音，提取待转换语音的语音特征和语义信息；
130.目标确定模块902用于根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；
131.语音生成模块903用于根据目标语音特征和待转换语音的语义信息生成目标转换语音。
132.在其中一个实施例中，若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系；
133.目标确定模块902具体用于：
134.计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
135.在其中一个实施例中，若语音特征对应关系中包括多组语音特征对应关系，语音处理模块901还用于构建语音特征对应关系，具体用于：
136.获取多个源语音和各源语音对应的目标语音；提取各源语音的第一语音特征和各目标语音的第二语音特征；将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
137.在其中一个实施例中，目标确定模块902还用于：
138.根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系；根据目标对应关系确定目标语音特征。
139.在其中一个实施例中，目标确定模块902具体用于：
140.获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
141.在其中一个实施例中，语音处理模块901具体用于：
142.将待转换语音输入特征提取模型，得到待转换语音的语音特征；将待转换语音输入语义提取模型，得到待转换语音的语义信息。
143.上述语音转换装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
144.在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种语音转换方法。
145.本领域技术人员可以理解，图10中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
146.在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：
147.获取待转换语音，提取待转换语音的语音特征和语义信息；根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；根据目标语音特征和待转换语音的语义信息生成目标转换语音。
148.在其中一个实施例中，若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系；处理器执行计算机程序时还实现以下步骤：
149.计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
150.在其中一个实施例中，若语音特征对应关系中包括多组语音特征对应关系，处理器执行计算机程序时还实现以下步骤：
151.获取多个源语音和各源语音对应的目标语音；提取各源语音的第一语音特征和各目标语音的第二语音特征；将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
152.在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：
153.根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系；根据目标对应关系确定目标语音特征。
154.在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：
155.获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
156.在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：
157.将待转换语音输入特征提取模型，得到待转换语音的语音特征；将待转换语音输入语义提取模型，得到待转换语音的语义信息。
158.在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：
159.获取待转换语音，提取待转换语音的语音特征和语义信息；根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；根据目标语音特征和待转换语音的语义信息生成目标转换语音。
160.在其中一个实施例中，若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系；计算机程序被处理器
执行时还实现以下步骤：
161.计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
162.在其中一个实施例中，若语音特征对应关系中包括多组语音特征对应关系，计算机程序被处理器执行时还实现以下步骤：
163.获取多个源语音和各源语音对应的目标语音；提取各源语音的第一语音特征和各目标语音的第二语音特征；将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
164.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
165.根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特征相似度在多组语音特征对应关系中确定目标对应关系；根据目标对应关系确定目标语音特征。
166.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
167.获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
168.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
169.将待转换语音输入特征提取模型，得到待转换语音的语音特征；将待转换语音输入语义提取模型，得到待转换语音的语义信息。
170.在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：
171.获取待转换语音，提取待转换语音的语音特征和语义信息；根据预设的语音特征对应关系，获取待转换语音的语音特征对应的目标语音特征；其中，语音特征对应关系中包括至少一组语音特征对应关系；根据目标语音特征和待转换语音的语义信息生成目标转换语音。
172.在其中一个实施例中，若语音特征对应关系中包括一组语音特征对应关系，且语音特征对应关系表示第一语音特征和第二语音特征之间的对应关系；计算机程序被处理器执行时还实现以下步骤：
173.计算待转换语音的语音特征分别与第一语音特征和第二语音特征之间的特征相似度；在第一语音特征和第二语音特征中确定得到最小特征相似度的语音特征为目标语音特征。
174.在其中一个实施例中，若语音特征对应关系中包括多组语音特征对应关系，计算机程序被处理器执行时还实现以下步骤：
175.获取多个源语音和各源语音对应的目标语音；提取各源语音的第一语音特征和各目标语音的第二语音特征；将对应的第一语音特征和第二语音特征关联，得到多组语音特征对应关系。
176.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
177.根据待转换语音的语音特征与多组语音特征对应关系中第一语音特征之间的特
征相似度在多组语音特征对应关系中确定目标对应关系；根据目标对应关系确定目标语音特征。
178.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
179.获取待转换语音的语音特征与每一组语音特征对应关系中第一语音特征之间的特征相似度；确定得到特征相似度大于相似度阈值的第一语音特征为目标第一语音特征；在多组语音特征对应关系中确定第一语音特征与目标第一语音特征匹配的目标对应关系。
180.在其中一个实施例中，计算机程序被处理器执行时还实现以下步骤：
181.将待转换语音输入特征提取模型，得到待转换语音的语音特征；将待转换语音输入语义提取模型，得到待转换语音的语义信息。
182.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory，rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory，mram)、铁电存储器(ferroelectric random access memory，fram)、相变存储器(phase change memory，pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器等。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。
183.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
184.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本技术专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于英语口语考试的多维度评估系统

语音转换方法、装置、计算机设备、存储介质和程序产品与流程

相关文献

最热文献