一种口语发音纠正方法、装置、设备及存储介质与流程

2021-09-14 22:38:00 来源：中国专利 TAG：发音纠正口语装置语言

1.本发明实施例涉及语言教学技术领域，尤其涉及一种口语发音纠正方法、装置、设备及存储介质。

背景技术：

2.随着全球经济一体化的发展，各国之间的交流越来越多。英语作为国际交流最常用的语言，在中国教育中越来越受重视。幼儿时期是一个人学习语言的关键时期，也是学习语言的最佳时期。作为启蒙教育的基石，少儿英语教育已成为社会关注的热点，随着社会经济的发展，文化交往的增多，人们对语言教育的目标也不断提高，家长们也愈发注意儿童的口语教育。
3.目前儿童英语教育主要分为线下、线上两种教育类型，随着互联网技术的高速发展，线上英语教育逐渐兴起，在目前阶段，常通过ai大数据技术实现对儿童的“教、学、练、测、评”，以达到在儿童学习英语过程中的陪伴教育作用。
4.然而目前市场上基于人工智能的线上英语教育模式或儿童伴读机器人类的产品中，用于英语口语练习的方式主要是通过发音测评打分，或针对标准音进行跟读，仅能简单进行口语评测，告知用户口语发音是否标准，难以为儿童提供针对性的口语发音纠错。

技术实现要素：

5.本发明提供一种口语发音纠错方法、装置、设备及存储介质，以在获取到儿童跟读语音时对其错读单词进行提取，并生成对错读音节突出加强后的纠音单词文件，以使儿童快速发现错读问题并加以改正，提高口语练习的有效性。
6.第一方面，本发明实施例提供一种口语发音纠正方法，包括：
7.获取朗读文本，以及与朗读文本对应的朗读语音；
8.根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；
9.根据目标单词与目标音素生成纠音单词文件；
10.其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
11.进一步地，朗读文本由至少一个单词构成；获取朗读文本，以及与朗读文本对应的朗读语音之后，还包括：
12.根据朗读文本将朗读语音划分为至少一个语音单词；其中，各语音单词与朗读文本中的单词一一对应；
13.将各语音单词依据预设语音字典进行音素划分，确定各语音单词对应的音素集合。
14.进一步地，根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素，包括：
15.根据预设口语评分标准对各语音单词对应的音素集合中各音素打分，确定各音素
对应的音素得分；
16.将音素得分小于预设分数阈值的音素确定为目标音素；
17.将目标音素对应的语音单词确定为朗读文本中的目标单词。
18.进一步地，根据目标单词与目标音素生成纠音单词文件，包括：
19.通过语音合成技术生成目标单词的标准发音文件；
20.将目标单词中各音素进行强制对齐，确定标准发音文件中各音素所在音节的音节边界位置；
21.确定目标音素在标准发音文件中的目标音节边界位置，并将目标音节边界位置间的音节确定为目标音节；
22.拉长目标音节，并将拉长目标音节后的标准发音文件确定为纠音单词文件。
23.进一步地，根据目标单词与目标音素生成纠音单词文件，包括：
24.将目标单词与目标音素输入至预设变速语音合成模型；
25.将预设变速语音合成模型的输出结果确定为纠音单词文件，纠音单词文件为对目标单词中目标音素进行音节拉长处理后的标准发音文件。
26.进一步地，在获取朗读文本之后，还包括：
27.根据朗读文本生成标准朗读语音；
28.播放标准朗读语音。
29.进一步地，预设口语评分标准为发音良好度gop评分标准。
30.第二方面，本发明实施例还提供了一种口语发音纠正装置，该口语发音纠正装置包括：
31.文本语音获取模块，用于获取朗读文本，以及与朗读文本对应的朗读语音；
32.目标确定模块，用于根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；
33.纠音文件生成模块，用于根据目标单词与目标音素生成纠音单词文件；其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
34.第三方面，本发明实施例还提供了一种口语发音纠正设备，包括：
35.存储装置以及一个或多个处理器；
36.存储装置，用于存储一个或多个程序；
37.当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上述第一方面的口语发音纠正方法。
38.第四方面，本发明实施例还提供了一种包含计算机可执行指令的存储介质，计算机可执行指令在由计算机处理器执行时用于执行如上述第一方面的口语发音纠正方法。
39.本发明实施例提供的一种口语发音纠正方法、装置、设备及存储介质，该方法通过获取朗读文本，以及与朗读文本对应的朗读语音；根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；根据目标单词与目标音素生成纠音单词文件；其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。通过采用上述技术方案，在用户根据被提供的朗读文本进行跟读时，获取与朗读文本对应的朗读语音，并根据预设口音评分标准确定朗读语音中误读的目标单词，以及目标单词中具体发生错读的目标音素，根据确定出的目标单词与目标音素生成对目标音素进行变速处
理后的目标单词的标准发音文件，并将其作为纠音单词文件提供给用户，以使用户可快速发现误读的单词，并根据纠音单词文件中的读音对该单词读音进行改正，解决了现有口语练习软件中仅能进行简单口语评测，难以针对性对发音进行纠正的问题，提高了口语练习中对错读发音纠正的针对性，提升了口语练习的有效性。
附图说明
40.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
41.图1是本发明实施例一中的一种口语发音纠正方法的流程图；
42.图2是本发明实施例二中的一种口语发音纠正方法的流程图；
43.图3是本发明实施例二中的一种根据预设口语评分标准对朗读语音中各音素进行打分的界面示例图；
44.图4是本发明实施例二中的一种根据目标单词与目标音素生成纠音单词文件的流程示意图；
45.图5是本发明实施例二中的一种根据目标单词与目标音素生成纠音单词文件的流程示意图；
46.图6是本发明实施例三中的一种口语发音纠正装置的结构示意图；
47.图7是本发明实施例四中的一种口语发音基站设备的结构示意图。
具体实施方式
48.为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施例方式作进一步地详细描述。应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
49.下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
50.在本发明的描述中，需要理解的是，术语“第一”、“第二”、“第三”等仅用于区别类似的对象，而不必用于描述特定的顺序或先后次序，也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。此外，在本发明的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
51.实施例一
52.图1为本发明实施例一提供的一种口语发音纠正方法的流程图，本实施例可适用于用户进行口语练习时对发音有误单词进行针对性纠正的情况，该方法可以由口语发音纠
正装置来执行，该口语发音纠正装置可以由软件和/或硬件来实现，该口语发音纠正装置可以配置在计算机设备上，该计算机设备可以是两个或多个物理实体构成，也可以是一个物理实体构成。
53.如图1所示，本实施例一提供的一种口语发音纠正方法，具体包括如下步骤：
54.s101、获取朗读文本，以及与朗读文本对应的朗读语音。
55.在本实施例中，朗读文本可理解为由具有口语发音纠正功能的软件或装置提供给用户，以供用户进行跟读的由多个单词构成的文本文件。朗读语音可理解为用户对朗读文本进行跟读，并由具有口语发音纠正功能的软件或装置采集得到的声音文件。
56.具体的，获取当前时刻供用户进行跟读的文本文件，将上述文本文件确定为朗读文本，并接收用户对朗读文本进行跟读所生成的声音文件，将上述声音文件作为与朗读文本所对应的朗读语音。
57.可选的，朗读文本可为具有口语发音纠正功能的软件或装置随机提供给用户的文本文件，也可为用户根据实际需求自行选择希望进行跟读的文本文件，也可为软件或装置根据用户历史学习进度自动为用户匹配的文本文件，需要明确的是，朗读文本可由任意满足文本选择逻辑的方式选择出来，朗读文本可为存储于软件或装置内的文本、用户导入的文本也可为由网络下载的文本，本发明实施例对此均不作限定。
58.s102、根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素。
59.其中，朗读文本由至少一个单词构成。
60.其中，预设口语评分标准为发音良好度gop评分标准。
61.在本实施例中，预设口语评分标准可理解为用以对获取到的用户朗读语音中各单词读音是否标准进行打分的标准，其可将打分的最小粒度划分为音素，针对各单词中各音素的读音进行打分。可选的，预设口语评分标准为发音良好度(goodness of pronunciation，gop)评分标准，该gop评分标准是由麻省理工大学的silke witt在他的博士论文中提出的，其他口语评分标准也大都与gop评分标准类似，或由gop评分标准衍生而来，因此预设口语评分标准可采用现有评分标准中最小粒度达到音素的评分标准中的任意一种，本发明实施例对此不进行限制，仅是以gop评分标准作为示例。
62.在本实施例中，目标单词可理解为朗读语音中存在口语发音错误的单词在朗读文本中所对应的单词。目标音素可理解为目标单词中存在口语发音错误的音素。
63.具体的，通过预设口语评分标准对获取到的朗读语音中各单词进行打分，由于预设口语评分标准打分的最小粒度为音素，故可针对各单词中各音素进行打分，根据确定出各音素对应的音素得分，可确定读音不准的音素或出现误读的音素，也即读音不准的音素或出现误读的音素所对应的单词也存在口语发音问题，由于朗读语音中所包含的单词与朗读文本间的单词存在对应关系，故在确定出朗读语音中存在口语发音问题的单词时，即可将该单词确定为朗读文本中的目标单词，并根据读音不准的音素或出现误读的音素在存在口语发音问题的单词中的位置，确定目标单词中存在口语发音问题的音素，并将该存在口语发音问题的音素确定为目标单词中的目标音素。
64.s103、根据目标单词与目标音素生成纠音单词文件。
65.其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
66.在本实施例中，纠音单词文件可理解为根据用户存在口语发音错误的单词生成的，对错读单词中存在发音错误的音素进行强调处理的标准发音文件，用以提供至用户处进行播放，以使用户根据纠音单词文件中的单词读音对存在口语发音错误的单词读法进行纠正。
67.具体的，根据确定出的朗读文本中的目标单词，依据单词的标准发音生成目标单词对应的标准发音文件，由于目标音素为目标单词中存在读音错误的音素，故在生成纠音单词文件时需对目标单词中的目标音素进行突出，故可在标准发音文件中确定目标音素所对应的音素，对确定出的音素进行变速处理，并将经变速处理后的标准发音文件作为目标单词对应的纠音单词文件，进而可将该纠音单词文件提供至用户以使用户可根据纠音单词文件中的单词读音对存在口语发音错误的单词读法进行纠正。
68.进一步地，在针对标准发音文件中的目标元素所对应音素进行处理时，也可将确定出的音素进行读音加重处理，以使得生成的纠音单词文件中对存在错读问题的音素进行重读强调，上述强调方法仅为一种可选的实施方式，本发明实施例对生成纠音单词文件时针对目标音素的处理方式不进行具体限制。
69.本发明实施例通过获取朗读文本，以及与朗读文本对应的朗读语音；根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；根据目标单词与目标音素生成纠音单词文件；其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。通过采用上述技术方案，在用户根据被提供的朗读文本进行跟读时，获取与朗读文本对应的朗读语音，并根据预设口音评分标准确定朗读语音中误读的目标单词，以及目标单词中具体发生错读的目标音素，根据确定出的目标单词与目标音素生成对目标音素进行变速处理后的目标单词的标准发音文件，并将其作为纠音单词文件提供给用户，以使用户可快速发现误读的单词，并根据纠音单词文件中的读音对该单词读音进行改正，解决了现有口语练习软件中仅能进行简单口语评测，难以针对性对发音进行纠正的问题，提高了口语练习中对错读发音纠正的针对性，提升了口语练习的有效性。
70.实施例二
71.图2为本发明实施例二提供的一种口语发音纠正方法的流程图，本发明实施例的技术方案在上述各可选技术方案的基础上进一步优化，在获取朗读文本之后，根据朗读文本生成标准朗读语音并将标准朗读语音播放，以使用户可根据播放的标准朗读语音进行跟读，进而获取与朗读文本对应的朗读语音。在获取到朗读语音之后可根据朗读文本将朗读语音划分为与朗读文本相对应的多个单词，并根据预设语音字典对各单词进行音素划分，得到对应各语音单词的音素集合，以便于依据预设口语评分标准对朗读语音中各语音单词进行打分，并根据打分结果确定朗读文本中的目标单词以及目标单词中的目标音素，进而给出了两种利用目标单词与目标音素生成纠音单词文件的方法，使得提供给用户的纠音单词文件中不只包含目标单词的标准读音，还对目标单词中用户发生误读的目标音素进行强调，以使用户在获取到的纠音单词文件时可更直观的明确单词中发生误读的音素，并有针对性地进行纠正，提高了口语练习中对错读发音纠正的针对性，提升了口语练习的有效性。
72.如图2所示，本发明实施例二提供的一种口语发音纠正方法，具体包括如下步骤：
73.s201、获取朗读文本。
74.s202、根据朗读文本生成标准朗读语音。
75.具体的，确定朗读文本所对应的语种，获取该语种现行的标准发音规则，根据标准发音规则将朗读文本通过语音合成技术合成出其中各单词的标准单词发音，以及各句子的标准句子发音，将合成出的各标准单词发音及标准句子发音进行组合，并将组合结果确定为朗读文本对应的标准朗读语音。
76.s203、播放标准朗读语音。
77.具体的，可在生成标准朗读语音后即对标准朗读语音进行播放，也可在生成标准朗读语音后监测是否获取到用户的触发操作，进而在获取到用户触发操作时对标准朗读语音进行播放，以使用户可根据播放的标准朗读语音对朗读文本进行跟读，生成朗读语音。
78.s204、获取与朗读文本对应的朗读语音。
79.s205、根据朗读文本将朗读语音划分为至少一个语音单词。
80.其中，各语音单词与朗读文本中的单词一一对应。
81.具体的，由于朗读文本可由一个或多个单词组成，且各个单词的读音各不相同，故可根据朗读文本所具有的单词，结合朗读语音中的停顿，以及朗读语音中各单词的不同读音，将朗读语音划分为多个语音单词，且划分后所得到的各语音单词与朗读文本中的单词存在一一对应关系。
82.s206、将各语音单词依据预设语音字典进行音素划分，确定各语音单词对应的音素集合。
83.在本实施例中，预设语音字典可理解为用以对单词进行音素划分的，可作为音素划分依据的发音词典。可选的，本技术中所采用的预设语音字典可为卡耐基梅隆大学cmu发音字典，也可为其他通用发音字典，本发明实施例对此不进行限制。
84.示例性的，若朗读文本为“welcome to china”，则根据cmu发音字典对获取到的朗读语音进行音素划分，则可得到朗读语音对应的音素为：
85.w eh1 l
‑
k ah0 m/t uw1/ch ay1
‑
n ah0
86.也即可确定朗读语音中的三个语音单词分别为“welcome”、“to”和“china”，其所对应的音素集合则可分别表示为[w eh1 l k ah0 m]、[t uw1]和[ch ay1 n ah0]。
[0087]
s207、根据预设口语评分标准对各语音单词对应的音素集合中各音素打分，确定各音素对应的音素得分。
[0088]
具体的，根据已知的与各语音单词对应的朗读文本，将各语音单词与其对应的朗读文本中的单词进行一次强制对齐，并将强制对其后得到的似然分数值与在不知道朗读文本时根据语音单词得到的似然分数值做比，根据所得的似然比确定音素集合中各音素对应的音素得分。
[0089]
示例性的，图3为本发明实施例二提供的一种根据预设口语评分标准对朗读语音中各音素进行打分的界面示例图。其中，界面中显示有用户跟读的朗读文本，朗读文本所对应的各语音单词依据预设语音字典进行音素划分后所得的正确读音，以及用户跟读后所得到的朗读语音中各音素对应得分。
[0090]
s208、将音素得分小于预设分数阈值的音素确定为目标音素。
[0091]
具体的，当音素得分小于预设分数阈值时，可认为该音素的发音存在错误，或可认为该音素在该单词中的读音存在错误，此时可将该音素确定为目标音素。
[0092]
可选的，预设分数阈值可为60分，也可为根据实际情况设置的其他分数阈值，本发
明实施例对此不进行限制。示例性的，可根据预先选择的评价标准设置预设分数阈值，若评价标准为泛读，则可设置预设分数阈值为60分，也即可认为在该标准下用户发音达到普通可被听懂程度即可认为通过；若评价标准为精读，则可设置预设分数阈值为80分，也即可认为在该标准下用户发音需达到与标准发音较为贴切的程度才可被认为通过。
[0093]
s209、将目标音素对应的语音单词确定为朗读文本中的目标单词。
[0094]
具体的，在确定出目标音素后，由于目标音素为存在错读问题的音素，故目标音素所对应的语音单词也可认为是存在错读问题的单词，进一步地，由于语音单词与朗读文本中的单词存在一一对应关系，故在确定出目标音素对应的语音单词时，即可将朗读文本中与该语音单词对应的单词确定为目标单词。
[0095]
s210、根据目标单词与目标音素生成纠音单词文件。
[0096]
其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
[0097]
进一步地，图4为本发明实施例二提供的一种根据目标单词与目标音素生成纠音单词文件的流程示意图，如图4所示，具体包括如下步骤：
[0098]
s301、通过语音合成技术生成目标单词的标准发音文件。
[0099]
具体的，根据目标单词的现行标准发音规则，通过语音合成技术结合标准发音规则生成对应的标准单词发音，并将上述标准单词发音确定为目标单词的标准发音文件。
[0100]
s302、将目标单词中各音素进行强制对齐，确定标准发音文件中各音素所在音节的音节边界位置。
[0101]
具体的，由于一个单词可对应多个音素，故可将目标单词划分为多个音素，利用现有声学模型中的强制对齐功能，对目标单词中各音素进行强制对齐，且一个音节中可包含多个音素，可根据音素所在位置确定其在单词中的音节位置，进而确定出目标单词对应的标准发音文件中各音素所在音节对应的音节边界位置。
[0102]
s303、确定目标音素在标准发音文件中的目标音节边界位置，并将目标音节边界位置间的音节确定为目标音节。
[0103]
具体的，由于目标音素为目标单词中存在发音错误的音素，在生成纠音单词文件时需对错读音素部分进行处理以达到强调目的，故可根据目标音素在目标单词中的位置，确定目标音素在标准发音文件中的目标音节边界位置，也即确定出需进行处理的音节标准发音文件中的位置，并将目标音节边界位置间的音节确定为目标音节，以便后续对该目标音节进行处理。
[0104]
s304、拉长目标音节，并将拉长目标音节后的标准发音文件确定为纠音单词文件。
[0105]
具体的，为对错读位置起到强调效果，可将确定出的目标音节边界位置间的目标音节进行拉长处理，示例性的，可将目标音节边界位置间的目标音节拉长为原音节的二倍长度，使得进行音节拉长后的标准发音文件在进行播放时对目标音素所对应音节播放时间延长以起到强调效果，并将拉长音节后的标准发音文件确定为纠音单词文件。
[0106]
进一步地，图5为本发明实施例二提供的另一种根据目标单词与目标音素生成纠音单词文件的流程示意图，如图5所示，具体包括如下步骤：
[0107]
s401、将目标单词与目标音素输入至预设变速语音合成模型。
[0108]
在本实施例中，预设变速语音合成模型可理解为一种预先训练好的，集成有语音变速算法的语音生成模型，其可在进行语音生成的过程中直接就所需生成的单词中的部分
音素进行重音、拉长、缩短等处理。
[0109]
s402、将预设变速语音合成模型的输出结果确定为纠音单词文件。
[0110]
其中，纠音单词文件为对目标单词中目标音素进行音节拉长处理后的标准发音文件。
[0111]
具体的，将目标单词与目标音素输入至预设变速语音合成模型中，以使的预设变速语音合成模型生成对目标单词中目标音素的音节进行拉长的标准语音文件并输出，将预设变速语音合成模型的输出结果直接确定为纠音单词文件。
[0112]
本发明实施例的技术方案，在获取朗读文本之后，根据朗读文本生成标准朗读语音并将标准朗读语音播放，以使用户可根据播放的标准朗读语音进行跟读，进而获取与朗读文本对应的朗读语音。进而在获取到朗读语音之后可根据朗读文本将朗读语音划分为与朗读文本相对应的多个单词，并根据预设语音字典对各单词进行音素划分，得到对应各语音单词的音素集合，以便于依据预设口语评分标准对朗读语音中各语音单词进行打分，并根据打分结果确定朗读文本中的目标单词以及目标单词中的目标音素，可根据目标单词生成标准发音文件后对标准发音文件中的目标音素进行拉长以得到纠音单词文件，也可将目标单词与目标音素直接输入至预设变速语音合成模型中，将模型输出结果直接确定为纠音单词文件，使得提供给用户的纠音单词文件在播放时可针对目标单词中用户发生误读的目标音素进行强调，以使用户在获取到的纠音单词文件时可更直观的明确单词中发生误读的音素，并有针对性地进行纠正，提高了口语练习中对错读发音纠正的针对性，提升了口语练习的有效性。
[0113]
实施例三
[0114]
图6为本发明实施例三提供的一种口语发音纠正装置的结构示意图，该口语发音纠正装置包括：文本语音获取模块51，目标确定模块52和纠音文件生成模块53。
[0115]
其中，文本语音获取模块51，用于获取朗读文本，以及与朗读文本对应的朗读语音；目标确定模块52，用于根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；纠音文件生成模块53，用于根据目标单词与目标音素生成纠音单词文件；其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
[0116]
可选的，朗读文本由至少一个单词构成。
[0117]
进一步地，口语发音纠正装置，还包括：
[0118]
标准语音生成模块，用于根据朗读文本生成标准朗读语音；播放标准朗读语音。
[0119]
语音单词划分模块，用于根据朗读文本将朗读语音划分为至少一个语音单词；其中，各语音单词与朗读文本中的单词一一对应。
[0120]
音素划分模块，用于将各语音单词依据预设语音字典进行音素划分，确定各语音单词对应的音素集合。
[0121]
进一步地，目标确定模块52，包括：
[0122]
音素得分确定单元，用于根据预设口语评分标准对各语音单词对应的音素集合中各音素打分，确定各音素对应的音素得分。
[0123]
目标元素确定单元，用于将音素得分小于预设分数阈值的音素确定为目标音素。
[0124]
目标单词确定单元，用于将目标音素对应的语音单词确定为朗读文本中的目标单
词。
[0125]
进一步地，纠音文件生成模块53，具体用于：通过语音合成技术生成目标单词的标准发音文件；将目标单词中各音素进行强制对齐，确定标准发音文件中各音素所在音节的音节边界位置；确定目标音素在标准发音文件中的目标音节边界位置，并将目标音节边界位置间的音节确定为目标音节；拉长目标音节，并将拉长目标音节后的标准发音文件确定为纠音单词文件。
[0126]
进一步地，纠音文件生成模块53，还用于：将目标单词与目标音素输入至预设变速语音合成模型；将预设变速语音合成模型的输出结果确定为纠音单词文件，纠音单词文件为对目标单词中目标音素进行音节拉长处理后的标准发音文件。
[0127]
可选的，预设口语评分标准为发音良好度gop评分标准。
[0128]
本发明实施例所提供的口语发音纠正装置可执行如本发明任意实施例所提供的口语发音纠正方法，具备执行方法相应的功能模块和有益效果。
[0129]
实施例四
[0130]
图7给出了本发明实施例四提供的一种口语发音纠正设备的结构示意图。该计算机设备包括：处理器60、存储装置61、显示屏62、输入装置63以及输出装置64。该口语发音纠正设备中处理器60的数量可以是一个或者多个，图7中以一个处理器60为例。该口语发音纠正设备中存储装置61的数量可以是一个或者多个，图7中以一个存储装置61为例。该口语发音纠正设备的处理器60、存储装置61、显示屏62、输入装置63以及输出装置64可以通过总线或者其他方式连接，图7中以通过总线连接为例。实施例中，口语发音纠正设备可以是电脑、笔记本或智能平板等。
[0131]
存储装置61作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本技术任意实施例所述的口语发音纠正设备对应的程序指令/模块(例如，文本语音获取模块51，目标确定模块52和纠音文件生成模块53)。存储装置61可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储装置61可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置61可进一步包括相对于处理器60远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0132]
显示屏62可以为具有触摸功能的显示屏62，其可以是电容屏、电磁屏或者红外屏。一般而言，显示屏62用于根据处理器60的指示显示数据，还用于接收作用于显示屏62的触摸操作，并将相应的信号发送至处理器60或其他装置。
[0133]
输入装置63可用于接收输入的数字或者字符信息，以及产生与展示设备的用户设置以及功能控制有关的键信号输入，还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置64可以包括扬声器等音频设备。需要说明的是，输入装置63和输出装置64的具体组成可以根据实际情况设定。
[0134]
处理器60通过运行存储在存储装置61中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的口语发音纠正方法。
[0135]
上述提供的计算机设备可用于执行上述任意实施例提供的口语发音纠正方法，具
备相应的功能和有益效果。
[0136]
实施例五
[0137]
本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种口语发音纠正方法，该方法包括：
[0138]
获取朗读文本，以及与朗读文本对应的朗读语音；
[0139]
根据朗读语音与预设口语评分标准确定朗读文本中的目标单词，以及目标单词中的目标音素；
[0140]
根据目标单词与目标音素生成纠音单词文件；
[0141]
其中，纠音单词文件为对目标单词中目标音素进行变速处理后的标准发音文件。
[0142]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的口语发音纠正方法中的相关操作。
[0143]
通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(read
‑
only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。
[0144]
值得注意的是，上述搜索装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。
[0145]
注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种传输语音的方法、系统、电子设备及存储介质与流程

一种口语发音纠正方法、装置、设备及存储介质与流程

相关文章

最热文献