一种语音语句断句处理方法及系统与流程

2022-02-22 19:48:13 来源：中国专利 TAG：

技术特征：
1.一种语音语句断句处理方法，其特征在于，所述处理方法包括如下步骤：步骤s1，用户输入语音信息；步骤s2，识别用户输入的语音信息；步骤s3，对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句，然后对若干相近语句进行等级划分；步骤s4，将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句。2.根据权利要求1所述的一种语音语句断句处理方法，其特征在于，所述步骤s1还包括：用户在进行语音输入时，可以进行人声直接输入或其他设备声音输入的选择；所述步骤s2还包括：对输入的语音进行声纹识别，对识别到的人声生成语音信息。3.根据权利要求2所述的一种语音语句断句处理方法，其特征在于，所述步骤s3还包括步骤a1，所述步骤a1包括：先将识别到语音转化为文字信息，将转化后的文字信息放入一时间横轴内，该时间横轴以语音输入的起始时间为起点，以语音输入结束的时间为终点，将文字信息中的每个文字对应到时间横轴内，分别标记每个语音的横坐标，然后通过第一时长计算方法计算出每个文字输入耗费的时长；将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值；再获取每两个文字之间的间隔时长，将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值；当断句差值大于第一断句阈值时，将该断句差值对应的两个文字进行分开断句。4.根据权利要求3所述的一种语音语句断句处理方法，其特征在于，所述步骤a1还包括：以文字信息中的文字距两侧文字的中点为两侧截止点，两侧截止点之间的时长即为该文字的输入耗费时长；其中，第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点；最后一个文字的两侧截止点分别为倒数第二个文字和最后一个文字在时间横轴上的中点以及时间横轴的终点。5.根据权利要求4所述的一种语音语句断句处理方法，其特征在于，所述步骤s3还包括步骤a2，所述步骤a2包括：对断句后的文字进行相近词语的替换，针对每句文字生成若干相近语句；从大数据中调取每个相近词语的使用频率，选取使用频率最多的词语进行优先推选，其余相近语句按照替换词语的使用频率由高到低进行排序；所述步骤s4还包括：选取使用频率最多的词语作为每句文字的优选语句，生成最终的文字信息进行推荐；对每句文字设置触碰下弹框，下弹框内按照按照替换词语的使用频率由高到低对相近语句进行排序，用户根据自身输入的语义选择是否替换优选语句。6.根据权利要求1-5任意一项所述的一种语音语句断句处理方法的处理系统，其特征在于，所述处理系统包括语音输入模块(1)、语音识别模块(2)、处理模块(3)以及推送模块(4)；所述语音输入模块(1)用于用户输入语音信息；所述语音识别模块(2)用于识别用户输入的语音信息；所述处理模块(3)用于对识别后的语音信息进行处理，并对应生成不同等级的语句；
所述处理模块(3)包括断句单元(31)以及等级划分单元(32)，所述断句单元(31)用于对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句；所述等级划分单元(32)用于对若干相近语句进行等级划分；所述推送模块(4)用于将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句。7.根据权利要求6所述的一种语音语句断句处理系统，其特征在于，所述语音输入模块(1)配置有语音输入策略，所述语音输入策略包括：用户在进行语音输入时，可以进行人声直接输入或其他设备声音输入的选择；所述语音识别模块(2)包括人声识别单元(21)，所述人声识别单元(21)配置有人声识别策略，所述人声识别策略包括：对输入的语音进行声纹识别，对识别到的人声生成语音信息并输出至处理模块(3)。8.根据权利要求7所述的一种语音语句断句处理系统，其特征在于，所述断句单元(31)配置有断句策略，所述断句策略包括：先将识别到语音转化为文字信息，将转化后的文字信息放入一时间横轴内，该时间横轴以语音输入的起始时间为起点，以语音输入结束的时间为终点，将文字信息中的每个文字对应到时间横轴内，分别标记每个语音的横坐标，然后通过第一时长计算方法计算出每个文字输入耗费的时长；将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值；再获取每两个文字之间的间隔时长，将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值；当断句差值大于第一断句阈值时，将该断句差值对应的两个文字进行分开断句；所述第一时长计算方法包括：以文字信息中的文字距两侧文字的中点为两侧截止点，两侧截止点之间的时长即为该文字的输入耗费时长；其中，第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点；最后一个文字的两侧截止点分别为倒数第二个文字和最后一个文字在时间横轴上的中点以及时间横轴的终点。9.根据权利要求8所述的一种语音语句断句处理系统，其特征在于，所述文字平均时长公式配置为：；所述断句间隔公式配置为：；其中，vwz为文字平均时长值，t1为第一个文字的输入耗费时长，tn为第n个文字的输入耗费时长，n为该文字信息的文字数量，pdc为断句差值，tj代表两个文字之间的间隔时长，i表示每两个文字之间间隔时长的数量，i为正整数，且i可以自由替换，a1为断句差值的转换系数，且a1大于零。10.根据权利要求9所述的一种语音语句断句处理系统，其特征在于，所述等级划分单元(32)配置有等级划分策略，所述等级划分策略包括：对断句后的文字进行相近词语的替换，针对每句文字生成若干相近语句；从大数据中调取每个相近词语的使用频率，选取使用频率最多的词语进行优先推选，其余相近语句按照替换词语的使用频率由高到低进行排序；所述推送模块(4)配置有推送策略，所述推送策略包括：选取使用频率最多的词语作为每句文字的优选语句，生成最终的文字信息进行推荐；对每句文字设置触碰下弹框，下弹框内按照按照替换词语的使用频率由高到低对相近
语句进行排序，用户根据自身输入的语义选择是否替换优选语句。

技术总结
本发明提供一种语音语句断句处理方法及系统，所述处理方法包括如下步骤：步骤S1，用户输入语音信息；步骤S2，识别用户输入的语音信息；步骤S3，对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句，然后对若干相近语句进行等级划分；步骤S4，将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句，本发明能够对用户输入的语音进行精准的断句识别，从而提高语音语义的断句识别准确性，以解决现有的语音断句识别不够精准的问题。题。题。

技术研发人员：汪张龙徐俊沈毅飞巫庭虎邹月荣
受保护的技术使用者：广州讯飞易听说网络科技有限公司
技术研发日：2021.12.17
技术公布日：2022/2/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于嘈杂环境的语音增强方法及系统与流程

一种语音语句断句处理方法及系统与流程

相关文献

最热文献