信息处理方法、设备和介质与流程

2021-07-02 21:13:00 来源：中国专利 TAG：数据处理介质公开方法设备

技术特征：

1.一种信息处理方法，其特征在于，包括：

将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；

根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；

基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。

2.根据权利要求1所述的方法，其特征在于，所述将字幕对应的语音转换为声学基元，包括：

采用预先建立的深度神经网络模型，将字幕对应的语音转换为声学基元，所述深度神经网络模型用于将语音转换为声学基元。

3.根据权利要求1所述的方法，其特征在于，所述映射关系为文本信息与关联信息的对应关系，所述根据预先建立的声学基元与内容单元之间的映射关系，确定与所述声学基元对应的内容单元，包括：

基于所述声学基元确定关联信息；

在预先建立的文本信息与关联信息的对应关系中，查找与所述关联信息对应的内容单元信息；

将所述内容单元信息，对应的内容单元确定为所述声学单元对应的内容单元。

4.根据权利要求3所述的方法，其特征在于，所述内容单元信息包括内容单元的文字编码，所述方法还包括：

将所述字幕对应的文本中的每个文字，转换为文字编码；

获取所述每个文字的声学基元，并确定所述声学基元对应的关联信息；

建立所述文字编码与所述关联信息的对应关系。

5.根据权利要求3所述的方法，其特征在于，所述关联信息为：文字的声学基元，或者，文字的声学基元对应的数字索引。

6.根据权利要求1所述的方法，其特征在于，还包括：

在拍摄视频时，采集所述视频中的语音，作为所述字幕对应的语音。

7.根据权利要求1所述的方法，其特征在于，所述基于所述时间信息和所述内容单元，构建包含时间信息的文本，包括：

对应所述内容单元组成的句子，添加所述句子对应的时间信息，以得到包含时间信息的句子；

按所述包含时间信息的句子的时间顺序，依序排列所述包含时间信息的句子，组成包含时间信息的文本。

8.根据权利要求1所述的方法，其特征在于，还包括：

将所述字幕文件与所述字幕文件对应的视频进行合成，以得到包含字幕的视频。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述声学基元为汉字的拼音，所述内容单元为汉字。

10.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

11.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

12.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。

技术总结
本公开公开了一种信息处理方法、设备和介质，涉及数据处理技术领域。该方法包括：将字幕对应的语音转换为声学基元，以及，确定所述语音的时间信息；根据预先建立的映射关系，确定与所述声学基元对应的内容单元，所述内容单元为所述字幕对应的文本中的内容单元，所述映射关系包括所述声学基元与所述内容单元之间的映射关系；基于所述时间信息和所述内容单元，构建包含时间信息的文本，并基于所述包含时间信息的文本，构建字幕文件。本公开可以提高字幕文件的生成效率。

技术研发人员：胡其斌;董宗保;单益峰
受保护的技术使用者：上海掌门科技有限公司
技术研发日：2021.03.23
技术公布日：2021.07.02

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

信息处理方法、设备和介质与流程

相关文章

最热文献