一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本的音频呈现方法与流程

2022-06-05 07:14:40 来源:中国专利 TAG:


1.本发明涉及录音技术领域,特别涉及一种文本的音频呈现方法。


背景技术:

2.随着技术的发展以及信息获取途径的多元化,数字媒体不断冲击传统媒体,大众的阅读习惯也在不停地发生着改变,从而催生出了有声读物这种阅读形式。有声读物是一种以声音为媒介的电子读物,包括有声新闻、有声小说等等,有声读物与数字媒体和传统媒体之间既有交叉又有区别,其具有的独特优势能够满足各种用户的需求。
3.然而,发明人经研究发现,现有技术中有声读物的制作不是系统化、流程化的,尤其是将现有的文本例如小说或者剧本转换为录音脚本的过程需要花费大量人工和时间,而根据录音脚本所生成的最终录音作品的质量也由于不是系统化、流程化的产出而变得极不可控,不同的录音部分之间的质量参差不齐,导致读者的用户体验大大下降,可见现有技术中制作有声读物的生产效率低、灵活性差。


技术实现要素:

4.基于此,为解决现有技术中的技术问题,特提出了一种文本的音频呈现方法,包括:获取待标注的文本并理解文本内容;在理解文本内容的基础上,对待标注的文本进行标注处理;完成文本的标注处理,将文本编辑为录音脚本并提供给录音脚本使用者。
5.在一种实施例中,对待标注的文本进行标注处理,包括:待标注的文本由一个或多个段落构成,段落为文本的基本构成单元;为段落正文标注角色信息和参考信息;其中,段落正文为提供给配音演员的文稿;角色信息为段落正文内容所对应的角色;根据角色信息将该段落分配至与角色相匹配的配音演员。
6.在一种实施例中,为段落正文标注的参考信息包括表演参考信息、制作参考信息;其中,表演参考信息为对配音演员的表演方式进行描述的参考信息;表演参考信息附于段落正文被提供给配音演员使用;其中,制作参考信息为对后期制作的素材选择及演绎方式进行描述的参考信息,所述制作参考信息被提供给配音演员、后期制作人员、审听质控人员使用。
7.在一种实施例中,表演参考信息包括情感、动作、发声方式、环境;制作参考信息包括音乐、音效、静音、开始事件、结束事件;其中,音乐的制作参考信息包括音乐风格、风格地域、乐器、调式、速度、音乐适用场景、音乐情绪;其中,音效的制作参考信息包括发声主体、音效类型、音效适用场景、音效情绪;其中,静音表示设定时间的留白;
其中,制作参考信息还包括开始事件、结束事件,开始事件、结束事件分别用于表示音乐、音效、静音的开始和结束。
8.在一种实施例中,将待标注的文本中一个或多个相互关联的段落划分为场景,并为场景标注场景属性;其中,所述场景属性包括时间、地点、角色、事件、演绎方式;为场景属性所标注的场景属性标签或场景属性描述文字构成文本的富内容。
9.在一种实施例中,在对待标注的文本进行标注处理前,根据场景属性通过场景模板库搜索并获取与其相匹配的场景模板;对场景模板进行细化处理,通过调整场景模板各个场景属性的属性值或者添加具体文字描述得到具体的场景;完成场景属性的标注后,在完成场景属性标注的场景中提取场景属性标签并生成场景模板,将生成的场景模板存储至场景模板库中。
10.在一种实施例中,其中,在对场景模板进行细化处理得到具体的场景后,或者对待标注的文本直接进行标注得到具体的场景后,利用场景属性与表演参考信息之间的相关性获取匹配的表演参考信息;在对场景模板进行细化处理得到具体的场景后,或者对待标注的文本直接进行标注得到具体的场景后,利用场景属性与制作参考信息之间的相关性获取匹配的制作参考信息。
11.在一种实施例中,在场景中,利用一个或多个时间标签对时间进行描述;或者,利用具体的时间描述文字对时间进行描述;在场景中,利用一个或多个地点标签对地点进行描述,地点标签包括对地点本身及地点周围环境的描述;或者,利用具体的地点描述文字对地点进行描述;在场景中,利用一个或多个角色属性标签对角色属性进行描述;或者,利用具体的角色属性描述文字对角色属性进行描述;角色属性包括角色名、角色别名、性别、年龄、角色类型、性格;在场景中,利用一个或多个角色关系标签对场景的角色集合中各个角色之间的角色关系进行描述;角色关系包括社会地位、物理距离、情感距离、冲突状态;场景的事件包括事件主体、事件客体、事件类型、事件描述、角色关系改变;在场景中,利用一个或多个演绎方式标签对演绎方式进行描述。
12.在一种实施例中,将待标注的文本依次划分为全局文本层级及局部文本层级;在全局文本层级定义并设置角色集合、地点集合、演员集合,角色集合、地点集合中的角色、地点在局部文本层级中进行复用和继承;其中,角色集合为全局文本层级中出现的所有角色的集合;地点集合为全局文本层级中出现的所有地点的集合;演员集合为全局文本层级中所有配音演员的集合。
13.在一种实施例中,利用一个或多个角色属性标签对角色集合中的角色属性进行描述;利用一个或多个演员属性标签对演员集合中的演员属性进行描述;将演员属性与角色属性相互关联,使得角色和演员之间存在匹配关系;根据角色的角色属性和配音演员的演员属性之间的相关性在演员集合中搜索匹配所述角色的配音演员。
14.实施本发明实施例,将具有如下有益效果:本发明实现了一种由文本向录音脚本转换的高效生产方法,利用场景模板在多个
维度上以标签形式描述文本中的场景特性,其继承性和复用性极大提高了场景配置效率;脚本使用者以场景模板为基础,通过调整场景属性的属性值,或添加具体文字描述即可得到具体场景;完成场景定义后,通过场景中各维度属性与表演参考信息的相关性可以快速匹配到合适的表演参考信息,通过场景中各维度属性与制作参考信息的相关性可以快速匹配到合适的制作参考信息,极大提升了录音脚本的生产效率。
15.附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.其中:图1为本发明中文本的音频呈现方法的流程示意图。
18.具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.本发明公开了一种文本的音频呈现方法,包括:获取待标注的文本并理解文本内容;在理解文本内容的基础上,对待标注的文本进行标注处理;其中,将待标注的文本依次划分为全局文本层级及局部文本层级;例如,待标注的文本可以是小说或者剧本,则其由全局到局部的文本层级依次为书籍、篇章、场景、段落;其中,书籍为全局文本层级,篇章、场景、段落为局部文本层级;段落为待标注的文本的基本构成单元;其中,书籍包含一个或多个篇章,书籍是篇章的前一级文本层级;篇章包含一个或多个场景,篇章是场景的前一级文本层级;场景包含一个或多个段落,场景是段落的前一级文本层级,一个场景内包含一个或多个相互关联的段落;在全局文本层级定义并设置角色集合、地点集合、演员集合,角色集合、地点集合中的角色、地点在局部文本层级中进行复用和继承;其中,角色集合为全局文本层级中出现的所有角色的集合;地点集合为全局文本层级中出现的所有地点的集合;演员集合为全局文本层级中所有配音演员的集合;例如,在书籍文本层级中,对角色、地点、配音演员进行全局定义并分别存入至书籍文本层级的角色集合、地点集合、演员集合中,书籍文本层级的角色集合、地点集合中的角色、地点可以在场景及段落文本层级中继承和复用;其中,利用一个或多个角色属性标签对角色集合中的角色属性进行描述;
角色属性包括角色名、角色别名、性别、年龄、角色类型、性格;具体地,角色名为角色的正式名称;角色别名包括该角色的小名、绰号等;性别包括男、女、中性等;年龄包括儿童、少年、青年、中年、老年等;角色类型包括旁白、主角、配角、路人等;性格包括精明、狡诈、油腻、妩媚等;其中,利用一个或多个演员属性标签对演员集合中的演员属性进行描述;演员属性包括演员名、性别、年龄、演员类型、性格;具体地,演员名为演员的姓名;性别包括男、女、中性等;年龄包括儿童、少年、青年、中年、老年等;演员类型包括旁白、主角、配角、路人等;性格包括精明、狡诈、油腻、妩媚等;将演员属性与角色属性相互关联,使得角色和演员之间存在匹配关系;具体地,将演员属性中的性别、年龄、演员类型、性格分别与角色属性中的性别、年龄、角色类型、性格相互关联;根据角色的角色属性和配音演员的演员属性之间的相关性在演员集合中搜索匹配所述角色的配音演员,并确定配音演员和角色之间的对应关系;一个配音演员可以同时出演多个角色;每个段落对应一个角色,则每个段落与为该角色配音的配音演员相对应;其中,利用一个或多个地点标签对地点集合中的地点进行描述,地点标签包括对地点本身及地点周围环境的描述;例如,地点标签可以是欧洲、中国、酒馆、森林、嘈杂、安静、虫鸣等;特别地,对待标注的文本进行标注处理,包括:待标注的文本由一个或多个段落构成;段落为文本的基本构成单元;段落与段落之间按照发生时间先后存在顺序关系;为段落正文标注角色信息和参考信息;其中,段落正文为提供给配音演员的文稿;角色信息为段落正文内容所对应的角色;根据角色信息将该段落分配至与角色相匹配的配音演员;段落正文包括旁白、对白;其中,为段落正文标注的参考信息包括表演参考信息、制作参考信息;其中,表演参考信息为对配音演员的表演方式进行描述的参考信息;表演参考信息附于段落正文被提供给配音演员使用;表演参考信息包括情感、动作、发声方式、环境;其中,情感为角色表现的情感,包括喜、怒、哀、乐等;动作为角色说话时做出的动作,包括笑、抽泣、大骂、呻吟、尖叫等;发声方式为角色说话的方式,包括耳语、大喊等;环境为角色说话时所处的环境,包括电话、洞穴、内心独白等;表演参考信息的形式包括类别、标签、自然语言描述;其中,制作参考信息为对后期制作的素材选择及演绎方式进行描述的参考信息,所述制作参考信息被提供给配音演员、后期制作人员、审听质控人员使用;后期制作人员基于制作参考信息搜索匹配的素材并利用素材进行后期制作;制作参考信息包括音乐、音效、静音、开始事件、结束事件;其中,音乐的制作参考信息包括音乐风格、风格地域、乐器、调式、速度、音乐适用
场景、音乐情绪;音乐风格为音乐的风格属性,包括古典、电子等;风格地域为音乐风格的地域属性,包括中国、日本、阿拉伯等;乐器为演奏音乐的乐器,包括钢琴、马林巴、二胡等;音乐调式为音乐的调式属性,包括大调、小调、七声调式等;音乐速度为音乐的节奏属性,包括快、中、慢等;音乐适用场景为音乐适用的场景,包括酒吧、郊外、战斗等;音乐情绪为音乐所表现的情绪,包括快乐、悲伤、激动等;其中,音效的制作参考信息包括发声主体、音效类型、音效适用场景、音效情绪;发声主体为发出音效声音的主体,包括人、动物、风、门、汽车等;音效类型为音效的分类属性,包括环境声、打击声、叫声等;音效适用场景为音效适用的场景,包括酒吧、郊外、战斗等;音效情绪为音效表现的情绪,包括快乐、悲伤、激动等;其中,静音表示设定时间的留白;其中,制作参考信息还包括开始事件、结束事件,开始事件、结束事件分别用于表示音乐、音效、静音的开始和结束;将开始事件或结束事件和正文中的特定内容进行同步;基于段落正文的文本内容对开始事件或结束事件进行同步;例如,开始事件同步发生于下一句或上一句中念出某个字或词的时刻;或者,基于时间偏移量对开始事件或结束事件进行同步;例如,开始事件同步发生于下一句或上一句开始前后若干秒的时刻;开始事件、结束事件的演绎方式包括淡入淡出等;开始事件、结束事件的演绎方式由对应的演绎参数进行描述,例如,演绎参数可以为淡入淡出时长;特别地,对待标注的文本进行标注处理,进一步包括:将待标注的文本中一个或多个相互关联的段落划分为场景,并为场景标注场景属性;即,场景由一个或多个段落构成;其中,所述场景属性包括但不仅限于时间、地点、角色、事件、演绎方式;为场景属性所标注的场景属性标签或场景属性描述文字构成文本的富内容(rich context);在场景中,角色在场景设定的时间及地点内展开互动,采用设定的演绎方式演绎不同的事件,从而推动脚本进程的发展和变化;其中,在场景中,利用一个或多个时间标签对时间进行描述;例如,时间标签可以是早晨、中午、下午、黄昏、夜晚等;或者,利用具体的时间描述文字对时间进行描述;例如,时间描述文字可以是2047年夏至的中午12点;其中,在场景中,利用一个或多个地点标签对地点进行描述,地点标签包括对地点本身及地点周围环境的描述;例如,地点标签可以是欧洲、中国、酒馆、森林、嘈杂、安静、虫鸣等;或者,利用具体的地点描述文字对地点进行描述;例如,地点描述文字可以是人声鼎沸的16世纪葡萄牙港口酒馆;
其中,场景中包括一个或多个角色,参与场景互动的所有角色构成场景文本层级的角色集合;其中,在场景中,利用一个或多个角色属性标签对角色属性进行描述;或者,利用具体的角色属性描述文字对角色属性进行描述;其中,角色属性包括角色名、角色别名、性别、年龄、角色类型、性格;具体地,角色名为角色的正式名称;角色别名包括该角色的小名、绰号等;性别包括男、女、中性等;年龄包括儿童、少年、青年、中年、老年等;角色类型包括旁白、主角、配角、路人等;性格包括精明、狡诈、油腻、妩媚等;其中,在场景中,利用一个或多个角色关系标签对场景的角色集合中各个角色之间的角色关系进行描述;角色关系包括社会地位、物理距离、情感距离、冲突状态;具体地,社会地位包括上下级等;物理距离包括距离远、距离近等;情感距离包括亲密、疏远等;冲突状态包括合作、不合作等;其中,场景的事件包括事件主体、事件客体、事件类型、事件描述、角色关系改变;事件主体也被称为事件施事,事件客体也被称为事件受事;其中,在场景中,利用一个或多个演绎方式标签对演绎方式进行描述;例如,演绎方式包括闪回(flashback)、蒙太奇(montage)等;特别地,在完成场景属性的标注后,在完成场景属性标注的场景中提取场景属性标签并生成场景模板;将生成的场景模板存储至场景模板库中;例如,中世纪小酒馆的场景模板包括的场景属性标签为时间标签及地点标签,其中,时间标签为中世纪,地点标签为小酒馆;场景模板生成后可以继承和复用至文本的其他场景中;其中,场景模板的场景属性包括但不仅限于时间、地点、角色、事件、演绎方式、表演方式、音乐、音效;场景模板的场景属性与场景的场景属性相互关联;特别地,在为属于特定场景的段落标注表演参考信息和制作参考信息时,利用场景属性与表演参考信息之间的相关性获取和场景属性匹配的表演参考信息,利用场景属性与制作参考信息之间的相关性获取和场景属性匹配的制作参考信息;例如,场景地点为安静洞穴的情况下,场景内段落的表演参考信息包括了身处洞穴的环境信息,场景内段落的制作参考信息包括了安静的音乐和音效情绪;特别地,在对待标注的文本进行标注处理前,根据场景属性通过场景模板库搜索并获取与其相匹配的场景模板;对场景模板进行细化处理,通过调整场景模板各个场景属性的属性值或者添加具体文字描述得到具体的场景;具体地,在为场景标注场景属性时,通过该场景的地点与场景模板库中场景模板的时间、地点、角色、事件、演绎方式之间的相关性,搜索并获取场景模板库中与该场景的地点相匹配的场景模板;特别地,在对场景模板进行细化处理得到具体的场景后,或者对待标注的文本直接进行标注得到具体的场景后,利用场景属性与表演参考信息之间的相关性获取匹配的表演参考信息;在对场景模板进行细化处理得到具体的场景后,或者对待标注的文本直接进行标注得到具体的场景后,利用场景属性与制作参考信息之间的相关性获取匹配的制作参考信
息;完成文本的标注处理,将文本编辑为录音脚本并提供给录音脚本使用者;其中,录音脚本使用者包括配音演员、后期制作人员、审听质控人员;配音演员为根据录音脚本的安排并参考录音脚本提供的信息进行配音表演的人员;后期制作人员为参考配音演员的表演以及录音脚本提供的信息为录音作品添加音乐和音效的人员;审听质控人员为参考录音脚本提供的信息审听录音作品并进行质量把控的人员;脚本编辑人员为将文本改编为录音脚本的人员,即脚本编辑人员为录音脚本的生产者;具体地,将录音脚本以可视化形式提供给配音演员、后期制作人员、审听质控人员;录音脚本使用者根据其自身需求从录音脚本中获取所需信息。
21.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献