一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

样本文本生成方法及装置与流程

2022-06-18 05:32:02 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,特别涉及一种样本文本生成方法、装置、电子设备和存储介质。


背景技术:

2.目前,随着深度学习、自然语言处理等人工智能技术的发展,文本智能处理技术逐渐成熟,例如,可通过文本智能处理技术来自动获取文本的主题内容、语义、意图等。相关技术中,文本智能处理技术需要大量的样本文本,用来训练算法或者模型。


技术实现要素:

3.本发明旨在至少在一定程度上解决上述技术中的技术问题之一。
4.为此,本发明的一个目的在于提出一种样本文本生成方法,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
5.本发明的第二个目的在于提出一种样本文本生成装置。
6.本发明的第三个目的在于提出一种电子设备。
7.本发明的第四个目的在于提出一种计算机可读存储介质。
8.本发明第一方面实施例提出了一种样本文本生成方法,包括:获取场景信息和样本文本库,其中,所述场景信息包括第一场景信息和第二场景信息;从所述样本文本库中选取与所述第一场景信息匹配的候选样本文本;将所述候选样本文本中的待替换文本替换为所述第二场景信息,生成目标样本文本。
9.根据本发明实施例的样本文本生成方法,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
10.另外,根据本发明上述实施例提出的样本文本生成方法还可以具有如下附加的技术特征:
11.在本发明的一个实施例中,所述从所述样本文本库中选取与所述第一场景信息匹配的候选样本文本,包括:获取样本文本与所述第一场景信息之间的第一相似度;基于所述第一相似度从所述样本文本库中选取与所述第一场景信息匹配的所述候选样本文本。
12.在本发明的一个实施例中,所述获取样本文本与所述第一场景信息之间的第一相似度,包括:获取所述样本文本的标注信息;获取所述标注信息与所述第一场景信息之间的第二相似度,并将所述第二相似度确定为所述第一相似度。
13.在本发明的一个实施例中,所述方法还包括:获取预设的至少一个场景维度;按照每个所述场景维度采集所述场景信息,生成每个所述场景维度下的所述场景信息。
14.在本发明的一个实施例中,所述方法还包括:获取预设的至少一个标注维度;按照每个所述标注维度标注所述样本文本,生成每个所述标注维度下的所述标注信息;将每个所述标注信息存储至所述样本文本库。
15.在本发明的一个实施例中,所述获取所述标注信息与所述第一场景信息之间的第二相似度,包括:识别所述标注信息的所述标注维度与所述第一场景信息的所述场景维度之间的重合维度;获取所述重合维度下的目标标注信息和目标第一场景信息;获取所述目标标注信息与所述目标第一场景信息之间的第三相似度,并将所述第三相似度确定为所述第二相似度。
16.在本发明的一个实施例中,所述获取所述目标标注信息与所述目标第一场景信息之间的第三相似度,包括:获取任一所述重合维度下的所述目标标注信息与所述目标第一场景信息之间的第四相似度;基于每个所述重合维度下对应的所述第四相似度,获取所述第三相似度。
17.在本发明的一个实施例中,所述将每个所述标注信息存储至所述样本文本库,包括:获取每个所述标注信息在所述样本文本库内的存储位置;将每个所述标注信息存储至各自对应的所述存储位置上。
18.在本发明的一个实施例中,所述生成目标样本文本之后,还包括:根据所述目标样本文本对文本处理模型进行训练。
19.本发明第二方面实施例提出了一种样本文本生成装置,包括:获取模块,用于获取场景信息和样本文本库,其中,所述场景信息包括第一场景信息和第二场景信息;选取模块,用于从所述样本文本库中选取与所述第一场景信息匹配的候选样本文本;生成模块,用于将所述候选样本文本中的待替换文本替换为所述第二场景信息,生成目标样本文本。
20.本发明实施例的样本文本生成装置,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
21.另外,根据本发明上述实施例提出的样本文本生成装置还可以具有如下附加的技术特征:
22.在本发明的一个实施例中,所述选取模块,包括:获取单元,用于获取样本文本与所述第一场景信息之间的第一相似度;选取单元,用于基于所述第一相似度从所述样本文本库中选取与所述第一场景信息匹配的所述候选样本文本。
23.在本发明的一个实施例中,所述获取单元,还用于:获取所述样本文本的标注信息;获取所述标注信息与所述第一场景信息之间的第二相似度,并将所述第二相似度确定为所述第一相似度。
24.在本发明的一个实施例中,所述装置还包括:采集模块,所述采集模块,用于:获取预设的至少一个场景维度;按照每个所述场景维度采集所述场景信息,生成每个所述场景维度下的所述场景信息。
25.在本发明的一个实施例中,所述装置还包括:标注模块,所述标注模块,用于:获取预设的至少一个标注维度;按照每个所述标注维度标注所述样本文本,生成每个所述标注
维度下的所述标注信息;将每个所述标注信息存储至所述样本文本库。
26.在本发明的一个实施例中,所述获取单元,还用于:识别所述标注信息的所述标注维度与所述第一场景信息的所述场景维度之间的重合维度;获取所述重合维度下的目标标注信息和目标第一场景信息;获取所述目标标注信息与所述目标第一场景信息之间的第三相似度,并将所述第三相似度确定为所述第二相似度。
27.在本发明的一个实施例中,所述获取单元,还用于:获取任一所述重合维度下的所述目标标注信息与所述目标第一场景信息之间的第四相似度;基于每个所述重合维度下对应的所述第四相似度,获取所述第三相似度。
28.在本发明的一个实施例中,所述标注模块,还用于:获取每个所述标注信息在所述样本文本库内的存储位置;将每个所述标注信息存储至各自对应的所述存储位置上。
29.在本发明的一个实施例中,所述装置还包括:训练模块,所述训练模块,用于:根据所述目标样本文本对文本处理模型进行训练。
30.本发明第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本发明第一方面实施例所述的样本文本生成方法。
31.本发明实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
32.本技术第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如本发明第一方面实施例所述的样本文本生成方法。
33.本发明实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
34.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
35.本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
36.图1为根据本发明一个实施例的样本文本生成方法的流程示意图;
37.图2为根据本发明一个实施例的样本文本生成方法中获取样本文本库之前的流程示意图;
38.图3为根据本发明一个实施例的样本文本生成方法中获取第二相似度的流程示意图;
39.图4为根据本发明一个实施例的样本文本生成装置的结构示意图;以及
40.图5为根据本发明一个实施例的电子设备的结构示意图。
具体实施方式
41.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
42.下面结合附图来描述本发明实施例的样本文本生成方法、装置、电子设备和存储介质。
43.图1为根据本发明一个实施例的样本文本生成方法的流程示意图。
44.如图1所示,本发明实施例的样本文本生成方法,包括:
45.s101,获取场景信息和样本文本库,其中,场景信息包括第一场景信息和第二场景信息。
46.本发明的实施例中,可获取场景信息,其中,场景信息包括第一场景信息和第二场景信息。应说明的是,第一场景信息、第二场景信息均可根据实际情况进行设置,这里不做过多限定。
47.在一种实施方式中,场景信息可包括至少一个场景维度下的场景信息。应说明的是,场景维度可根据实际情况进行设置,这里不做过多限定,例如,场景维度包括但不限于时间、对象所属国家、对象类型、对象编号、对象位置、对象速度、对象行为、对象意图、对象状态等。其中,对象位置包括但不限于对象经度、对象纬度、对象高度等,对象状态包括但不限于对象雷达状态、对象通信状态等。
48.在一种实施方式中,第一场景信息和/或第二场景信息包括至少一个场景维度下的场景信息。例如,第一场景信息包括对象位置、对象行为、对象意图等场景维度下的场景信息,第二场景信息包括时间、对象类型等场景维度下的场景信息。
49.在一种实施方式中,可获取预设的至少一个场景维度,并按照每个场景维度采集场景信息,生成每个场景维度下的场景信息。由此,该方法可按照预设的场景维度生成场景维度下的场景信息。
50.在一种实施方式中,可通过采集装置来采集场景信息。应说明的是,采集装置可根据实际情况进行设置,这里不做过多限定,例如,采集装置包括但不限于传感器、摄像机、雷达、导航系统等。其中,导航系统包括但不限于全球定位系统(global positioning system,gps)、北斗卫星导航系统(beidou navigation satellite system,bds)等。
51.在一种实施方式中,可通过网络传输获取携带有场景信息的文件,从文件中采集场景信息。
52.在一种实施方式中,可通过仿真模型生成携带有场景信息的仿真数据,从仿真数据中采集场景信息。应说明的是,仿真模型可根据实际情况进行设置,这里不做过多限定,例如,仿真模型可为深度学习模型。
53.本发明的实施例中,可获取样本文本库。应说明的是,样本文本库可包括多个样本文本。
54.在一种实施方式中,可通过网络传输获取携带有样本文本的文件,从文件中提取样本文本。
55.在一种实施方式中,可通过仿真模型生成携带有样本文本的仿真数据,从仿真数据中提取样本文本。应说明的是,仿真模型可根据实际情况进行设置,这里不做过多限定,例如,仿真模型可为深度学习模型。
56.s102,从样本文本库中选取与第一场景信息匹配的候选样本文本。
57.本发明的实施例中,可从样本文本库中选取与第一场景信息匹配的候选样本文本。
58.在一种实施方式中,从样本文本库中选取与第一场景信息匹配的候选样本文本,可包括获取样本文本与第一场景信息之间的第一相似度,基于第一相似度从样本文本库中选取与第一场景信息匹配的候选样本文本。
59.在一种实施方式中,获取样本文本与第一场景信息之间的第一相似度,可包括将样本文本与第一场景信息输入至相似度模型,由相似度模型输出样本文本与第一场景信息之间的第一相似度。应说明的是,相似度模型可根据实际情况进行设置,这里不做过多限定。
60.在一种实施方式中,基于第一相似度从样本文本库中选取与第一场景信息匹配的候选样本文本,可包括以下两种可能的实施方式:
61.方式1、将样本文本按照第一相似度从高到底进行排序,将排序前n个的样本文本确定为候选样本文本,其中,n为正整数。
62.需要说明的是,n可根据实际情况进行设置,这里不做过多限定,例如,n可设置为1。
63.由此,该方法可将样本文本按照第一相似度进行排序,并筛选出第一相似度较大的n个样本文本作为候选样本文本。
64.方式2、将第一相似度大于预设相似度阈值的样本文本确定为候选样本文本。
65.需要说明的是,预设相似度阈值可根据实际情况进行设置,这里不做过多限定,例如,预设相似度阈值可设置为80%。
66.由此,该方法可筛选出第一相似度大于预设相似度阈值的样本文本作为候选样本文本。
67.s103,将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。
68.本发明的实施例中,可将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本,即可利用第二场景信息对候选样本文本进行修正。
69.在一种实施方式中,将候选样本文本中的待替换文本替换为第二场景信息之前,可包括识别第二场景信息的场景维度,将候选样本文本中与识别出的场景维度对应的文本作为待替换文本。
70.例如,若第二场景信息包括时间、对象类型场景维度下的场景信息,则可将候选样本文本中与时间、对象类型场景维度对应的文本作为待替换文本。比如,第二场景信息包括“早上8点”、“车辆”,候选样本文本中包括“晚上6点”、“飞机”,则可将候选样本文本中“晚上6点”替换为“早上8点”,并将“飞机”替换为“车辆”。
71.综上,根据本发明实施例的样本文本生成方法,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信
息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
72.在上述任一实施例的基础上,如图2所示,步骤s101中获取样本文本库之前,可包括:
73.s201,获取预设的至少一个标注维度。
74.需要说明的是,标注维度可根据实际情况进行设置,这里不做过多限定。例如,标注维度包括但不限于样本文本的标识信息、来源、名称、处理开始时间、处理结束时间、样本文本中包含的事件数量、事件类型、事件时间、事件主题、事件内容、事件包含的对象所属国家、对象类型、对象位置、对象行为、对象意图等,这里不做过多限定。
75.在一种实施方式中,可为标注维度设置标识信息,以区分不同的标注维度。
76.s202,按照每个标注维度标注样本文本,生成每个标注维度下的标注信息。
77.本发明的实施例中,可按照每个标注维度标注样本文本,生成每个标注维度下的标注信息。
78.例如,若标注维度包括事件时间、对象类型、对象位置、对象行为、对象意图,则可按照事件时间、对象类型、对象位置、对象行为、对象意图标注维度分别标注样本文本,生成事件时间、对象类型、对象位置、对象行为、对象意图标注维度下的标注信息。
79.s203,将每个标注信息存储至样本文本库。
80.本发明的实施例中,可将每个标注信息存储至样本文本库。
81.在一种实施方式中,将每个标注信息存储至样本文本库,可包括获取每个标注信息在样本文本库内的存储位置,将每个标注信息存储至各自对应的存储位置上。
82.在一种实施方式中,可为每个样本文本分别设置对应的标注信息的存储位置,且同一个样本文本的不同标注信息可对应不同的存储位置。例如,可获取每个样本文本对应的标注信息的存储位置,并按照标注维度来划分每个标注信息的存储位置。
83.例如,样本文本a对应的标注信息的存储位置为存储位置a,样本文本a对应的标注维度包括事件时间、对象类型、对象位置、对象行为、对象意图,则可将存储位置a划分为5个存储位置,分别为存储位置a1、a2至a5,存储位置a1、a2至a5分别为事件时间、对象类型、对象位置、对象行为、对象意图标注维度对应的样本文本a的标注信息的存储位置。
84.由此,该方法可按照预设的标注维度生成标注维度下的标注信息。
85.在上述任一实施例的基础上,获取样本文本与第一场景信息之间的第一相似度,可包括获取样本文本的标注信息,获取标注信息与第一场景信息之间的第二相似度,并将第二相似度确定为第一相似度。
86.在一种实施方式中,获取样本文本的标注信息,可包括获取标注信息在样本文本库内的存储位置,并从存储位置上获取标注信息。应说明的是,获取标注信息在样本文本库内的存储位置的相关内容,可参见上述实施例,这里不再赘述。
87.在一种实施方式中,获取标注信息与第一场景信息之间的第二相似度,可包括将标注信息与第一场景信息输入至相似度模型,由相似度模型输出标注信息与第一场景信息之间的第一相似度。
88.由此,该方法可获取样本文本的标注信息与第一场景信息之间的第二相似度,并将第二相似度确定为第一相似度,来实现样本文本与第一场景信息之间的第一相似度的获
取。
89.在上述任一实施例的基础上,如图3所示,获取标注信息与第一场景信息之间的第二相似度,可包括:
90.s301,识别标注信息的标注维度与第一场景信息的场景维度之间的重合维度。
91.本发明的实施例中,标注信息的标注维度与第一场景信息的场景维度之间具有重合维度,重合维度的数量可为一个或多个。
92.例如,若标注信息的标注维度包括事件时间、对象类型、对象位置、对象行为、对象意图,第一场景信息的场景维度包括对象位置、对象行为、对象意图,则可识别标注信息的标注维度与第一场景信息的场景维度之间的重合维度包括对象位置、对象行为、对象意图。
93.s302,获取重合维度下的目标标注信息和目标第一场景信息。
94.本发明的实施例中,可从标注信息中获取重合维度下的目标标注信息,并从第一场景信息中获取重合维度下的目标第一场景信息。
95.例如,若重合维度包括对象位置、对象行为、对象意图,则可从标注信息中获取对象位置、对象行为、对象意图下的目标标注信息,以及从第一场景信息中获取对象位置、对象行为、对象意图下的目标第一场景信息。
96.s303,获取目标标注信息与目标第一场景信息之间的第三相似度,并将第三相似度确定为第二相似度。
97.在一种实施方式中,获取目标标注信息与目标第一场景信息之间的第三相似度,可包括将目标标注信息与目标第一场景信息输入至相似度模型,由相似度模型输出目标标注信息与目标第一场景信息之间的第一相似度。
98.在一种实施方式中,获取目标标注信息与目标第一场景信息之间的第三相似度,可包括对目标标注信息与目标第一场景信息分别进行模糊化处理,生成目标标注信息对应的第一模糊数值,以及目标第一场景信息对应的第二模糊数值,并通过下述公式来获取目标标注信息与目标第一场景信息之间的相似度参数:
[0099][0100]
其中,di为第i个样本文本对应的目标标注信息与目标第一场景信息之间的相似度参数,m为重合维度的数量,a
in
为第i个样本文本对应的第n个重合维度下的目标标注信息对应的第一模糊数值,b
in
为第i个样本文本对应的第n个重合维度下的目标第一场景信息对应的第二模糊数值,相似度参数di与第三相似度负相关。
[0101]
在一种实施方式中,获取目标标注信息与目标第一场景信息之间的第三相似度,可包括获取任一重合维度下的目标标注信息与目标第一场景信息之间的第四相似度,基于每个重合维度下对应的第四相似度,获取第三相似度。
[0102]
在一种实施方式中,获取任一重合维度下的目标标注信息与目标第一场景信息之间的第四相似度,可包括针对任一重合维度,对目标标注信息与目标第一场景信息分别进行模糊化处理,生成目标标注信息对应的第一模糊数值,以及目标第一场景信息对应的第二模糊数值,基于第一模糊数值与第二模糊数值的绝对差值获取第四相似度。其中,绝对差值与第四相似度负相关。
[0103]
在一种实施方式中,基于每个重合维度下对应的第四相似度,获取第三相似度,可
包括将第四相似度的平均值,作为第三相似度。
[0104]
例如,若重合维度包括对象位置、对象行为、对象意图,则可获取对象位置下的目标标注信息与目标第一场景信息之间的第四相似度,以及获取对象行为下的目标标注信息与目标第一场景信息之间的第四相似度,以及获取对象意图下的目标标注信息与目标第一场景信息之间的第四相似度,并将上述获取的每个第四相似度的平均值作为第三相似度。
[0105]
需要说明的是,本发明的实施例中,模糊化处理的具体方式可根据实际情况进行设置,这里不做过多限定,例如,可通过隶属度函数分别对标注信息、第一场景信息进行模糊化处理。
[0106]
由此,该方法可获取样本文本的标注信息与第一场景信息的场景维度之间的重合维度,并获取重合维度下的目标标注信息和目标第一场景信息之间的第三相似度,并将第三相似度确定为第二相似度,来实现样本文本的标注信息与第一场景信息之间的第二相似度的获取。
[0107]
在上述任一实施例的基础上,步骤s103中生成目标样本文本之后,还可包括根据目标样本文本对文本处理模型进行训练。应说明的是,文本处理模型可根据实际情况进行设置,这里不做过多限定,例如,文本处理模型的功能包括但不限于分词、语义提取、主题提取、意图预测、行为预测等。
[0108]
在一种实施方式中,可按照每个标注维度标注目标样本文本,生成每个标注维度下的标注信息,并将标注信息存储至样本文本库。由此,该方法可将目标样本文本的标注信息存储至样本文本库,可实现样本文本库的实时更新。
[0109]
在一种实施方式中,根据目标样本文本对文本处理模型进行训练,可包括将目标样本文本输入至文本处理模型,由文本处理模型输出目标样本文本的处理结果,利用目标样本文本的标注信息和处理结果调整文本处理模型的模型参数,直至达到模型训练结束条件,生成训练好的文本处理模型。应说明的是,模型训练结束条件可根据实际情况进行设置,这里不做过多限定,例如,模型训练结束条件包括但不限于模型训练次数达到预设次数阈值,模型精度达到预设精度阈值等。
[0110]
由此,该方法可根据与场景信息匹配度较高的目标样本文本对文本处理模型进行训练,可提高文本处理模型的训练效果和性能。
[0111]
为了实现上述实施例,本发明还提出一种样本文本生成装置。
[0112]
图4为根据本发明一个实施例的样本文本生成装置的结构示意图。
[0113]
如图4所示,本发明实施例的样本文本生成装置100,包括:获取模块110、选取模块120和生成模块130。
[0114]
获取模块110用于获取场景信息和样本文本库,其中,所述场景信息包括第一场景信息和第二场景信息;
[0115]
选取模块120用于从所述样本文本库中选取与所述第一场景信息匹配的候选样本文本;
[0116]
生成模块130用于将所述候选样本文本中的待替换文本替换为所述第二场景信息,生成目标样本文本。
[0117]
在本发明的一个实施例中,所述选取模块120包括:获取单元,用于获取样本文本与所述第一场景信息之间的第一相似度;选取单元,用于基于所述第一相似度从所述样本
文本库中选取与所述第一场景信息匹配的所述候选样本文本。
[0118]
在本发明的一个实施例中,所述获取单元,还用于:获取所述样本文本的标注信息;获取所述标注信息与所述第一场景信息之间的第二相似度,并将所述第二相似度确定为所述第一相似度。
[0119]
在本发明的一个实施例中,所述样本文本生成装置100还包括:采集模块,所述采集模块,用于:获取预设的至少一个场景维度;按照每个所述场景维度采集所述场景信息,生成每个所述场景维度下的所述场景信息。
[0120]
在本发明的一个实施例中,所述样本文本生成装置100还包括:标注模块,所述标注模块,用于:获取预设的至少一个标注维度;按照每个所述标注维度标注所述样本文本,生成每个所述标注维度下的所述标注信息;将每个所述标注信息存储至所述样本文本库。
[0121]
在本发明的一个实施例中,所述获取单元,还用于:识别所述标注信息的所述标注维度与所述第一场景信息的所述场景维度之间的重合维度;获取所述重合维度下的目标标注信息和目标第一场景信息;获取所述目标标注信息与所述目标第一场景信息之间的第三相似度,并将所述第三相似度确定为所述第二相似度。
[0122]
在本发明的一个实施例中,所述获取单元,还用于:获取任一所述重合维度下的所述目标标注信息与所述目标第一场景信息之间的第四相似度;基于每个所述重合维度下对应的所述第四相似度,获取所述第三相似度。
[0123]
在本发明的一个实施例中,所述标注模块,还用于:获取每个所述标注信息在所述样本文本库内的存储位置;将每个所述标注信息存储至各自对应的所述存储位置上。
[0124]
在本发明的一个实施例中,所述样本文本生成装置100还包括:训练模块,所述训练模块,用于:根据所述目标样本文本对文本处理模型进行训练。
[0125]
需要说明的是,本发明实施例的样本文本生成装置中未披露的细节,请参照本发明上述实施例的样本文本生成方法中所披露的细节,这里不再赘述。
[0126]
综上,本发明实施例的样本文本生成装置,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
[0127]
为了实现上述实施例,如图5所示,本发明实施例提出了一种电子设备200,包括:存储器210、处理器220及存储在存储器210上并可在处理器220上运行的计算机程序,所述处理器220执行所述程序时,实现上述的样本文本生成方法。
[0128]
本发明实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,可从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
[0129]
为了实现上述实施例,本发明实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述的样本文本生成方法。
[0130]
本发明实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,可
从样本文本库中选取与第一场景信息匹配的候选样本文本,并将候选样本文本中的待替换文本替换为第二场景信息,生成目标样本文本。由此,可基于第一场景信息选取匹配的候选样本文本,并利用第二场景信息对候选样本文本进行修正,使得生成的目标样本文本与场景信息精准匹配,有助于提高目标样本文本的准确性和灵活性。
[0131]
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0132]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0133]
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0134]
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
[0135]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0136]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献