对话数据增广方法、电子设备和存储介质与流程

2022-06-01 09:08:29 来源：中国专利 TAG：

技术特征：
1.一种对话数据增广方法，其特征在于，包括：获取对话模板提示信息；调用参数规模大于参数量阈值的预训练语言模型，应用该预训练语言模型基于所述对话模板提示信息独立进行对话数据增广处理。2.根据权利要求1所述的对话数据增广方法，其特征在于，在所述应用该预训练语言模型基于所述对话模板提示信息独立进行对话数据增广处理之前，还包括：采用数量小于样本阈值的对话样本对所述预训练语言模型进行微调。3.根据权利要求2所述的对话数据增广方法，其特征在于，所述获取对话模板提示信息，包括：获取预设的目标场景对应的以第一预设词引出的起始语句；基于当前目标场景的描述信息、所述以第一预设词引出的起始语句以及用于提示所述预训练语言模型续写的第二预设词生成所述目标场景对应的对话模板提示信息。4.根据权利要求3所述的对话数据增广方法，其特征在于，所述获取预设的目标场景对应的以第一预设词引出的起始语句，包括：在所述目标场景对应的开源对话数据集和/或针对所述目标场景的共享文本中提取对话起始语句；基于第一预设词和所述对话起始语句，生成以所述第一预设词引出的起始语句。5.根据权利要求3所述的对话数据增广方法，其特征在于，所述应用该预训练语言模型基于所述对话模板提示信息独立进行对话数据增广处理，包括：将所述对话模板提示信息写入预设的对话模板中，以使所述预训练语言模型在该对话模板中以所述第二预设词为起始续写对话数据以完成对话数据的增广处理。6.根据权利要求3所述的对话数据增广方法，其特征在于，所述目标场景包括：情绪支持对话场景；相对应的，所述采用数量小于样本阈值的对话样本对所述预训练语言模型进行微调，包括：在情绪支持任务esc框架下的情绪支持对话数据集esconv中，选取数量小于样本阈值的对话样本；应用所述对话样本对所述预训练语言模型进行微调。7.根据权利要求4所述的对话数据增广方法，其特征在于，所述目标场景包括：情绪支持对话场景；相对应的，所述开源对话数据集包括：开源的共情对话数据集empatheticdialogues；所述共享文本包括：公开社交平台reddit中的心理健康文字内容。8.根据权利要求1至7任一项所述的对话数据增广方法，其特征在于，所述预训练语言模型包括：gpt-j。9.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求1-8中任一所述的对话数据增广方法。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以实现如权利要求1-8中任一所述的对话数据增广方法。

技术总结
本申请公开了一种对话数据增广方法、电子设备及存储介质。该对话数据增广方法，包括：获取对话模板提示信息；调用参数规模大于参数量阈值的预训练语言模型，应用该预训练语言模型基于所述对话模板提示信息独立进行对话数据增广处理。本申请的对话数据增广方法能够有效提高开放端对话数据的增广效率，降低增广过程的复杂程度，提高开放端对话数据的增广规模及泛化能力，进而能够提高基于增广后的对话数据进行模型训练的有效性及可靠性。进行模型训练的有效性及可靠性。进行模型训练的有效性及可靠性。

技术研发人员：郑楚杰黄民烈
受保护的技术使用者：北京智源人工智能研究院
技术研发日：2022.02.25
技术公布日：2022/5/31

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种智慧在线辅导交互学习系统的制作方法

对话数据增广方法、电子设备和存储介质与流程

相关文献

最热文献