阅读理解候选选项个数不确定时的训练方法、装置及系统与流程

2022-03-05 02:12:35 来源：中国专利 TAG：

技术特征：
1.阅读理解候选选项个数不确定时的训练方法，其特征在于，所述方法包括：任务分组：将至少一篇阅读理解样本作为训练集，并将所述训练集划分为至少一个子任务，将答案候选选项个数相同的问题划分到同一子任务中，组成新训练集；多任务采样：从新训练集中选取任一子任务中的一批次阅读理解的问题样本，作为模型训练的输入数据；模型训练：对输入的输入数据进行多次训练，直至模型收敛。2.根据权利要求1所述的方法，其特征在于，所述选取新训练集中任一子任务中的一批次问题，作为模型训练的输入数据，具体为：从新任务集中，选取任一子任务；从选取的子任务中选择一批次问题样本，作为模型训练的输入数据。3.根据权利要求1所述的方法，其特征在于，所述对输入的输入数据进行多次训练，直至模型收敛，具体为：将输入数据，输入到共享层，进行语义编码，生成该批次问题样本的表示；基于生成的问题样本表示，激活子任务层，并前向计算损失；其中，激活的子任务层为输入数据所属的子任务中的答案候选选项个数对应的子任务层；基于损失，反向传播，并更新对应的子任务层和共享层的参数值；重复上述过程，直至模型收敛。4.根据权利要求3所述的方法，其特征在于，所述共享层为阅读理解中使用预训练语言训练号的编码器。5.阅读理解候选选项个数不确定时的训练装置，其特征在于，所述装置包括：任务分组器，用于将训练集划分为至少一个子任务，并将答案候选选项个数相同的问题划分到同一个子任务中，组成新训练集；其中，所述训练集由至少一个阅读理解样本组成；多任务采样器，用于在所述子任务集中选择任一子任务，并从该子任务中选择一批阅读理解的问题样本作为模型训练的输入数据；模型训练模块，用于对输入的输入数据进行多次训练，直至模型收敛。6.根据权利要求5所述的装置，其特征在于，所述多任务采样器包括：第一采样器，用于在所述子任务集中选择任一子任务；第二采样器，用于在选择的子任务中选择一批阅读理解的问题样本作为模型训练的输入数据。7.根据权利要求5所述的装置，其特征在于，所述模型训练模块包括：编码单元，用于将输入数据，输入到共享层，进行语义编码，生成该批次问题样本的表示；计算单元，用于基于生成的问题样本表示，激活子任务层，并前向计算损失；其中，激活的子任务层为输入数据所属的子任务中的答案候选选项个数对应的子任务层；反向传播单元，用于基于所述损失，反向传播，并更新对应的子任务层和共享层的参数值。8.阅读理解候选选项个数不确定时的训练系统，其特征在于，所述系统包括至少一个处理器和存储器；
所述存储器，用于存储一个或多个程序指令；所述处理器，用于运行一个或多个程序指令，用以执行如权利要求1至5中一个或多个所述的方法。9.一种芯片，其特征在于，所述芯片与系统中的存储器耦合，使得所述芯片在运行时调用所述存储器中存储的程序指令，实现如权利要求1至5中一个或多个所述的方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括一个或多个程序指令，所述一个或多个程序指令可被如权利要求8所述的系统执行，以实现如权利要求1至5中一个或多个所述的方法。

技术总结
本发明提供了阅读理解候选选项个数不确定时的训练方法、装置及系统，该方法包括：步骤S10、任务分组：将至少一篇阅读理解样本作为训练集，并将所述训练集划分为至少一个子任务，将答案候选选项个数相同的问题划分到同一子任务中，组成新训练集；步骤S20、多任务采样：从新训练集中选取任一子任务中的一批次阅读理解的问题样本，作为模型训练的输入数据；步骤S30、模型训练：对输入的输入数据进行多次训练，直至模型收敛。本发明的技术方案，采用了多任务视角在一个模型中解决了选择题阅读理解任务中选项个数不同的问题，并可以将多个模型变为单个模型，且不同选项个数的数据可以在一个模型中互相学习，从而降低整体数据的标注量。量。量。

技术研发人员：丘德来丁颖张瀚之刘升平梁家恩
受保护的技术使用者：云知声智能科技股份有限公司
技术研发日：2021.12.09
技术公布日：2022/3/4

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种化妆品安全风险信息查询装置的制作方法

阅读理解候选选项个数不确定时的训练方法、装置及系统与流程

相关文献

最热文献