民事案由信息识别训练方法、装置及案由提取方法与流程

2021-12-01 01:40:00 来源：中国专利 TAG：

1.本发明涉及文本数据处理技术领域，具体涉及一种民事案由信息识别训练方法、装置及案由提取方法。

背景技术：

2.随着智慧法院信息化建设步伐的推进，信息化是人民法院组织、管理和建设的运行载体，卷宗电子化、信息结构化势必成为这法院建设信息化的必要环节。但是在对卷宗当中文本案由关键信息点进行提取时，由于中文语言有地域性差异(比如方言，民族语言等等)、内容书写不规范性(比如错别字，书写顺序等等)，这将导致文本内容进行案由分类时面临着巨大的挑战，而且现有的电子卷宗中没有明确指明当前卷宗的案由；基于此种情况，目前主要基于用户进行输入数据，后台形成结构化信息数据，然后将卷宗文本作为辅助参考。

技术实现要素：

3.为此，本发明实施例提供一种民事案由信息识别训练方法、装置及案由提取方法，以解决现有技术存在的将文本内容进行案由分类时面临着巨大的挑战和电子卷宗中没有明确指明当前卷宗的案由的问题。
4.为了实现上述目的，本发明实施例提供如下技术方案：
5.第一方面，一种民事案由信息识别训练方法，包括：
6.根据训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；
7.计算训练样本集中各个民事起诉状的特征向量以及计算中心点距离目标函数的中间参数的初始值；
8.将中心点距离目标函数添加到中间案由深度学习模型中并加载中间参数的初始值，得到目标案由深度学习模型；
9.计算当前批次数据中各个民事起诉状的特征向量，并更新中间参数的参数值；
10.计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断是否符合结束训练的条件；
11.如果否，调整当前目标案由深度学习模型的参数，导入下一批次数据并进行模型训练；如果是，结束训练。
12.作为优选，所述案由深度学习模型为带有分类任务的案由深度学习模型。
13.作为优选，所述训练样本集中的各个民事起诉状是经过全局编号的样本。
14.作为优选，所述初始案由深度学习模型为加载有分类目标函数的案由深度学习模型。
15.作为优选，所述目标函数为softmax函数。
16.作为优选，所述批次数据为导入训练样本集中的预设数量的民事起诉状。
17.作为优选，判断是否符合结束训练的条件是判断计算得到的中心点距离目标函数的函数值是否收敛到第一预定区间，且计算得到的分类目标函数的函数值是否收敛到第二预定区间。
18.作为优选，如果否，利用中心点距离目标函数的反向传播梯度和分类目标函数的反向传播梯度，调整当前目标案由深度学习模型的参数，并返回执行导入训练样本集中的预设数量个样本作为批次数据的步骤；如果是，结束对当前目标案由深度学习模型的训练。
19.第二方面，一种民事案由信息识别训练装置，包括：
20.训练模块，用于训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；
21.计算模块，用于计算训练样本集中各个民事起诉状的特征向量以及计算中心点距离目标函数的中间参数的初始值；
22.加载模块，用于将中心点距离目标函数添加到中间案由深度学习模型中并加载中间参数的初始值，得到目标案由深度学习模型；
23.导入模块，用于导入训练样本集中的预设数量的民事起诉状作为批次数据；
24.更新模块，用于计算当前批次数据中各个民事起诉状的特征向量，并更新中间参数的参数值；
25.处理模块，用于计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断计算得到的中心点距离目标函数的函数值是否符合结束训练的条件；如果是，结束训练；如果否，调整当前目标案由深度学习模型的参数，并导入下一批次数据并进行模型训练。
26.第三方面，一种案由提取方法，包括：
27.将民事起诉状传入已经训练好的全案由模型中；所述全案由模型为经过民事案由信息识别训练方法训练好的所述目标案由深度学习模型；
28.全案由模型获取出对应的案由信息；
29.查找案由是否有子集案由；
30.如果有，则进行子集提取；如果没有，则推出案由作为结果数据。
31.本发明至少具有以下有益效果：根据训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；计算训练样本集中各个民事起诉状的特征向量以及计算中心点距离目标函数的中间参数的初始值；将中心点距离目标函数添加到中间案由深度学习模型中并加载中间参数的初始值，得到目标案由深度学习模型；计算当前批次数据中各个民事起诉状的特征向量，并更新中间参数的参数值；计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断是否符合结束训练的条件；如果否，调整当前目标案由深度学习模型的参数，导入下一批次数据并进行模型训练；如果是，结束训练。将民事起诉状传入已经训练好的目标案由深度学习模型中，得到当前民事起诉状的案由；应用本发明提供的训练好的目标案由深度学习模型可以提升深度案由提取学习模型的分类准确率。
附图说明
32.为了更清楚地说明现有技术以及本发明，下面将对现有技术以及本发明实施例描
述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引申获得其它的附图。
33.本说明书所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容能涵盖的范围内。
34.图1为本发明实施例提供的民事案由信息识别训练方法流程图；
35.图2为本发明实施例提供的民事案由信息识别训练装置框图；
36.图3为本发明实施例提供的案由提取方法结构示意图。
37.附图标记说明：
[0038]1‑
训练模块；2
‑
计算模块；3
‑
加载模块；4
‑
导入模块；5
‑
更新模块；6
‑
处理模块。
具体实施方式
[0039]
为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
[0040]
在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)旨在区别指代的对象。对于具有时序流程的方案，这种术语表述方式不必理解为描述特定的顺序或先后次序，对于装置结构的方案，这种术语表述方式也不存在对重要程度、位置关系的区分等。
[0041]
此外，术语“包括”、“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包括了一系列步骤或单元的过程、方法、系统、产品或设备不必限于已明确列出的那些步骤或单元，而是还可包含虽然并未明确列出的但对于这些过程、方法、产品或设备固有的其它步骤或单元，或者基于本发明构思进一步的优化方案所增加的步骤或单元。
[0042]
本发明实施例要训练的案由深度学习模型为：带有分类任务的案由深度学习模型，因此需要在深度学习模型的通用框架中加载分类目标函数，以实现案由深度学习模型的分类任务，其中，分类目标函数可以为softmax函数，也可以为其他类型的函数。
[0043]
本发明的实施例中提供一种民事案由信息识别训练方法：
[0044]
s1：根据训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；
[0045]
具体的，利用训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；其中，初始案由深度学习模型为加载有分类目标函数的案由深度学习模型。
[0046]
在这一步中需要预先对训练样本集中的各个民事起诉状进行全局编号。全局编号是指在训练样本集中各个民事起诉状具备整数类型的全局唯一编号，这样，在后续训练过程中能够依据全局编号，对批次数据中的民事起诉状的特征向量进行快速索引。
[0047]
s2：计算训练样本集中各个民事起诉状的特征向量以及计算中心点距离目标函数
的中间参数的初始值；
[0048]
具体的，利用中间案由深度学习模型，计算训练样本集(70％)中各个民事起诉状的特征向量，并根据训练样本集中各个民事起诉状的特征向量，计算中心点距离目标函数的中间参数的初始值。
[0049]
s3：将中心点距离目标函数添加到中间案由深度学习模型中并加载中间参数的初始值，得到目标案由深度学习模型；
[0050]
其中，导入训练样本集中的预设数量个样本作为批次数据，然后采用批次数据对目标案由深度学习模型进行训练。
[0051]
s4：计算当前批次数据中各个民事起诉状的特征向量，并更新中间参数的参数值；
[0052]
具体的，利用当前目标案由深度学习模型，计算当前批次数据中各个民事起诉状的特征向量，并根据当前批次数据中各个民事起诉状的特征向量，在训练过程中更新中心点距离目标函数的中间参数，以及调整目标案由深度学习模型的模型参数。
[0053]
可见，利用批次数据(30％)对目标案由深度学习模型进行训练，可以在批次训练过程中，完成全样本集合的各个类别的中心点和中心点距离的更新，得到各个类别的准确的中心点距离并且在训练过程中逐渐减小，从而达到提升案由深度学习模型的分类准确率的效果。
[0054]
s5：计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断是否符合结束训练的条件；
[0055]
具体的，基于当前批次数据中各个民事起诉状的特征向量，计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断计算得到的中心点距离目标函数的函数值是否收敛到第一预定区间，且计算得到的分类目标函数的函数值是否收敛到第二预定区间。
[0056]
s6：如果否，调整当前目标案由深度学习模型的参数，导入下一批次数据并进行模型训练；如果是，结束训练。
[0057]
具体的，如果否，利用中心点距离目标函数的反向传播梯度和分类目标函数的反向传播梯度，调整当前目标案由深度学习模型的参数，并返回执行导入训练样本集中的预设数量个样本作为批次数据的步骤；
[0058]
如果是，结束对当前目标案由深度学习模型的训练。需要说明的是，训练为全案由训练，训练形成的模型能对所有的案由进行识别，并且模型中包含父级案由和子集案由的关系。
[0059]
本发明的实施例中提供一种民事案由信息识别训练装置，包括：
[0060]
训练模块1，用于训练样本集中的各个民事起诉状，对预先构建的初始案由深度学习模型进行训练，得到中间案由深度学习模型；
[0061]
计算模块2，用于利用中间案由深度学习模型，计算训练样本集中各个民事起诉状的特征向量，并根据训练样本集中各个民事起诉状的特征向量，计算中心点距离目标函数的中间参数的初始值；
[0062]
加载模块3，用于将中心点距离目标函数添加到中间案由深度学习模型中并加载中间参数的初始值，得到目标案由深度学习模型；
[0063]
导入模块4，用于导入训练样本集中的预设数量的民事起诉状作为批次数据；
[0064]
更新模块5，用于利用当前目标案由深度学习模型，计算当前批次数据中各个样本的特征向量，并根据当前批次数据中各个样本的特征向量，更新中间参数的参数值；
[0065]
处理模块6，用于基于当前批次数据中各个民事起诉状的特征向量，计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断计算得到的中心点距离目标函数的函数值是否收敛到第一预定区间，且计算得到的分类目标函数的函数值是否收敛到第二预定区间；如果是，结束对当前目标案由深度学习模型的训练；如果否，利用中心点距离目标函数的反向传播梯度和分类目标函数的反向传播梯度，调整当前目标案由深度学习模型的参数，并触发导入模块。
[0066]
本发明的实施例中提供一种案由提取方法：
[0067]
s1：将民事起诉状传入已经训练好的全案由模型中；
[0068]
具体的，全案由模型为通过民事案由信息识别训练方法训练出来的目标案由深度学习模型；
[0069]
s2：全案由模型获取出对应的案由信息；
[0070]
s3：查找案由是否有子集案由；
[0071]
s4：如果有，则进行子集提取；如果没有，则推出案由作为结果数据。
[0072]
具体的，在进行子集提取时，循环执行s2
‑
s3的步骤来继续提取，直到提取至根节点获取到案由信息返回。
[0073]
本发明的实施例中提供的案由提取方法，需要将民事起诉状传入到已经训练好的目标案由深度学习模型中，然后由训练好的案由机器学习识别；获取识别结果中与案由模型匹配度最高的模型类型，如果该模型还有子模型则随即进行子模型的匹配操，所有判断完成后，给出该民事起诉状的案由匹配度最高的案由。案由信息模型学习，根据已知案由信息进行定义需要学习的模型，对模型进行关键字标注来完成该机器学习模型的完善。
[0074]
以上实施例的各技术特征可以进行任意的组合(只要这些技术特征的组合不存在矛盾)，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述；这些未明确写出的实施例，也都应当认为是本说明书记载的范围。
[0075]
上文中通过一般性说明及具体实施例对本发明作了较为具体和详细的描述。应当指出的是，在不脱离本发明构思的前提下，显然还可以对这些具体实施例作出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种模型训练的方法、装置、计算机设备和存储介质与流程

民事案由信息识别训练方法、装置及案由提取方法与流程

相关文献

最热文献