一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

机器学习模型训练方法、装置及电子设备与流程

2021-11-20 03:51:00 来源:中国专利 TAG:


1.本发明涉及机器学习领域,具体涉及一种机器学习模型训练方法、装置及电子设备。


背景技术:

2.目前,由于机器学习种类有多种,例如包括随机森林、svm、朴素贝叶斯、knn、gbdt、xgboost、lr等,本领域人员在使用机器学习模型对样本数据进行训练时难以选择合适的机器学习模型而导致训练结果较差,不符合要求,需要重新选择模型进行训练的问题。然而,重复训练机器学习模型又花费太多时间和成本,严重影响机器学习模型的训练工作进度。


技术实现要素:

3.鉴于以上内容,有必要提出一种机器学习模型训练方法、装置及电子设备,以简化选择机器学习模型进行训练的过程,提高机器学习模型的训练效率。
4.本技术的第一方面提供一种机器学习模型训练方法,所述方法包括:
5.接收用户选择的待处理的问题类型;
6.确定与所述问题类型相对应的机器学习模型;
7.接收用户输入的样本数据对确定出的机器学习模型进行训练;
8.分析训练完成后得到的所述机器学习模型的训练结果,将符合预设条件的训练结果进行显示;及
9.将符合预设条件的训练结果所对应的机器学习模型提供给用户。
10.优选地,所述确定与问题类型相对应的机器学习模型包括:
11.通过所确定的问题类型查找类型与模型关系表确定出与所述问题类型对应的机器学习模型,其中所述类型与模型关系表定义了多个问题类型与多个机器学习模型的对应关系。
12.优选地,所述样本数据类别至少包括第一样本类别及第二样本类别,所述接收用户输入的样本数据对确定出的机器学习模型进行训练包括:
13.获取正样本的样本数据及负样本的样本数据,并将正样本的样本数据标注样本类别,以使正样本的样本数据携带样本类别标签;
14.将所述正样本的样本数据及所述负样本的样本数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述机器学习模型,并利用所述验证集验证训练后的所述机器学习模型的准确率;及
15.若所述准确率大于或者等于预设准确率时,则结束训练;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述机器学习模型直至所述准确率大于或者等于预设准确率。
16.优选地,所述训练结果为准确率、精确率或网络大小,与所述准确率对应的预设条件为所述准确率大于第一预设值,与所述精确率对应的预设条件为所述精确率大于第二预
设值,与所述网络大小对应的预设条件为所述机器学习模型的网络层数小于第三预设值。
17.优选地,所述机器学习模型包括多个卷积层、多个最大池采样层、全连接层,其中,所述多个卷积层和所述多个最大池采样层交替连接组成,所述多个最大池采样层用于对所述样本数据进行特征提取得到特征向量,所述多个全连接层相互连接,所述多个最大池采样层中的最后一个最大池采样层与多个所述全连接层的第一全连接层连接,用于向所述第一全连接层输入经过特征提取得到的特征向量,多个所述全连接层中的最后一个全连接层为一个分类器,所述分类器用于对所述特征向量进行分类得到检测结果。
18.优选地,所述接收用户输入的样本数据对确定出的所述机器学习模型进行训练包括:使用样本数据以及与样本数据对应的类别标签建立训练集;通过所述机器学习模型的卷积层将所述训练集中的样本数据进行卷积运算和抽样运算;将所述机器学习模型的最后一个卷积层连接到一个或多个全连接层,其中全连接层被配置为将进行卷积和抽样运算后提取到的样本数据的特征进行综合并输出训练参数和特征模型;判断机器学习模型是否满足收敛条件,其中,当特征模型与预设的标准特征模型或所述样本数据的类别标签一致时确定机器学习模型满足收敛条件,否则确定机器学习模型不满足收敛条件;当特征模型与预设的标准特征模型相一致时则输出特征模型;及当特征模型不满足收敛条件时反向传播调整所述机器学习模型的权矩阵。
19.本技术的第二方面提供一种机器学习模型训练装置,所述装置包括:
20.问题类型接收模块,用于接收用户选择的待处理的问题类型;
21.模型确定模块,用于确定与所述问题类型相对应的机器学习模型;
22.训练模块,用于接收用户输入的样本数据对确定出的机器学习模型进行训练;
23.显示模块,用于分析训练完成后得到的所述机器学习模型的训练结果,将符合预设条件的训练结果进行显示;及
24.模型提供模块,用于将符合预设条件的训练结果所对应的机器学习模型提供给用户。
25.优选地,所述样本数据类别至少包括第一样本类别及第二样本类别,所述接收用户输入的样本数据对确定出的机器学习模型进行训练包括:
26.获取正样本的样本数据及负样本的样本数据,并将正样本的样本数据标注样本类别,以使正样本的样本数据携带样本类别标签;
27.将所述正样本的样本数据及所述负样本的样本数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述机器学习模型,并利用所述验证集验证训练后的所述机器学习模型的准确率;及
28.若所述准确率大于或者等于预设准确率时,则结束训练;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述机器学习模型直至所述准确率大于或者等于预设准确率。
29.优选地,所述机器学习模型包括多个卷积层、多个最大池采样层、全连接层,其中,所述多个卷积层和所述多个最大池采样层交替连接组成,所述多个最大池采样层用于对所述样本数据进行特征提取得到特征向量,所述多个全连接层相互连接,所述多个最大池采样层中的最后一个最大池采样层与多个所述全连接层的第一全连接层连接,用于向所述第一全连接层输入经过特征提取得到的特征向量,多个所述全连接层中的最后一个全连接层
为一个分类器,所述分类器用于对所述特征向量进行分类得到检测结果。
30.本技术的第三方面提供一种电子设备,所述电子设备包括处理器及存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述机器学习模型训练方法。
31.本案接收用户选择的待处理的问题类型,确定与问题类型相对应的机器学习模型,接收用户输入的样本数据对确定出的机器学习模型进行训练,并将符合预设条件的训练结果所对应的机器学习模型提供给用户,从而使得用户根据问题类型快速确定出对应的机器学习模型,简化了选择机器学习模型进行训练的过程,并提高了机器学习模型的训练效率。
附图说明
32.图1为本发明一实施方式中机器学习模型训练方法的流程图。
33.图2为本发明一实施方式中问题类型选择界面的示意图。
34.图3为本发明一实施方式中类型与模型关系表的示意图。
35.图4为本发明一实施方式中机器学习模型训练装置的结构图。
36.图5为本发明一实施方式中电子设备的示意图。
具体实施方式
37.为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
38.在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
40.优选地,本发明机器学习模型训练方法应用在一个或者多个电子设备中。所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
41.所述电子设备可以是桌上型计算机、笔记本电脑、平板电脑及云端服务器等计算设备。所述设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
42.实施例1
43.图1是本发明一实施方式中机器学习模型训练方法的流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。
44.参阅图1所示,所述机器学习模型训练方法具体包括以下步骤。
45.步骤s11,接收用户选择的待处理的问题类型。
46.本实施方式中,所述问题类型为通过机器学习模型所能解决的问题所对应的类型。具体的,所述问题类型包括图像中的对象分类、图像的分割及图像中的对象检测。
47.本实施方式中,所述接收用户选择待处理的问题类型包括:通过问题类型选择界面50接收用户选择的待处理的问题类型。请参考图2,所示为本发明一实施方式中问题类型选择界面50的示意图。所述问题类型选择界面50包括第一类型选项51、第二类型选项52及第三类型选项53。其中,第一类型选项51用于供用户选择图像中的对象分类,第二类型选项52用于供用户选择图像的分割,第三类型选项53用于供用户选择图像中的对象检测。也即,当用户选择第一类型选项51时,所述问题类型选择界面50接收用户选择的图像中的对象分类作为问题类型;当用户选择第二类型选项52时,所述问题类型选择界面50接收用户选择的图像的分割作为问题类型;当用户选择第三类型选项53时,所述问题类型选择界面50接收用户选择的图像中的对象检测作为问题类型。
48.步骤s12,确定与所述问题类型相对应的机器学习模型。
49.本实施方式中,所述确定与问题类型相对应的机器学习模型包括:通过所确定的问题类型查找类型与模型关系表60确定出与所述问题类型对应的机器学习模型,其中所述类型与模型关系表60定义了多个问题类型与多个机器学习模型的对应关系。请参考图3,所示为本发明一实施方式中类型与模型关系表60的示意图。所述类型与模型关系表60定义问题类型为图像中的对象分类与机器学习模型为第一模型的对应关系,其中,第一模型可以为图像的对象分类模型;定义问题类型为图像的分割与机器学习模型为第二模型的对应关系,其中,第二模型可以为图像的分割模型;定义问题类型为图像中的对象检测与机器学习模型为第三模型的对应关系,其中,第三模型可以为图像中的对象检测模型。本实施方式中,所述第一模型、第二模型、第三模型为随机森林、svm、朴素贝叶斯、knn、gbdt、xgboost、lr中的至少一种模型。
50.在另一实施方式中,所述确定与问题类型相对应的机器学习模型包括:接收用户输入的机器学习模型,并将接收的机器学习模型确定为与所述问题类型相对应的机器学习模型。本实施方式中,将用户输入的机器学习模型确定为与所述问题类型相对应的机器学习模型可以使专业的研发人员可根据自己的计划增加更多的机器学习模型进行样本训练。
51.步骤s13,接收用户输入的样本数据对确定出的所述机器学习模型进行训练。
52.本实施方式中,所述样本数据类别至少包括第一样本类别及第二样本类别两个不同的类别。所述接收用户输入的样本数据对确定出的机器学习模型进行训练包括:
53.1)获取正样本的样本数据及负样本的样本数据,并将正样本的样本数据标注样本类别,以使正样本的样本数据携带样本类别标签。
54.例如,分别选取500个第一样本类别、第二样本类别对应的样本数据,并对每个样本数据标注类别,可以以“1”作为第一样本类别的样本数据标签,以“2”作为第二样本类别的样本数据标签。
55.2)将所述正样本的样本数据及所述负样本的样本数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述机器学习模型,并利用所述验证集验证训练后的所述机器学习模型的准确率。
56.先将不同样本类别的训练集中的训练样本分发到不同的文件夹里。例如,将第一样本类别的训练样本分发到第一文件夹里、将第二样本类别的训练样本分发到第二文件夹
里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行机器学习模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述机器学习模型进行准确性验证。
57.3)若所述准确率大于或者等于预设准确率时,则结束训练;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述机器学习模型直至所述准确率大于或者等于预设准确率。
58.本实施方式中,所述机器学习模型包括多个卷积层、最大池采样层、全连接层。其中,卷积层和最大池采样层交替连接组成,用于对所述样本数据进行特征提取得到特征向量。所述多个全连接层相互连接。多个所述最大池采样层中的最后一个最大池采样层与多个所述全连接层的第一全连接层连接,用于向所述第一全连接层输入经过特征提取得到的特征向量,多个所述全连接层中的最后一个全连接层为一个分类器,所述分类器用于对所述特征向量进行分类得到检测结果。
59.在一实施方式中,所述接收用户输入的样本数据对确定出的所述机器学习模型进行训练包括:使用样本数据(如图像数据),以及与样本数据对应的类别标签建立训练集;通过机器学习模型的卷积层将训练集中的样本数据进行卷积运算和抽样运算;将最后一个卷积层连接到一个或多个全连接层,其中全连接层被配置为将进行卷积和抽样运算后提取到的样本数据的特征进行综合并输出训练参数和特征模型,其中,所述特征模型为样本数据的一个抽象特征表达;判断机器学习模型是否满足收敛条件,即判断特征模型与预设的标准特征模型或所述样本数据的类别标签是否一致,其中,当特征模型与预设的标准特征模型或所述样本数据的类别标签一致时确定机器学习模型满足收敛条件,否则确定机器学习模型不满足收敛条件;当特征模型与预设的标准特征模型相一致时则输出特征模型;及当特征模型不满足收敛条件时反向传播调整机器学习模型的权矩阵。
60.本实施方式中,在机器学习模型的训练过程中,若输出的特征模型与标准特征模型之间存在误差,则通过反向传播将误差信息沿原来的路径反传,从而修正各层(例如,卷积层和抽样层)的训练参数,训练参数例如可以包括加权值和偏置,然后利用修正后的卷积层和抽样层重新对训练数据进行卷积运算和抽样运算,直到特征模型满足结束条件为止。本实施方式中,在进行卷积运算时,可以对样本数据应用多个特征映射图,从而获取样本数据的不同特征,其中,每个特征映射图提取出样本数据的一种特征。本实施方式中,在进行抽样运算时可以采用平均值合并、最大值合并、以及随机合并等方法对训练集中的数据进行处理。
61.步骤s14,分析训练完成后得到的所述机器学习模型的训练结果,将符合预设条件的训练结果进行显示。
62.本实施方式中,所述训练结果为准确率、精确率或网络大小。与准确率、精确率或网络大小对应的预设条件分别为:准确率大于第一预设值(例如90%),精确率大于第二预设值(例如85%),机器学习模型的网络层数小于第三预设值(如100)。本实施方式中,当训练完成后得到的机器学习模型的准确率大于第一预设值时将所述机器学习模型的准确率进行显示,或当训练完成后得到的机器学习模型的精确率大于第二预设值时将所述机器学习模型的精确率进行显示,或当训练完成后得到的机器学习模型的网络层数小于第三预设值时将所述机器学习模型的网络层数进行显示。
63.本实施方式中,所述机器学习模型的准确率根据公式a=(tp tn)/(tp fp fn tn)计算得到,其中,a为准确率,tp为被机器学习模型预测为正的正样本数,fp为被机器学习模型预测为正的负样本数,fn为被机器学习模型预测为负的正样本数,tn为被机器学习模型预测为负的负样本数。本实施方式中,所述机器学习模型的精确率根据公式p=tp/(tp fp)计算得到。
64.步骤s15,将符合预设条件的训练结果所对应的机器学习模型提供给用户。
65.本实施方式中,所述方法还包括:在所述机器学习模型的训练结果不符合预设条件时接收用户对所述机器学习模型的参数进行修改的操作,并根据修改后的参数重新训练所述机器学习模型。在具体实施方式中,提供参数设置界面(图中未示),并通过所述参数设置界面接收用户对所述机器学习模型的参数进行修改的操作,并根据修改后的参数重新训练所述机器学习模型。
66.本实施方式中,所述方法还包括:接收用户对类型与模型关系表60中的问题类型与机器学习模型的对应关系的修改操作,并按照所述修改操作设定所述问题类型与机器学习模型的对应关系。
67.本实施方式中,接收用户选择的待处理的问题类型,确定与问题类型相对应的机器学习模型,接收用户输入的样本数据对确定出的机器学习模型进行训练,并将符合预设条件的训练结果所对应的机器学习模型提供给用户,从而使得用户根据问题类型快速确定出对应的机器学习模型,简化了选择机器学习模型进行训练的过程,并提高了机器学习模型的训练效率。
68.实施例2
69.图4为本发明一实施方式中机器学习模型训练装置40的结构图。
70.在一些实施例中,所述机器学习模型训练装置40运行于电子设备中。所述机器学习模型训练装置40可以包括多个由程序代码段所组成的功能模块。所述机器学习模型训练装置40中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行机器学习模型训练的功能。
71.本实施例中,所述机器学习模型训练装置40根据其所执行的功能,可以被划分为多个功能模块。参阅图4所示,所述机器学习模型训练装置40可以包括问题类型接收模块401、模型确定模块402、训练模块403、显示模块404、模型提供模块405及设置模块406。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。所述在一些实施例中,关于各模块的功能将在后续的实施例中详述。
72.所述问题类型接收模块401接收用户选择的待处理的问题类型。
73.本实施方式中,所述问题类型为通过机器学习模型所能解决的问题所对应的类型。具体的,所述问题类型包括图像中的对象分类、图像的分割及图像中的对象检测。
74.本实施方式中,所述问题类型接收模块401接收用户选择待处理的问题类型包括:通过问题类型选择界面50接收用户选择的待处理的问题类型。所述问题类型选择界面50包括第一类型选项51、第二类型选项52及第三类型选项53。其中,第一类型选项51用于供用户选择图像中的对象分类,第二类型选项52用于供用户选择图像的分割,第三类型选项53用于供用户选择图像中的对象检测。也即,当用户选择第一类型选项51时,所述问题类型选择
界面50接收用户选择的图像中的对象分类作为问题类型;当用户选择第二类型选项52时,所述问题类型选择界面50接收用户选择的图像的分割作为问题类型;当用户选择第三类型选项53时,所述问题类型选择界面50接收用户选择的图像中的对象检测作为问题类型。
75.所述模型确定模块402确定与所述问题类型相对应的机器学习模型。
76.本实施方式中,所述模型确定模块402确定与问题类型相对应的机器学习模型包括:通过所确定的问题类型查找类型与模型关系表60确定出与所述问题类型对应的机器学习模型,其中所述类型与模型关系表60定义了多个问题类型与多个机器学习模型的对应关系。所述类型与模型关系表60定义问题类型为图像中的对象分类与机器学习模型为第一模型的对应关系,其中,第一模型可以为图像的对象分类模型;定义问题类型为图像的分割与机器学习模型为第二模型的对应关系,其中,第二模型可以为图像的分割模型;定义问题类型为图像中的对象检测与机器学习模型为第三模型的对应关系,其中,第三模型可以为图像中的对象检测模型。本实施方式中,所述第一模型、第二模型、第三模型为随机森林、svm、朴素贝叶斯、knn、gbdt、xgboost、lr中的至少一种模型。
77.在另一实施方式中,所述模型确定模块402确定与问题类型相对应的机器学习模型包括:接收用户输入的机器学习模型,并将接收的机器学习模型确定为与所述问题类型相对应的机器学习模型。本实施方式中,将用户输入的机器学习模型确定为与所述问题类型相对应的机器学习模型可以使专业的研发人员可根据自己的计划增加更多的机器学习模型进行样本训练。
78.所述训练模块403接收用户输入的样本数据对确定出的所述机器学习模型进行训练。
79.本实施方式中,所述样本数据类别至少包括第一样本类别及第二样本类别两个不同的类别。所述训练模块403接收用户输入的样本数据对确定出的机器学习模型进行训练包括:
80.1)获取正样本的样本数据及负样本的样本数据,并将正样本的样本数据标注样本类别,以使正样本的样本数据携带样本类别标签。
81.例如,分别选取500个第一样本类别、第二样本类别对应的样本数据,并对每个样本数据标注类别,可以以“1”作为第一样本类别的样本数据标签,以“2”作为第二样本类别的样本数据标签。
82.2)将所述正样本的样本数据及所述负样本的样本数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述机器学习模型,并利用所述验证集验证训练后的所述机器学习模型的准确率。
83.先将不同样本类别的训练集中的训练样本分发到不同的文件夹里。例如,将第一样本类别的训练样本分发到第一文件夹里、将第二样本类别的训练样本分发到第二文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行机器学习模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述机器学习模型进行准确性验证。
84.3)若所述准确率大于或者等于预设准确率时,则结束训练;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述机器学习模型直至所述准确率大于或者等于预设准确率。
85.本实施方式中,所述机器学习模型包括多个卷积层、最大池采样层、全连接层。其中,卷积层和最大池采样层交替连接组成,用于对所述样本数据进行特征提取得到特征向量。所述多个全连接层相互连接。多个所述最大池采样层中的最后一个最大池采样层与多个所述全连接层的第一全连接层连接,用于向所述第一全连接层输入经过特征提取得到的特征向量,多个所述全连接层中的最后一个全连接层为一个分类器,所述分类器用于对所述特征向量进行分类得到检测结果。
86.在一实施方式中,所述训练模块403使用样本数据(如图像数据),以及与样本数据对应的类别标签建立训练集;通过机器学习模型的卷积层将训练集中的样本数据进行卷积运算和抽样运算;将最后一个卷积层连接到一个或多个全连接层,其中全连接层被配置为将进行卷积和抽样运算后提取到的样本数据的特征进行综合并输出训练参数和特征模型,其中,所述特征模型为样本数据的一个抽象特征表达;判断机器学习模型是否满足收敛条件,即判断特征模型与预设的标准特征模型或所述样本数据的类别标签是否一致,其中,当特征模型与预设的标准特征模型或所述样本数据的类别标签一致时确定机器学习模型满足收敛条件,否则确定机器学习模型不满足收敛条件;当特征模型与预设的标准特征模型相一致时则输出特征模型;及当特征模型不满足收敛条件时反向传播调整机器学习模型的权矩阵。
87.本实施方式中,在机器学习模型的训练过程中,若输出的特征模型与标准特征模型之间存在误差,则所述训练模块403通过反向传播将误差信息沿原来的路径反传,从而修正各层(例如,卷积层和抽样层)的训练参数,训练参数例如可以包括加权值和偏置,然后利用修正后的卷积层和抽样层重新对训练数据进行卷积运算和抽样运算,直到特征模型满足结束条件为止。本实施方式中,在进行卷积运算时,可以对样本数据应用多个特征映射图,从而获取样本数据的不同特征,其中,每个特征映射图提取出样本数据的一种特征。本实施方式中,在进行抽样运算时可以采用平均值合并、最大值合并、以及随机合并等方法对训练集中的数据进行处理。
88.所述显示模块404分析训练完成后得到的所述机器学习模型的训练结果,将符合预设条件的训练结果进行显示。
89.本实施方式中,所述训练结果为准确率、精确率或网络大小。与准确率、精确率或网络大小对应的预设条件分别为:准确率大于第一预设值(例如90%),精确率大于第二预设值(例如85%),机器学习模型的网络层数小于第三预设值(如100)。本实施方式中,所述显示模块404当训练完成后得到的机器学习模型的准确率大于第一预设值时将所述机器学习模型的准确率进行显示,或当训练完成后得到的机器学习模型的精确率大于第二预设值时将所述机器学习模型的精确率进行显示,或当训练完成后得到的机器学习模型的网络层数小于第三预设值时将所述机器学习模型的网络层数进行显示。
90.本实施方式中,所述机器学习模型的准确率根据公式a=(tp tn)/(tp fp fn tn)计算得到,其中,a为准确率,tp为被机器学习模型预测为正的正样本数,fp为被机器学习模型预测为正的负样本数,fn为被机器学习模型预测为负的正样本数,tn为被机器学习模型预测为负的负样本数。本实施方式中,所述机器学习模型的精确率根据公式p=tp/(tp fp)计算得到。
91.所述模型提供模块405将符合预设条件的训练结果所对应的机器学习模型提供给
用户。
92.本实施方式中,所述训练模块403还用于:在所述机器学习模型的训练结果不符合预设条件时接收用户对所述机器学习模型的参数进行修改的操作,并根据修改后的参数重新训练所述机器学习模型。在具体实施方式中,提供参数设置界面(图中未示),并通过所述参数设置界面接收用户对所述机器学习模型的参数进行修改的操作,并根据修改后的参数重新训练所述机器学习模型。
93.本实施方式中,所述设置模块406用于:接收用户对类型与模型关系表60中的问题类型与机器学习模型的对应关系的修改操作,并按照所述修改操作设定所述问题类型与机器学习模型的对应关系。
94.本实施方式中,接收用户选择的待处理的问题类型,确定与问题类型相对应的机器学习模型,接收用户输入的样本数据对确定出的机器学习模型进行训练,并将符合预设条件的训练结果所对应的机器学习模型提供给用户,从而使得用户根据问题类型快速确定出对应的机器学习模型,简化了选择机器学习模型进行训练的过程,并提高了机器学习模型的训练效率。
95.实施例3
96.图5为本发明一实施方式中电子设备6的示意图。
97.所述电子设备6包括存储器61、处理器62以及存储在所述存储器61中并可在所述处理器62上运行的计算机程序63。所述处理器62执行所述计算机程序63时实现上述机器学习模型训练方法实施例中的步骤,例如图1所示的步骤s11~s15。或者,所述处理器62执行所述计算机程序63时实现上述机器学习模型训练装置实施例中各模块/单元的功能,例如图4中的模块401~406。
98.示例性的,所述计算机程序63可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器62执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序63在所述电子设备6中的执行过程。例如,所述计算机程序63可以被分割成图4中的问题类型接收模块401、模型确定模块402、训练模块403、显示模块404、模型提供模块405及设置模块406,各模块具体功能参见实施例2。
99.本实施方式中,所述电子设备6还可以是桌上型计算机、笔记本、掌上电脑及云端终端装置等计算设备。本领域技术人员可以理解,所述示意图仅仅是电子设备6的示例,并不构成对电子设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备6还可以包括输入输出设备、网络接入设备、总线等。
100.所称处理器62可以是中央处理模块(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器62也可以是任何常规的处理器等,所述处理器62是所述电子设备6的控制中心,利用各种接口和线路连接整个电子设备6的各个部分。
101.所述存储器61可用于存储所述计算机程序63和/或模块/单元,所述处理器62通过
运行或执行存储在所述存储器61内的计算机程序和/或模块/单元,以及调用存储在存储器61内的数据,实现所述电子设备6的各种功能。所述存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备6的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
102.所述电子设备6集成的模块/单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
103.在本发明所提供的几个实施例中,应该理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
104.另外,在本发明各个实施例中的各功能模块可以集成在相同处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
105.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他模块或步骤,单数不排除复数。电子设备权利要求中陈述的多个模块或电子设备也可以由同一个模块或电子设备通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
106.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献