一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度学习的文本分类方法、装置、电子设备及介质与流程

2021-11-29 13:50:00 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种基于深度学习的文本分类方法、装置、电子设备及可读存储介质。


背景技术:

2.随着互联网技术的飞速发展,基于深度学习的文本分类的应用场景十分广泛,通过基于深度学习的文本分类可对大量数据和信息进行组织、管理。例如,各类app的广泛使用就需要应用到基于深度学习的文本分类,在app使用过程中用户往往会因为对一些操作流程较多产生疑问,从而选择在app的客服系统中向人工智能客服反馈自己的问题,当人工智能客服获取到用户的问题时,会自动对问题进行文本分类,进而选取对应的答案文本发送至用户。若文本分类不准确,将极大的降低答案文本获取的准确性和获取效率,因此,亟需一种提高文本分类的准确性的方法。


技术实现要素:

3.本发明提供一种基于深度学习的文本分类方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高基于深度学习的文本分类的准确率。
4.为实现上述目的,本发明提供的一种基于深度学习的文本分类方法,包括:
5.获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集;
6.利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果;
7.构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果;
8.判断所述第一分类结果与所述第二分类结果是否一致;
9.若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类;
10.若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
11.可选地,所述构建所述特征向量集的多个超平面函数,包括:
12.将所述特征向量集中的向量映射至平面坐标系中,得到多个平面法向量;
13.根据多个所述平面法向量和预设的回归函数获取多个所述超平面函数。
14.可选地,所述利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,包括:
15.利用预设的几何间隔确定多个所述超平面函数中的两个平行超平面函数,对所述两个平行超平面函数进行公式转换得到约束条件;
16.利用所述拉格朗日数乘法将所述约束条件转化为无约束条件,对所述无约束条件
进行运算得到所述两个平行超平面函数中的最优超平面。
17.可选地,所述利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果,包括:
18.将所述特征向量集划分为第一训练集与第一验证集;
19.利用预构建的朴素贝叶斯分类器对所述第一训练集进行分类,得到所述第一训练集的先验概率;
20.根据所述先验概率对所述第一训练集中多个特征向量的文本类别进行预测,得到所述第一训练集的预测文本类别;
21.将所述第一验证集输入所述朴素贝叶斯分类器中,得到所述第一验证集的预测文本类别;
22.若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别不一致,则调整所述朴素贝叶斯分类器的参数,再次执行所述朴素贝叶斯分类器对所述第一训练集进行分类的操作;
23.若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别一致,则将所述第一验证集的预测文本类别和/或所述第一训练集的预测文本类别作为第一分类结果。
24.可选地,所述利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,包括:
25.将所述特征向量集划分为第二训练集与第二验证集;
26.获取所述最优超平面的函数,利用所述最优超平面的函数对所述第二训练集进行分类,得到所述第二训练集所属的文本类别;
27.利用所述最优超平面的函数对所述第二验证集进行分类,得到所述第二验证集所属的文本类别;
28.判断所述第二验证集所属的文本类别与所述第二训练集所属的文本类别是否一致;
29.若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别不一致,则调整所述超平面函数的参数,再次执行所述利用所述最优超平面的函数对所述训练集进行分类的操作;
30.若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别一致,则将所述第二验证集所属的文本类别和/或所述第二训练集所属的文本类别作为所述特征向量集的第二分类结果。
31.可选地,所述对所述待分类文本集进行特征提取,得到特征向量集,包括:
32.利用预构建的词向量转化模型对所述待分类文本集执行向量化操作,生成多个单词向量;
33.对多个所述单词向量进行预训练,得到多个预训练的词向量;
34.将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,并将所述匹配词向量组成特征向量集。
35.可选地,所述将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,包括:
36.将所述待分类文本集分别与多个所述词向量进行匹配;
37.对所述待分类文本集中与多个所述词向量相匹配的文本转化为向量,得到匹配词向量为了解决上述问题,本发明还提供一种基于深度学习的文本分类装置,所述装置包括:
38.文本特征提取模块,用于获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集;
39.朴素贝叶斯分类模块,用于利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果;
40.最优超平面分类模块,用于构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果;
41.文本最终分类模块,用于判断所述第一分类结果与所述第二分类结果是否一致,若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类,若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
42.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
43.存储器,存储至少一个计算机程序;及
44.处理器,执行所述存储器中存储的计算机程序以实现上述所述的基于深度学习的文本分类方法。
45.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于深度学习的文本分类方法。
46.本发明实施例首先通过朴素贝叶斯分类器对特征向量集进行第一分类,得到第一分类结果,进而确定所述特征向量集的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,最后判断第一分类结果和第二分类结果的一致性,当第一分类结果和第二分类结果不一致时,不断调整所述朴素贝叶斯分类器的参数和最优超平面的选取,提高模型分类的准确性,从而提高基于深度学习的文本分类的准确率。因此本发明实施例提出的基于深度学习的文本分类方法、装置、电子设备及可读存储介质可以提高基于深度学习的文本分类的准确率。
附图说明
47.图1为本发明一实施例提供的基于深度学习的文本分类方法的流程示意图;
48.图2为本发明一实施例提供的基于深度学习的文本分类装置的模块示意图;
49.图3为本发明一实施例提供的实现基于深度学习的文本分类方法的电子设备的内部结构示意图;
50.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
51.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
52.本发明实施例提供一种基于深度学习的文本分类方法。所述基于深度学习的文本分类方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。换言之,所述基于深度学习的文本分类方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
53.参照图1所示的本发明一实施例提供的基于深度学习的文本分类方法的流程示意图,在本发明实施例中,所述基于深度学习的文本分类方法包括:
54.s1、获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集。
55.本发明实施例中,所述待分类文本集包括多个不同类型的文本,待分类文本集可以从市场上各种银行app、理财app的客服问题反馈中获取,获取的文本可以包括用户反馈的问题文本、文本长度、情感分析等信息。
56.所述特征向量集是通过向量来表示所述待分类文本集中的词语特征。
57.详细地,所述对所述待分类文本集执行特征提取,得到特征向量集,包括:
58.利用预构建的词向量转化模型对所述待分类文本集执行向量化操作,生成多个单词向量;
59.对多个所述单词向量进行预训练,得到多个预训练的词向量;
60.将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,并将所述匹配词向量组成特征向量集。
61.由于在词嵌入中预训练的词向量可降低词嵌过程的输出参数,因此,本实施例中对词向量提前进行训练,从而得到预训练的词向量。另外,提前训练词向量可以将语义相近的词,聚集在词向量空间里,为后续基于深度学习的文本分类操作提供了便利。
62.进一步地,所述将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,包括:
63.将所述待分类文本集分别与多个所述词向量进行匹配;
64.对所述待分类文本集中与多个所述词向量相匹配的文本转化为向量,得到匹配词向量。
65.s2、利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果。
66.本发明实施例中,所述朴素贝叶斯分类器是基于贝叶斯算法将所述特征向量集进行分类的分类器,主要作用是文本进行分类。
67.详细地,所述利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果,包括:
68.将所述特征向量集划分为第一训练集与第一验证集;
69.利用预构建的朴素贝叶斯分类器对所述第一训练集进行分类,得到所述第一训练集的先验概率;
70.根据所述先验概率对所述第一训练集中多个特征向量的文本类别进行预测,得到
所述第一训练集的预测文本类别;
71.将所述第一验证集输入所述朴素贝叶斯分类器中,得到所述第一验证集的预测文本类别;
72.若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别不一致,则调整所述朴素贝叶斯分类器的参数,再次执行所述朴素贝叶斯分类器对所述第一训练集进行分类的操作;
73.若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别一致,则将所述第一验证集的预测文本类别和/或所述第一训练集的预测文本类别作为第一分类结果。
74.本发明实施例中,所述先验概率表示根据经验得到的特征向量集属于某文本类别的概率;所述后验概率表示特征向量集在进行分类时,所述特征向量集属于某文本类别的概率。
75.例如,先验概率可以为p(a|b),后验概率可以为p(b|a);其中,“a”表示特征向量集,“b”表示所述特征向量集对应的文本类别。
76.本发明实施例中,对所述特征向量集执行分类,可以通过所述朴素贝叶斯分类器的条件概率公式实现:
[0077][0078]
具体地,例如文本类别集合为c={c1,c2,

,c
n
},特征向量集为d={d1,d2,

,d
m
},根据所述条件概率公式可知所述特征向量集d属于所述文本类别c的概率可通过下列公式计算:
[0079][0080]
其中,所述p(d)是预设固定值,所述p(c
i
|d)表示在d条件下每个文本类别的概率中概率最大的项对应的文本类别即为d特征向量集的文本类别,p(d|c
i
)表示在c
i
发生的条件下d发生的概率,p(c
i
)表示特征向量对应的第i个文本类别概率,p(d
j
|c
i
)表示在文本类别为c
i
的特征向量及中,第j个特征向量d
j
出现次数占总文本类别为c
i
的比例,m表示特征向量的个数。
[0081]
进一步地,若出现p(d
j
|c
i
)=0,会导致p(c
i
|d)=0,则公式无意义,为了避免p(d
j
|c
i
)=0,可以采用拉普拉斯校准,具体的校准方法可从现有技术中获取,此处不再赘述。
[0082]
类似地,若出现p(c
i
)=0,也可以采用拉普拉斯校准。
[0083]
本发明实施例中,可以基于人工智能算法,实现所述特征向量集的第一分类。
[0084]
s3、构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果。
[0085]
本发明实施例中,所述超平面函数可以看作所述特征向量集的预测文本类别的分界面。
[0086]
详细地,所述构建所述特征向量集的多个超平面函数,包括:
[0087]
将所述特征向量集中的向量映射至平面坐标系中,得到多个平面法向量;
[0088]
根据多个所述平面法向量和预设的回归函数获取多个所述超平面函数。
[0089]
本发明实施例中,所述回归函数的表达式可以为h
θ
(z)=g(θ
t
z)。
[0090]
例如,所述特征向量集d可以分为d0和d1,若存在n维向量和实数b,当θ
t
z=0,对h
θ
(z)进行改写,得到h
w,b(x)
(x)=g(w
t
x
i
b);使得所有属于d0的点x
i
都有w
t
x
i
b>0;而所有属于d1的点x
i
都有w
t
x
i
b<0,则所述将d0和d1完全划开的超平面函数则为w
t
x
i
b=0。
[0091]
本发明实施例中,所述最优超平面是指特征向量集两侧距离超平面最近的样本点到超平面的距离最大。
[0092]
例如,所述特征向量集d可以分为d0和d1,d0和d1中的样本点分布在超平面的两侧,使d0和d1中的距离超平面最近的样本点到超平面的距离最大,则所述超平面即为最优超平面。
[0093]
详细地,所述利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,包括:
[0094]
利用预设的几何间隔确定多个所述超平面函数中的两个平行超平面函数,对所述两个平行超平面函数进行公式转换得到约束条件;
[0095]
利用所述拉格朗日数乘法将所述约束条件转化为无约束条件,对所述无约束条件进行运算得到所述两个平行超平面函数中的最优超平面。
[0096]
本发明实施例中,所述两个平行超平面函数之间的最大距离就是最大化间隔,根据所述最大化间隔可以得到约束条件;所述约束条件是指在一个有限的空间里,找到目标函数的最优值。
[0097]
例如,所述几何间隔的大小为:
[0098][0099]
其中,w是超平面的法向量,样本点a的坐标为x
(i)
,样本点a到分界线的距离为
[0100]
将所述几何间隔代入超平面函数w
t
x
i
b=0中,得到两个平行超平面函数为:
[0101]
w
t
x b≥1,y=1
[0102]
w
t
x b≤

1,y=
‑1[0103]
其中,所述w
t
为超平面的法向量,x为特征向量集,b为实数位移项。
[0104]
将所述两个平行超平面函数合并,得到:
[0105]
y(w
t
x b)≥1
[0106]
样本点到超平面的距离可以表示为:
[0107][0108]
对所述样本点到超平面的距离做转化,得到约束条件:
[0109]
[0110]
所述拉格朗日函数为:
[0111][0112]
其中,所述x
i
是特征向量集,y
i
是x
i
的类别标记,b为实数位移项,γ
i
为几何间隔,||w||为
[0113]
对所述拉格朗日函数求偏导,得到:
[0114][0115]
其中,m表示两个平行超平面上的样本点,x
i
是特征向量集,y
i
是x
i
的类别标记,γ
i
为几何间隔。
[0116]
进而得到最优超平面:
[0117]
f(x)=(w
t
x b)
[0118]
其中,所述f(x)表示最优超平面函数,w
t
为超平面的法向量,x为特征向量集,b为实数位移项。
[0119]
详细地,所述利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,包括:
[0120]
将所述特征向量集划分为第二训练集与第二验证集;
[0121]
获取所述最优超平面的函数,利用所述最优超平面的函数对所述第二训练集进行分类,得到所述第二训练集所属的文本类别;
[0122]
利用所述最优超平面的函数对所述第二验证集进行分类,得到所述第二验证集所属的文本类别;
[0123]
判断所述第二验证集所属的文本类别与所述第二训练集所属的文本类别是否一致;
[0124]
若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别不一致,则调整所述超平面函数的参数,再次执行所述利用所述最优超平面的函数对所述训练集进行分类的操作;
[0125]
若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别一致,则将所述第二验证集所属的文本类别和/或所述第二训练集所属的文本类别作为所述特征向量集的第二分类结果。
[0126]
本发明实施例中,所述最优超平面函数为:f(x)=sign(w
t
x b)
[0127]
其中,所述sign为阶跃函数:
[0128][0129]
本发明实施例中,可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0130]
s4、判断所述第一分类结果与所述第二分类结果是否一致。
[0131]
本发明实施例中,所述判断所述第一分类结果与所述第二分类结果是否一致,包括:计算所述第一分类结果与所述第二分类结果的关联度,若所述关联度大于预设关联度,则所述第一分类结果与所述第二分类结果一致,若所述关联度大于预设关联度,则所述第一分类结果与所述第二分类结果不一致。
[0132]
一个可选实施例中,所述第一分类结果与所述第二分类结果的关联度可以通过相似度算法实现,如余弦相似度算法、jaccard相似系数算法等,所述预设关联度可以设置为0.95,也可以根据实际业务场景设置。
[0133]
s5、若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类。
[0134]
本发明实施例中,若所述若所述第一分类结果与所述第二分类结果不一致,则无法输出目标文本类别,调整所述朴素贝叶斯分类器的参数及所述特征向量集的所述最优超平面的选取,再次执行所述第一分类和所述第二分类,即再次利用所述朴素贝叶斯分类器对所述特征向量集进行第一分类以及重新选取所述特征向量集的最优超平面,利用选取的最优超平面对所述特征向量集进行第二分类,直到所述第一分类结果与所述第二分类结果一致。
[0135]
s6、若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
[0136]
例如,在本发明实施例中,待分类文本为“我想要申请办理信用卡”,得到的第一分类结果为“信用卡办理业务受理”,第二分类结果为“信用卡办理业务受理”,则将“信用卡办理业务受理”作为待分类文本的分类结果。
[0137]
本发明实施例中,可以利用人工智能,通过预设的判定规则,得到所述待分类文本的分类结果。
[0138]
本发明实施例首先通过朴素贝叶斯分类器对特征向量集进行第一分类,得到第一分类结果,进而确定所述特征向量集的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,最后判断第一分类结果和第二分类结果的一致性,当第一分类结果和第二分类结果不一致时,不断调整所述朴素贝叶斯分类器的参数和最优超平面的选取,提高模型分类的准确性,从而提高基于深度学习的文本分类的准确率。因此本发明实施例提出的基于深度学习的文本分类方法可以提高基于深度学习的文本分类的准确率。
[0139]
如图2所示,是本发明基于深度学习的文本分类装置的功能模块图。
[0140]
本发明所述基于深度学习的文本分类装置100可以安装于电子设备中。根据实现的功能,所述基于深度学习的文本分类装置可以包括文本特征提取模块101、朴素贝叶斯分类模块102、最优超平面分类模块103、文本最终分类模块104,本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0141]
在本实施例中,关于各模块/单元的功能如下:
[0142]
所述文本特征提取模块101,用于获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集。
[0143]
本发明实施例中,所述待分类文本集包括多个不同类型的文本,待分类文本集可以从市场上各种银行app、理财app的客服问题反馈中获取,获取的文本可以包括用户反馈的问题文本、文本长度、情感分析等信息。
[0144]
所述特征向量集是通过向量来表示所述待分类文本集中的词语特征。
[0145]
详细地,所述文本特征提取模块101通过执行下述操作对所述待分类文本集执行特征提取,得到特征向量集,包括:
[0146]
利用预构建的词向量转化模型对所述待分类文本集执行向量化操作,生成多个单词向量;
[0147]
对多个所述单词向量进行预训练,得到多个预训练的词向量;
[0148]
将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,并将所述匹配词向量组成特征向量集。
[0149]
由于在词嵌入中预训练的词向量可降低词嵌过程的输出参数,因此,本实施例中对词向量提前进行训练,从而得到预训练的词向量。另外,提前训练词向量可以将语义相近的词,聚集在词向量空间里,为后续基于深度学习的文本分类操作提供了便利。
[0150]
进一步地,所述将所述待分类文本集中与多个所述词向量进行匹配,得到匹配词向量,包括:
[0151]
将所述待分类文本集分别与多个所述词向量进行匹配;
[0152]
对所述待分类文本集中与多个所述词向量相匹配的文本转化为向量,得到匹配词向量。
[0153]
所述朴素贝叶斯分类模块102,用于利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果。
[0154]
本发明实施例中,所述朴素贝叶斯分类器是基于贝叶斯算法将所述特征向量集进行分类的分类器,主要作用是文本进行分类。
[0155]
详细地,所述朴素贝叶斯分类器分类102通过下述操作利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果,包括:
[0156]
将所述特征向量集划分为第一训练集与第一验证集;
[0157]
利用预构建的朴素贝叶斯分类器对所述第一训练集进行分类,得到所述第一训练集的先验概率;
[0158]
根据所述先验概率对所述第一训练集中多个特征向量的文本类别进行预测,得到所述第一训练集的预测文本类别;
[0159]
将所述第一验证集输入所述朴素贝叶斯分类器中,得到所述第一验证集的预测文本类别;
[0160]
若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别不一致,则调整所述朴素贝叶斯分类器的参数,再次执行所述朴素贝叶斯分类器对所述第一训练集进行分类的操作;
[0161]
若所述第一验证集的预测文本类别与所述第一训练集的预测文本类别一致,则将所述第一验证集的预测文本类别和/或所述第一训练集的预测文本类别作为第一分类结果。
[0162]
本发明实施例中,所述先验概率表示根据经验得到的特征向量集属于某文本类别
的概率;所述后验概率表示特征向量集在进行分类时,所述特征向量集属于某文本类别的概率。
[0163]
例如,先验概率可以为p(a|b),后验概率可以为p(b|a);其中,“a”表示特征向量集,“b”表示所述特征向量集对应的文本类别。
[0164]
本发明实施例中,对所述特征向量集执行分类,可以通过所述朴素贝叶斯分类器的条件概率公式实现:
[0165][0166]
具体地,例如文本类别集合为c={c1,c2,

,c
n
},特征向量集为d={d1,d2,

,d
m
},根据所述条件概率公式可知所述特征向量集d属于所述文本类别c的概率可通过下列公式计算:
[0167][0168]
其中,所述p(d)是预设固定值,所述p(c
i
|d)表示在d条件下每个文本类别的概率中概率最大的项对应的文本类别即为d特征向量集的文本类别,p(d|c
i
)表示在c
i
发生的条件下d发生的概率,p(c
i
)表示特征向量对应的第i个文本类别概率,p(d
j
|c
i
)表示在文本类别为c
i
的特征向量及中,第j个特征向量d
j
出现次数占总文本类别为c
i
的比例,m表示特征向量的个数。
[0169]
进一步地,若出现p(d
j
|c
i
)=0,会导致p(c
i
|d)=0,则公式无意义,为了避免p(d
j
|c
i
)=0,可以采用拉普拉斯校准,具体的校准方法可从现有技术中获取,此处不再赘述。
[0170]
类似地,若出现p(c
i
)=0,也可以采用拉普拉斯校准。
[0171]
本发明实施例中,可以基于人工智能算法,实现所述特征向量集的第一分类。
[0172]
所述最优超平面分类模块103,用于构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果。
[0173]
本发明实施例中,所述超平面函数可以看作所述特征向量集的预测文本类别的分界面。
[0174]
详细地,所述最优超平面分类模块103可以通过执行下述操作构建所述特征向量集的多个超平面函数,包括:
[0175]
将所述特征向量集中的向量映射至平面坐标系中,得到多个平面法向量;
[0176]
根据多个所述平面法向量和预设的回归函数获取多个所述超平面函数。
[0177]
本发明实施例中,所述回归函数的表达式可以为h
θ
(z)=g(θ
t
z)。
[0178]
例如,所述特征向量集d可以分为d0和d1,若存在n维向量和实数b,当θ
t
z=0,对h
θ
(z)进行改写,得到h
w,b(x)
(x)=g(w
t
x
i
b);使得所有属于d0的点x
i
都有w
t
x
i
b>0;而所有属于d1的点x
i
都有w
t
x
i
b<0,则所述将d0和d1完全划开的超平面函数则为w
t
x
i
b=0。
[0179]
本发明实施例中,所述最优超平面是指特征向量集两侧距离超平面最近的样本点到超平面的距离最大。
[0180]
例如,所述特征向量集d可以分为d0和d1,d0和d1中的样本点分布在超平面的两侧,
使d0和d1中的距离超平面最近的样本点到超平面的距离最大,则所述超平面即为最优超平面。
[0181]
详细地,所述最优超平面分类模块103可以通过执行下述操作利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,包括:
[0182]
利用预设的几何间隔确定多个所述超平面函数中的两个平行超平面函数,对所述两个平行超平面函数进行公式转换得到约束条件;
[0183]
利用所述拉格朗日数乘法将所述约束条件转化为无约束条件,对所述无约束条件进行运算得到所述两个平行超平面函数中的最优超平面。
[0184]
本发明实施例中,所述两个平行超平面函数之间的最大距离就是最大化间隔,根据所述最大化间隔可以得到约束条件;所述约束条件是指在一个有限的空间里,找到目标函数的最优值。
[0185]
例如,所述几何间隔的大小为:
[0186][0187]
其中,w是超平面的法向量,样本点a的坐标为x
(i)
,样本点a到分界线的距离为
[0188]
将所述几何间隔代入超平面函数w
t
x
i
b=0中,得到两个平行超平面函数为:
[0189]
w
t
x b≥1,y=1
[0190]
w
t
x b≤

1,y=
‑1[0191]
其中,所述w
t
为超平面的法向量,x为特征向量集,b为实数位移项。
[0192]
将所述两个平行超平面函数合并,得到:
[0193]
y(w
t
x b)≥1
[0194]
样本点到超平面的距离可以表示为:
[0195][0196]
对所述样本点到超平面的距离做转化,得到约束条件:
[0197][0198]
所述拉格朗日函数为:
[0199][0200]
其中,所述x
i
是特征向量集,y
i
是x
i
的类别标记,b为实数位移项,γ
i
为几何间隔,||w||为
[0201]
对所述拉格朗日函数求偏导,得到:
[0202]
[0203]
其中,m表示两个平行超平面上的样本点,x
i
是特征向量集,y
i
是x
i
的类别标记,γ
i
为几何间隔。
[0204]
进而得到最优超平面:
[0205]
f(x)=(w
t
x b)
[0206]
其中,所述f(x)表示最优超平面函数,w
t
为超平面的法向量,x为特征向量集,b为实数位移项。
[0207]
详细地,所述最优超平面分类模块103可以通过执行下述利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,包括:
[0208]
将所述特征向量集划分为第二训练集与第二验证集;
[0209]
获取所述最优超平面的函数,利用所述最优超平面的函数对所述第二训练集进行分类,得到所述第二训练集所属的文本类别;
[0210]
利用所述最优超平面的函数对所述第二验证集进行分类,得到所述第二验证集所属的文本类别;
[0211]
判断所述第二验证集所属的文本类别与所述第二训练集所属的文本类别是否一致;
[0212]
若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别不一致,则调整所述超平面函数的参数,再次执行所述利用所述最优超平面的函数对所述训练集进行分类的操作;
[0213]
若所述第二验证集所属的文本类别与所述第二训练集的所属的文本类别一致,则将所述第二验证集所属的文本类别和/或所述第二训练集所属的文本类别作为所述特征向量集的第二分类结果。
[0214]
本发明实施例中,所述最优超平面函数为:f(x)=sign(w
t
x b)
[0215]
其中,所述sign为阶跃函数:
[0216][0217]
本发明实施例中,可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0218]
所述文本最终分类模块104,用于判断所述第一分类结果与所述第二分类结果是否一致,若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类,若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
[0219]
本发明实施例中,所述文本最终分类模块104可以判断所述第一分类结果与所述第二分类结果是否一致,包括:计算所述第一分类结果与所述第二分类结果的关联度,若所述关联度大于预设关联度,则所述第一分类结果与所述第二分类结果一致,若所述关联度大于预设关联度,则所述第一分类结果与所述第二分类结果不一致。
[0220]
一个可选实施例中,所述第一分类结果与所述第二分类结果的关联度可以通过相似度算法实现,如余弦相似度算法、jaccard相似系数算法等,所述预设关联度可以设置为0.95,也可以根据实际业务场景设置。
[0221]
本发明实施例中,若所述若所述第一分类结果与所述第二分类结果不一致,则无法输出目标文本类别,调整所述朴素贝叶斯分类器的参数及所述特征向量集的所述最优超平面的选取,再次执行所述第一分类和所述第二分类,即再次利用所述朴素贝叶斯分类器对所述特征向量集进行第一分类以及重新选取所述特征向量集的最优超平面,利用选取的最优超平面对所述特征向量集进行第二分类,直到所述第一分类结果与所述第二分类结果一致。
[0222]
例如,在本发明实施例中,待分类文本为“我想要申请办理信用卡”,得到的第一分类结果为“信用卡办理业务受理”,第二分类结果为“信用卡办理业务受理”,则将“信用卡办理业务受理”作为待分类文本的分类结果。
[0223]
本发明实施例中,可以利用人工智能,通过预设的判定规则,得到所述待分类文本的分类结果。
[0224]
本发明实施例首先通过朴素贝叶斯分类器对特征向量集进行第一分类,得到第一分类结果,进而确定所述特征向量集的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果,最后判断第一分类结果和第二分类结果的一致性,当第一分类结果和第二分类结果不一致时,不断调整所述朴素贝叶斯分类器的参数和最优超平面的选取,提高模型分类的准确性,从而提高基于深度学习的文本分类的准确率。因此本发明实施例提出的基于深度学习的文本分类装置可以提高基于深度学习的文本分类的准确率。
[0225]
如图3所示,是本发明实现基于深度学习的文本分类方法的电子设备的结构示意图。
[0226]
所述电子设备可以包括处理器10、存储器11、通信总线12和通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于深度学习的文本分类程序。
[0227]
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于深度学习的文本分类程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0228]
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利
用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于深度学习的文本分类程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0229]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述通信总线12总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0230]
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0231]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi

fi模块等,在此不再赘述。
[0232]
可选地,所述通信接口13可以包括有线接口和/或无线接口(如wi

fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
[0233]
可选地,所述通信接口13还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0234]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0235]
所述电子设备中的所述存储器11存储的基于深度学习的文本分类程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
[0236]
获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集;
[0237]
利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果;
[0238]
构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果;
[0239]
判断所述第一分类结果与所述第二分类结果是否一致;
[0240]
若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类;
[0241]
若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
[0242]
具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0243]
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携待所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)。
[0244]
本发明实施例还可以提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0245]
获取待分类文本集,对所述待分类文本集进行特征提取,得到特征向量集;
[0246]
利用预构建的朴素贝叶斯分类器对所述特征向量集进行第一分类,得到第一分类结果;
[0247]
构建所述特征向量集的多个超平面函数,利用拉格朗日数乘法确定多个所述超平面函数中的最优超平面,利用所述最优超平面对所述特征向量集进行第二分类,得到第二分类结果;
[0248]
判断所述第一分类结果与所述第二分类结果是否一致;
[0249]
若所述第一分类结果与所述第二分类结果不一致,调整所述朴素贝叶斯分类器的参数及所述最优超平面的选取,再次执行所述第一分类和所述第二分类;
[0250]
若所述第一分类结果与所述第二分类结果一致,将所述第一分类结果或所述第二分类结果作为所述待分类文本的分类结果。
[0251]
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
[0252]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0253]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0254]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0255]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0256]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0257]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0258]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0259]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献