一种基于多图注意力的中医证型分类方法与流程

2022-12-02 22:45:09 来源：中国专利 TAG：

1.本发明涉及分类技术领域，具体但不限于涉及一种基于多图注意力的中医证型分类方法。

背景技术：

2.中医历史悠久、底蕴深厚，为全人类的健康事业做出了巨大的贡献。同时在新冠肺炎患者救治工作中，中医药显示了明显疗效，在抗击疫情中发挥了重要作用。证型是由不同的病因引起阴阳气血的不同变化导致人体的不同疾病状态，证型能够揭示病变的机理和发展趋势，中医学将其作为确定治法、处方开药的依据，因此实现精准的证型分类在中医治疗中至关重要。
3.医生是依据个人的经验来通过望、闻、问、切四种诊断方法来判断证型，仅靠个人经验其主观性强，这使得中医难以推广。随着人工智能技术的发展，目前已经有许多机器学习和深度学习的算法应用于证型分类中，使得传统中医与计算机辅助诊断相结合。朱文锋等在《贝叶斯网络在中医证素辨证体系中的应用》中提出，使用贝叶斯网络，结合相关的经验和算法模型，其模型的诊断结果和经验丰富的老中医的诊断结果一致。张承江等在《中医肾病治疗信息中关联规则的挖掘算法》中把经典的先验相关算法和fp-生长相关算法运用到中医证型分类，运用数据挖掘技术，寻找中医症状与中医综合征类型之间的映射关系。吴燎等在《基于共轭梯度下降算法的bp神经网络的中医糖尿病诊断模型研究》中构建了基于共轭梯度算法建立了治疗中医冠心病综合征的bp神经网络，该模型参考了14种综合征，表现良好。hu等在《a preliminary study on imbalanced syndrome differentiation of cold and heat》中使用神经网络分类器来区分冷综合征和热综合征，并通过fasttext对不平衡数据的不敏感性来验证该方法的有效性。
4.但是现有方法只考虑了症状和证型之间的关系，并未考虑证素这个关键成分，同时症状和证型之间的关系是非常复杂和非线性的，使用传统的机器学习方法很难准确的提取两者之间的关系，这使得现有算法的准确率并不高。
5.有鉴于此，需要提供一种新的方法，以期解决上述至少部分问题。

技术实现要素：

6.针对现有技术中的一个或多个问题，本发明提出了一种基于多图注意力的中医证型分类方法，通过构造图结构的形式综合考虑了症状和证素在证型分类中的贡献，将症状-症状图和症状-证素-症状图集成到分类中，并且使用多图注意力网络来聚合症状和证素的特征，最后通过多层感知机实现证型分类，同时在真实数据集上进行了广泛的实验，验证了多图注意力网络的有效性，实现了更精准的分类结果，取得了较好的效果。
7.实现本发明目的的技术解决方案为：一种基于多图注意力的中医证型分类方法，包括：步骤1、获取包含若干条临床数据的数据集，利用症状和证素的关系构建症状-症
状图、症状-证素图和症状嵌入矩阵；步骤2、基于多图注意力网络对症状-症状图和症状-证素图分别进行图注意力特征聚合，得到症状与症状之间的特征表示和症状与证素之间的特征表示；将症状与症状之间的特征表示与症状与证素之间的特征表示进行矩阵拼接，得到新的症状特征表示；将症状嵌入矩阵与新的症状特征表示相乘，获得症状组合特征表示，所述症状组合特征表示包含了症状和证素的信息；步骤3、基于症状组合特征表示，使用多层感知机mlp作为分类器进行证型分类预测。
8.进一步的，本发明的基于多图注意力的中医证型分类方法，步骤1中，每条临床数据均由症状、证素和证型的多热编码表示：症状集合、证素集合和证型集合，m为数据集中包含的症状的数量，k为数据集中包含的证素数量，l为数据集中包含的证型数量；对于任意一条临床数据，若第个症状/证素/证型出现，则在对应症状集合/证素集合/证型集合中相应的位置置1，否则置0。
9.进一步的，本发明的基于多图注意力的中医证型分类方法，步骤1中构建症状-症状图、症状-证素图和症状嵌入矩阵的具体步骤包括：步骤1-1：构建症状-症状无向图：统计所有症状在临床数据中出现的频次，把频次≥阈值的症状提取出来，并两两相连构成症状-症状无向图；步骤1-2：构建症状-证素无向图：比较任意两条临床数据，统计两者中相同证素的数量，如果相同证素的数量＞阈值，则将该两条临床数据的症状相互连接；步骤1-3：构建症状嵌入矩阵，定义，其中，是临床数据的总数。
10.进一步的，本发明的基于多图注意力的中医证型分类方法，步骤2中基于多层图注意力网络对症状-症状图和症状-证素图分别进行图注意力特征聚合的具体步骤包括：1）分别计算症状-症状图和症状-证素图中节点对的注意力系数：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中，为共享权重矩阵，是输入特征的个数，是输出特征的个
数，是节点的特征，是节点的特征，是拼接向量映射到实数上，leakyrelu为激活函数，节点对是指在无向图中有边连接的两个点；对每个节点对的注意力系数进行归一化，得到归一化的注意力系数：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中，为的邻居节点；2）将症状-症状图的症状聚集到其一阶邻近点，得到一阶症状聚合表示：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中，表示注意力的头数，是节点的一阶邻居，为症状-症状图注意力的互相关系数，为症状-症状图输入特征的线性变换矩阵，为症状-症状图相邻节点的原始特征表示，为激活函数；对一阶症状聚合表示加入残差项，得到症状-症状图的第1层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，linear是线性层，为症状-症状图在模型中的残差项；同理，症状-证素图的第1层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中，是节点的一阶邻居，为症状-证素图注意力的互相关系数，为症状-证素图输入特征的线性变换矩阵，为症状-证素图相邻节点的原始特征表示，为症状-证素图在模型中的残差项；
3）通过堆叠多层图注意力分别聚合症状-症状图、症状-证素图的高阶相邻节点特征，得到症状-症状图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中，为当前的层数, 为图注意力网络的总层数；症状-证素图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)4）最后一层的多头注意力是取所有多头注意力的平均值，则症状-症状图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)症状-证素图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)症状-症状图第层图注意力网络的特征聚合结果即为症状与症状之间的特征表示，症状-证素图第层图注意力网络的特征聚合结果即为症状与证素之间的特征表示。
11.进一步的，本发明的基于多图注意力的中医证型分类方法，步骤2中矩阵拼接操作的公式为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中，为两个矩阵的拼接操作。
12.进一步的，本发明的基于多图注意力的中医证型分类方法，症状组合特征表示为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)其中，为两个矩阵进行相乘操作。
13.进一步的，本发明的基于多图注意力的中医证型分类方法，使用多层感知机mlp进
行证型分类预测的具体步骤包括：将症状组合特征表示输入多层感知机mlp，经过计算后得到模型预测的证型类别：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)其中，和分别为第一层和第二层的权值矩阵，和分别为第一层和第二层的偏置向量，概率最大的类别即为分类的结果；利用bce损失函数来计算模型预测和用于训练模型的实际输出之间的差距：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中，是证型类别的数量，是真实的类别。
14.一种基于多图注意力和多层感知机的中医证型分类系统，包括：多图构造模块，基于临床数据集，利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵；多图注意力特征聚合模块，基于多图注意力网络对症状-症状图和症状-证素图分别进行图注意力特征聚合，再进行矩阵拼接，得到新的症状特征表示；将症状嵌入矩阵与新的症状特征表示相乘，获得症状组合特征表示；证型分类模块，基于症状组合特征表示，使用多层感知机作为分类器进行证型分类预测。
15.本发明采用以上技术方案与现有技术相比，具有以下技术效果：1、本发明的基于多图注意力的中医证型分类方法运用多个无向图，构建了一个多图注意力网络(mgat)模型，获得了更具表达能力的症状综合嵌入表示。
16.2、本发明的基于多图注意力的中医证型分类方法引入多个图聚合症状和证素之间的关系，运用多图注意力网络得到包含症状和证素信息的新的特征表示。
17.3、本发明的基于多图注意力的中医证型分类方法中构建的多图注意力网络(mgat)模型不但符合中医理论，且在证型分类性能上表现突出，在中医领域广泛采用的伤寒论数据集上进行实验，验证了本发明分类方法的优越性。
附图说明
18.附图用来提供对本发明的进一步理解，与说明描述一起用于解释本发明的实施例，并不构成对本发明的限制。在附图中：图1示出了本发明的基于多图注意力的中医证型分类方法的流程图。
19.图2示出了本发明的基于多图注意力的中医证型分类方法的多图注意力网络模型示意图。
具体实施方式
20.为了进一步理解本发明，下面结合实施例对本发明优选实施方案进行描述，但是应当理解，这些描述只是为进一步说明本发明的特征和优点，而不是对本发明权利要求的限制。
21.该部分的描述只针对典型的实施例，本发明并不仅局限于实施例描述的范围。不同实施例的组合、不同实施例中的一些技术特征进行相互替换，相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。
22.由于单个症状图只能聚合部分信息，这导致图注意力网络不能够很好的表示症状和证型之间的关系。本发明通过将症状-症状图和症状-证素-症状图集成到分类中，提出了一个多图注意力网络(mgat)。
23.根据本发明的一个方面，一种基于多图注意力的中医证型分类方法，如图1所示，包括：步骤1、获取包含若干条临床数据的数据集，利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵。具体步骤包括：步骤1-1：构建症状-症状无向图：统计所有症状在临床数据中出现的频次，把频次≥阈值的症状提取出来，并两两相连构成症状-症状无向图。
24.步骤1-2：构建症状-证素无向图：比较任意两条临床数据，统计两者中相同证素的数量，如果相同证素的数量＞阈值，则将该两条临床数据的症状相互连接。如果两个症状和多个证素同时存在，则两种症状之间存在特殊的关系，这是构建症状-证素无向图的依据。
25.步骤1-3：构建症状嵌入矩阵，定义，其中，是临床数据的总数。
26.优选的，每条临床数据均由症状、证素和证型的多热编码表示：症状集合、证素集合和证型集合，m为数据集中包含的症状的数量，k为数据集中包含的证素数量，l为数据集中包含的证型数量；对于任意一条临床数据，若第个症状/证素/证型出现，则在对应症状集合/证素集合/证型集合中相应的位置置1，否则置0。
27.步骤2、基于多图注意力网络对症状-症状图和症状-证素图分别进行图注意力特征聚合，得到症状与症状之间的特征表示和症状与证素之间的特征表示；具体步骤包括：1）分别计算症状-症状图和症状-证素图中节点对的注意力系数：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
其中，为共享权重矩阵，是输入特征的个数，是输出特征的个数，是节点的特征，是节点的特征，是拼接向量映射到实数上，leakyrelu为激活函数，节点对是指在无向图中有边连接的两个点；对每个节点对的注意力系数进行归一化，得到归一化的注意力系数：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中，为的邻居节点；2）将症状-症状图的症状聚集到其一阶邻近点，得到一阶症状聚合表示：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中，表示注意力的头数，是节点的一阶邻居，为症状-症状图注意力的互相关系数，为症状-症状图输入特征的线性变换矩阵，为症状-症状图相邻节点的原始特征表示，为激活函数；对一阶症状聚合表示加入残差项，得到症状-症状图的第1层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，linear是线性层，为症状-症状图在模型中的残差项；同理，症状-证素图的第1层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中，是节点的一阶邻居，为症状-证素图注意力的互相关系数，为症状-证素图输入特征的线性变换矩阵，为症状-证素图相邻节点的原始特征表
示，为症状-证素图在模型中的残差项；3）通过堆叠多层图注意力分别聚合症状-症状图、症状-证素图的高阶相邻节点特征，得到症状-症状图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中，为当前的层数, 为图注意力网络的总层数；症状-证素图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)4）最后一层的多头注意力是取所有多头注意力的平均值，则症状-症状图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)症状-证素图第层图注意力网络的特征聚合结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)由此，症状-症状图第层图注意力网络的特征聚合结果即为症状与症状之间的特征表示，症状-证素图第层图注意力网络的特征聚合结果即为症状与证素之间的特征表示。
28.将症状与症状之间的特征表示与症状与证素之间的特征表示进行矩阵拼接，得到新的症状特征表示；矩阵拼接操作的公式为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中，为两个矩阵的拼接操作。
29.将症状嵌入矩阵与新的症状特征表示相乘，获得症状组合特征表示，所
述症状组合特征表示包含了症状和证素的信息。症状组合特征表示为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)其中，为两个矩阵进行相乘操作。
30.步骤3、基于症状组合特征表示，使用多层感知机mlp作为分类器进行证型分类预测。具体步骤包括：将症状组合特征表示输入多层感知机mlp，经过计算后得到模型预测的证型类别：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)其中，和分别为第一层和第二层的权值矩阵，和分别为第一层和第二层的偏置向量，概率最大的类别即为分类的结果；利用bce损失函数来计算模型预测和用于训练模型的实际输出之间的差距：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中，是证型类别的数量，是真实的类别。
31.根据本发明的另一个发明，一种基于多图注意力和多层感知机的中医证型分类系统，如图2所示，包括：多图构造模块，基于临床数据集，利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵；多图注意力特征聚合模块，基于多图注意力网络对症状-症状图和症状-证素图分别进行图注意力特征聚合，再进行矩阵拼接，得到新的症状特征表示；将症状嵌入矩阵与新的症状特征表示相乘，获得症状组合特征表示；证型分类模块，基于症状组合特征表示，使用多层感知机作为分类器进行证型分类预测。
32.实施例1一种基于多图注意力的中医证型分类方法，包括：（1）多图构造在数据集中，每条临床数据都可以由症状、证素和证型的多热编码表示，分别为、和，如果第个症状出现，则在症状集合相应的位置置1，否则置0。同理证素集合和证症集合也可以这样表示。
33.然后定义构建的两个无向图，分别为症状-症状图和症状-证素图。症状-症状图的构造规则是统计所有临床数据中出现的症状频次，把出现频次大于等于阈值的
症状提取出来，让其相互连接构图。症状-证素图的构造规则是比较两条临床数据中证素相同的个数。如果相同证素的数量大于阈值，则让两条数据的症状相互连接构图。如果两个症状和多个状态元素同时存在，则两种症状之间存在特殊的关系。
34.症状嵌入矩阵，其中是临床数据的总数，然后定义，其中是数据集中包含的症状类型的数量。如果症状出现在临床数据中，则设置为1，否则设置为0。
35.（2）多图注意力特征聚合模块在这一模块中分别将症状-症状图和症状-证素图输入到不同的gat模块中进行计算，得到新的症状的特征表示和，其中集合了症状与症状之间的特征，集合了症状与证素之间的特征。然后，将和合并，得到新的症状特征表示。最后，将症状嵌入矩阵与相乘，获得症状组合特征表示。
36.首先，介绍注意力系数的计算。计算症状-症状图和症状-证素图中有边连接的任意两个点形成的节点对之间的注意力值：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中，为共享权重矩阵，是输入特征的个数，是输出特征的个数，是节点的特征，是节点的特征，是拼接向量映射到实数上，并通过leakyrelu激活。
37.聚合邻居信息时，需要对每个节点对的注意力系数进行归一化得到：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中，为的邻居节点。
38.对于症状-症状图，将症状聚集到其一阶邻近点的过程定义为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中，表示注意力的头数，是节点的一阶邻居，为注意力的互相关
系数，为输入特征的线性变换矩阵，为相邻节点的原始特征表示。为激活函数。
39.为了避免层数太深导致的梯度消失问题，在本模型中加入了残差项，则经过第一层gat得到的结果为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，是一阶症状聚合表示，linear是线性层，因为和维度不同，不能直接相加。
40.类似地，对于症状-证素图的节点聚合过程可以定义为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中，是节点的一阶邻居，为注意力的互相关系数，为输入特征的线性变换矩阵，为相邻节点的原始特征表示。
41.以上内容只是在一层的图注意力特征聚合，可以扩展为多层的特征聚合。对于第层的特征聚合，聚合过程定义为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中，为当前的层数, 为gat模块的层数。通过堆叠多层图注意力来聚合高阶相邻节点特征。
42.最后一层的图注意力与前面层数的定义不同，最后一层的多头注意力是取所有多头注意力的平均值：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)然后，将获得的两个新的症状特征表示进行矩阵拼接操作：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
其中，为两个矩阵的拼接操作。
43.最后，将症状嵌入矩阵与相乘，获得症状组合特征表示，换句话说，这一步是从单一症状到一组症状的聚合，具体定义如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)其中，为两个矩阵进行相乘操作。
44.（3）证型分类模块新的症状组合特征表示包含了症状和证素的信息。在证型分类模块中，使用作为mlp的输入，经过计算后得到一组概率值，概率最大的类别就是分类的结果。具体步骤如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)其中，和分别为第一层和第二层的权值矩阵，和分别为第一层和第二层的偏置向量。是预测的证型类别的概率向量。
45.最后，在网络训练中使用bce损失函数来计算模型预测和用于训练模型的实际输出之间的差距：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中，是证型类别的数量，是模型预测的类别，是真实的类别。
46.下面，采用实验数据集对本实施例的方法进行验证评价。
47.1）实验数据集及评价指标本实验是在python3.9环境中使用pytorch1.10深度学习库进行的。实验设备包括一个英特尔酷睿i5-11400h处理器、英伟达geforce rtx 3050显卡和windows11操作系统。
48.为验证本发明方法的有效性，采用真实中医数据集进行了实验。
49.伤寒论数据集：该数据集整理自中医学的经典著作《伤寒论》。处理完成后的数据集共包含173条数据，包括697个症状、925个证素和173个证型。在本实验中，训练集和测试集的比例是9:1。
50.在本实施例中，采用四个常用的指标来评估：准确率(accuracy)、精确率(precision)、召回率(recall)和f1评分(f1-score)。准确率代表证型分类算法正确分类样本占总样本的比例。精确率代表算法正确预测的比例。召回率代表算法正确预测的真实标签证型的比例。f1分数是精确率和召回率两个指标的加权均值。这四个评价指标均呈正相关，数值越大，模型性能越好。这些指标的定义如下所示：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)其中，表示正确预测的正样本数，表示正确预测的负样本数。是预测为正的负样本数，是预测为负的正样本数。
51.2）基线本实施例使用以下几种方法来进行对比实验：
·
support vector machine(svm): svm是一组用于分类和回归的相关监督学习方法。通过svm建立证型分类模型，找到最佳的超平面实现分类
11.。
52.·
mlp: mlp证型分类模型有两层隐藏层，输入层的维度是症状特征数量，输出层维度是证型类别数量，用于预测证型
12.。
53.·
cnn:卷积神经网络分类模型由卷积层和全连接层组成。卷积层用于提取症状特征，全连接层实现分类。该模型实现了相对准确的分类
13.。
54.·
gcn:图卷积神经网络模型能够更好的表示特征的关系。该模型由gcn层和全连接层组成。gcn层的输入是症状与症状关系的图，最后一层全连接层的输出维度是证型类别的数量，用于预测证型类别。
55.3）实验结果为最小化随机性对实验结果带来的影响，本实施例中所有的实验结果均展示为运行50次的平均结果。
56.a）定量分析表1显示了mgat的实验结果和其他四种算法的比较。mgat在准确性、精确率、召回率和f1分数评价指标上优于其他四种算法。具体来说，mgat的准确率为82.11%，精确率为74.18%，召回率为81.73%，f1分数为76.51%。此外，实验结果表明，gcn是其他对比算法中性能最好的。在准确率、精确率、召回率和f1分数方面，mgat分别比gcn高7.29%、4.31%、8.84%、5.69%。本定量实验表明，本发明的mgat显著提高了中医证型分类的准确性。
57.表1 不同方法的实验结果算法accuracyprecisionrecallf1_scoresvm0.67590.59800.64600.6124mlp0.68330.53660.62280.5638cnn0.71290.60090.68770.6283gcn0.74820.69870.72890.7082mgat0.82110.74180.81730.7651b）定性分析表2显示了mgat分类结果和真实标签的比较，可以看出，前两个证型预测正确，最
后一个错误的将阳明热结轻证预测为阳明热结重证。因为阳明热结轻证的证素主要有热、燥屎、胃、肠，与阳明热结重证的证素非常类似，所以导致预测错误。这些结果表明，mgat可以提供一个更准确的证型分类模型，并具有实用价值。
58.表2 案例分析
症状证素真实标签mgat结果手足冷，身重，汗出，谵语，语言不利胃，热，寒阳明热盛证阳明热盛证谵语，不大便，身体枯燥不荣，手足躁扰不宁热，毒，阴虚，津亏，心神，肌肤气血两燔证气血两燔证谵语，潮热，汗出，大便干热，燥屎，胃，肠，心神阳明热结轻证阳明热结重证
本发明提出的基于多图注意力的中医证型分类方法提供了一个更准确的证型分类模型，并具有实用价值，能够显著提高中医证型分类的准确性。
59.这里本发明的描述和应用是说明性的，并非想将本发明的范围限制在上述实施例中。说明书中所涉及的效果或优点等相关描述可因具体条件参数的不确定或其它因素影响而可能在实际实验例中不能体现，效果或优点等相关描述不用于对发明范围进行限制。这里所披露的实施例的变形和改变是可能的，对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是，在不脱离本发明的精神或本质特征的情况下，本发明可以以其它形式、结构、布置、比例，以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下，可以对这里所披露的实施例进行其它变形和改变。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：芯片原点定位方法、装置、可读存储介质及电子设备与流程

一种基于多图注意力的中医证型分类方法与流程

相关文献

最热文献