一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于尿液颜色的疾病认知系统的制作方法

2022-02-20 00:19:18 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及一种基于尿液颜色的疾病认知系统。
技术背景
2.人体的泌尿系统是一个连续的管道系统,尿液源于肾脏的肾小球,经肾小管等收集系统的作用,再经肾盂、输尿管进入膀胱。尿液流出膀胱还需要经过一个闸门,这就是尿道括约肌,男性尿液还要经穿过前列腺的尿道才能排出体外。从尿液的起源到排出体外,所经的任何一个器官部位出现疾病,都会影响尿液的颜色,换句话说就是尿液的颜色与疾病有关,也就是说,通过对尿液颜色变化的观察分析,可以初步了解身体的健康状况。
3.现有的医学诊断方法一般是通过干化学尿液分析仪对尿液样本进行检测得到检测结果,对尿液样本的检测结果进行分析,即对照疾病特征信息对尿液样本的检测数据进行逐一分析,根据分析结果确定对应的疾病。疾病认知的整个过程都是由人工辅助操作的,操作环节多,过程繁琐,还可能出现尿液颜色判断不准确的问题,从而影响报告输出效率以及报告结果的精确度。


技术实现要素:

4.有鉴于此,本发明提出了一种基于尿液颜色的疾病认知系统,减少了尿液颜色认知疾病过程中的人工操作,提高了疾病认知的效率以及精确度。
5.本发明的技术方案是这样实现的:
6.本发明提供了一种基于尿液颜色的疾病认知系统,所述基于尿液颜色的疾病认知系统包括:第一数据获取模块、数据集建立模块、分类模型建立模块、第二数据获取模块、认知模块;
7.第一数据获取模块,用于获取历史尿液样本,从中提取特征信息数据;
8.所述历史尿液样本包括正常尿液样本和异常尿液样本,所述特征信息数据包括尿液透明度数据以及尿液具体颜色数据;
9.数据集建立模块,用于对所述尿液具体颜色数据和尿液透明度数据进行归一化处理,并将该尿液具体颜色数据和尿液透明度数据进行组合,得到组合数据,根据组合数据获取对应的疾病征兆特征信息数据,根据该组合数据与对应的疾病征兆特征信息数据建立第一数据集;获取该疾病征兆特征信息数据对应的疾病治疗方案,根据该疾病征兆特征信息数据与疾病治疗方案建立第二数据集;
10.分类模型建立模块,用于通过优化的knn算法对所述第一数据集进行分类,并建立分类模型;
11.第二数据获取模块,获取待检测尿液样本,提取待检测尿液样本中的特征信息,作为待检测特征信息;
12.认知模块,利用建立好的分类模型对所述待检测特征信息进行分类认知,并生成疾病认知报告。
13.在以上技术方案的基础上,优选的,所述分类模型建立模块还包括预处理模块,用于将所述第一数据集进行标准化、归一化,得到第一特征集合,对所述第一特征集合进行去重、合并,得到第二特征集合,采用分词软件ictclas第二特征集合进行处理,划分出描述特征点,作为待分类数据。
14.在以上技术方案的基础上,优选的,所述分类模型建立模块还包括模型构建模块,用于通过优化的knn算法对所述待分类数据进行聚类划分,建立knn分类模型。
15.在以上技术方案的基础上,优选的,所述优化的knn算法采用改进的粒子群算法进行优化,输入s个待分类数据作为测试样本,其中70%作为训练集,30%作为预测样本集,对预测样本集进行分类,利用粒子群优化方法的随机搜索能力在训练集中进行搜索,快速找到预测样本的k个近邻;
16.采用粒子群优化方法的具体步骤如下:
17.s1,采用随机方法初始化粒子群,计算出每个个体的适应值,根据适应值的大小得到初始化粒子群中的群体最优值和个体最优值;
18.s2,根据每个粒子自身的位置和速度对群体最优值和个体最优值进行更新;
19.s3,当群体最优值达到设定的阈值或者已经达到最大迭代次数,结束算法流程,否则,重新执行步骤s2。
20.进一步优选的,采用粒子群优化方法还包括:
21.步骤s1中,假设在一个d维空间中,一个群体共有n个粒子,记为x=(x1,x2,...,xn),所述采用随机方法初始化粒子群,包括初始化粒子群的位置xi=(x
i1
,x
i2
,...,x
id
)和速度vi=(v
i1
,v
i2
,...,v
id
)以及群体最优值和个体最优值,其中,x
id
表示粒子i的位置的第d维分量,v
id
表示粒子i的速度的第d维分量,i=1,2,...,n;
22.计算每个粒子当前位置的适应值f
id
=f(x
id
),根据所述适应值的大小,初始化个体最优值p
besti
=fi和群体最优值g
best
=min(f1,f2,...,fn),i=1,2,...,n;
23.步骤s2中,所述每个粒子自身的位置和速度的计算方法为:
[0024][0025][0026]
式中,v
id
为粒子的速度,x
id
为粒子的位置,k为当前迭代次数,w为惯性权重因子,c1和c2为非负的常数,称为加速度因子,r1和r2是分布于[0,1]之间的随机数,p
id
为个体最优值,p
gd
为整体最优值,i=1,2,...,n。
[0027]
进一步优选的,所述惯性权重w表达式为:
[0028][0029]
式中,w
max
为最大惯性权重,w
min
为最小惯性权重,time
max
为最大迭代次数,timei为当前迭代次数;
[0030]
在粒子群粒子自身的计算公式中加入动量项:其中,δv
id
表示粒子速度的改变量,k为当前迭代次数,w为惯性权重因子,α为约束因子;
[0031]
采用余弦函数控制惯性权重的变化:
[0032]
改进后的每个粒子自身的位置和速度的计算方法为:
[0033][0034][0035]
在以上技术方案的基础上,优选的,所述通过优化的knn对所述描述特征点进行聚类划分,还包括以下步骤:
[0036]
随机选择训练集中a[1]~a[k]个样本作为待预测样本y的k个初始最近邻节点;
[0037]
使用欧式距离与余弦相似度线性结合的方式来计算待预测样本y与每个初始k最近邻节点的距离,计算公式为:
[0038]
dist(y,a[i])=w1·
dist(y,a[i]) w2·
sim(y,a[i])
[0039]
其中,w1 w2=1;
[0040]
将计算出来的距离dist(y,a[i])按照升序方式排序,计算出现在dist(y,a[i])序列中的每条标签出现的次数,得到次数最高的类别作为待预测样本的预测分类。
[0041]
在以上技术方案的基础上,优选的,认知模块具体用于利用knn分类模型对所述待检测特征信息进行分类诊断,根据诊断结果在所述第二数据集中匹配对应的疾病解决方案,并生成认知报告。
[0042]
本发明的一种基于尿液颜色的疾病认知系统,相对于现有技术具有以下有益效果:
[0043]
(1)通过建立分类模型的方法对尿液颜色和透明度进行分类划分,能够快速地确认疾病征兆特征信息,从而找到对应的治疗方案,避免了传统的人工辨别尿液颜色与透明度的方法,提高了诊断过程中的效率,通过分类模型自动分类诊断,也提高了疾病认知的准确度;
[0044]
(2)采用优化后的knn算法建立分类模型,能够适用于数据量大、样本多的样本数据,且不易受小概率错误的影响,大大的提高了分类的精度;
[0045]
(3)通过粒子群算法优化knn算法,在训练集中进行全局随机搜索,可以快速找到预测样本的k个近邻,解决了因k值参数选取不准确得不到最优分类结果的问题,保证knn算法分类的准确性和稳定性;
[0046]
(4)对粒子群算法进行改进,采用增加动量项以及余弦函数的方法来自适应权重,较大的惯性权重有利于提高算法的全局搜索能力,较小的惯性权重有利于增加算法的局部搜索能力,因此采用自适应权重的方法来提高寻优的速度;
[0047]
(5)在knn算法的距离计算上,采用欧式距离与余弦相似性线性结合的方式来计算训练集样本与预测样本之间的距离,提高了距离测量的精度。
附图说明
[0048]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]
图1为本发明一种基于尿液颜色的疾病认知系统的结构图;
[0050]
图2为本发明一种基于尿液颜色的疾病认知系统中采用粒子群算法进行优化的步骤流程图;
具体实施方式
[0051]
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
[0052]
本实施例提供一种基于尿液颜色的疾病认知系统,如图1所示,其包括:第一数据获取模块10、数据集建立模块20、分类模型建立模块30、第二数据获取模块40、认知模块50;
[0053]
第一数据获取模块10,用于获取历史尿液样本,从中提取特征信息数据;
[0054]
所述历史尿液样本包括正常尿液样本和异常尿液样本,所述特征信息数据包括尿液透明度数据以及尿液具体颜色数据;
[0055]
尿液具体颜色包括淡黄色、浅麦秆色、深黄色、琥珀色、蜜黄色、蜂蜜色、褐黄色、无色、绿色、黄褐色、亮黄色、紫色、棕色、绿色、橙色、糖浆色、褐藻色、棕啤酒色、粉红色、棕褐色、黑褐色、蓝绿色、深茶色、酱油色、啤酒样色、黑色、蓝色、乳白色尿、血尿、白色黏液状尿等,其中,正常新鲜尿液一般呈为淡黄色,也包括淡黄色、浅麦秆色、深黄色、琥珀色、蜜黄色、蜂蜜色、褐黄色等几种,出现上述这几种颜色,同时尿液是清澈透明的,一般表明身体没有什么疾病或者异常状况;出现上述其他颜色,不管尿液清澈透明还是浑浊,表明身体状况出了问题。
[0056]
尿液的透明度一般包括两大类:即清澈透明和浑浊,尿液浑浊又包括不透明。尿液清澈透明不一定表明没有疾病,但是尿液浑浊一般表明身体健康有问题。一般情况下,尿液透明度又分4个等级,以浑浊度来表示,即清晰透明、轻微浑浊、浑浊、明显浑浊四个等级,其中,轻微浑浊表现为雾状,浑浊表现为云雾状。
[0057]
数据集建立模块20,用于对所述尿液具体颜色数据和尿液透明度数据进行归一化处理,并将该尿液具体颜色数据和尿液透明度数据进行组合,得到组合数据,根据组合数据获取对应的疾病征兆特征信息数据,根据该组合数据与对应的疾病征兆特征信息数据建立第一数据集;获取该疾病征兆特征信息数据对应的疾病治疗方案,根据该疾病征兆特征信息数据与疾病治疗方案建立第二数据集;
[0058]
比如,尿液为淡黄色、清晰透明,其组合数据表示身体非常健康;尿液为乳白色、浑浊、不透明,其组合数据常见于泌尿道疾病;如果乳白色尿液同时伴有排尿异常、发热、腰痛时,应怀疑是严重泌尿道感染,如肾盂肾炎、膀胱炎、尿道炎或肾结核等;尿液为深茶色、清澈透明,其组合数据常见于肝细胞性黄疸、阻塞性黄疸等。
[0059]
分类模型建立模块30,用于通过knn算法对所述第一数据集进行分类,并建立分类模型;
[0060]
第二数据获取模块40,获取待检测尿液样本,提取待检测尿液样本中的特征信息,
作为待检测特征信息;
[0061]
认知模块50,利用建立好的分类模型对所述待检测特征信息进行分类认知,并生成疾病认知报告。
[0062]
所述分类模型建立模块还包括预处理模块301,用于将所述第一数据集进行标准化、归一化,得到第一特征集合,对所述第一特征集合进行去重、合并,得到第二特征集合,采用分词软件ictclas第二特征集合进行处理,划分出描述特征点,作为待分类数据。
[0063]
可以理解的是对第二特征集合的得到的尿液具体颜色、尿液透明度特征描述信息通过软件ictclas进行分词处理,得到准确的用于概括尿液具体颜色和透明度的描述特征点,对这些描述特征点进行聚类,可以使多个类似的描述特征点聚类到一个词条中。
[0064]
所述分类模型建立模块还包括模型构建模块302,用于通过优化的knn算法对所述待分类数据进行聚类划分,建立knn分类模型。
[0065]
所述优化的knn算法采用改进的粒子群算法进行优化,输入s个待分类数据作为测试样本,其中70%作为训练集,30%作为预测样本集,对预测样本集进行分类,利用粒子群优化方法的随机搜索能力在训练集中进行搜索,快速找到预测样本的k个近邻;
[0066]
knn算法的重要步骤就是计算训练样本与测试样本之间的空间距离,选取距离最近的k个训练样本为测试样本的最近邻居,k个最近邻居再进行统计分类。影响knn算法分类准确度的主要有两个要素:一个要素是训练样本与测试样本之间的距离计算,不同的计算方法会得到不同k近邻结果,从而影响最终分类结果,第二个要素是k值的选取,k值选取过大,无关点会被考虑进行造成干扰,对分类结果产生偏差,k值选取过小,在统计近邻出现的种类次数的时候不容易区分开来,得不到最优的分类结果。因此,本实施例采用粒子群算法对knn算法中k近邻的选取进行优化,可以取得较高的分类准确率。
[0067]
如图2所示,采用粒子群优化方法的具体步骤如下:
[0068]
s1,采用随机方法初始化粒子群,计算出每个个体的适应值,根据适应值的大小得到初始化粒子群中的群体最优值和个体最优值;
[0069]
s2,根据每个粒子自身的位置和速度对群体最优值和个体最优值进行更新;
[0070]
s3,当群体最优值达到设定的阈值或者已经达到最大迭代次数,结束算法流程,否则,重新执行步骤s2。
[0071]
进一步优选的,采用粒子群优化方法还包括:
[0072]
步骤s1中,假设在一个d维空间中,一个群体共有n个粒子,记为x=(x1,x2,...,xn),所述采用随机方法初始化粒子群,包括初始化粒子群的位置xi=(x
i1
,x
i2
,...,x
id
)和速度vi=(v
i1
,v
i2
,...,v
id
)以及群体最优值和个体最优值,其中,x
id
表示粒子i的位置的第d维分量,v
id
表示粒子i的速度的第d维分量,i=1,2,...,n;
[0073]
计算每个粒子当前位置的适应值f
id
=f(x
id
),根据所述适应值的大小,初始化个体最优值p
besti
=fi和群体最优值g
best
=min(f1,f2,...,fn),i=1,2,...,n;
[0074]
步骤s2中,所述每个粒子自身的位置和速度的计算方法为:
[0075][0076]
[0077]
式中,v
id
为粒子的速度,x
id
为粒子的位置,k为当前迭代次数,w为惯性权重因子,c1和c2为非负的常数,称为加速度因子,r1和r2是分布于[0,1]之间的随机数,p
id
为个体最优值,p
gd
为整体最优值,i=1,2,...,n。
[0078]
所述惯性权重w表达式为:
[0079][0080]
式中,w
max
为最大惯性权重,w
min
为最小惯性权重,time
max
为最大迭代次数,timei为当前迭代次数;
[0081]
在粒子群粒子自身的计算公式中加入动量项:其中,δv
id
表示粒子速度的改变量,k为当前迭代次数,w为惯性权重因子,α为约束因子;
[0082]
采用余弦函数控制惯性权重的变化:
[0083]
改进后的每个粒子自身的位置和速度的计算方法为:
[0084][0085][0086]
在粒子群算法中,惯性权重是较为重要的一个参数,但同时它又是个可调整的参数,w较大有利于提高算法的全局搜索能力,w较小有利于增强算法的局部搜索能力,为了平衡粒子群算法中全局搜索能力和局部搜索能力,本实施例基于粒子群算法的原理,w应该随着搜索的进行不断减小,从而找出了w的变化规律,进而采用增加动量项以及余弦函数的方法来自适应权重。
[0087]
所述通过优化的knn对所述描述特征点进行聚类划分,还包括以下步骤:
[0088]
随机选择训练集中a[1]~a[k]个样本作为待预测样本y的k个初始最近邻节点;
[0089]
计算待预测样本y与每个初始k最近邻节点的距离,常见的距离计算方法有欧式距离、曼哈顿距离、切比雪夫距离、皮尔逊相关系数、余弦相似度等,欧式距离强调的是两个样本数据向量之间的绝对距离,对方向并不敏感,而余弦相似度强调的是两个特征向量之间方向上的差异,对数值并不敏感,因此,本实施例将欧式距离与余弦相似度线性结合的方式来计算待预测样本y与每个初始k最近邻节点的距离,并对欧式距离和余弦相似度赋予了一定的权重,其计算公式为:
[0090]
dist(y,a[i])=w1·
dist(y,a[i]) w2·
sim(y,a[i])
[0091]
其中,w1 w2=1;
[0092]
将计算出来的距离dist(y,a[i])按照升序方式排序,计算出现在dist(y,a[i])序列中的每条标签出现的次数,得到次数最高的类别作为待预测样本的预测分类。
[0093]
认知模块50具体用于利用knn分类模型对所述待检测特征信息进行分类诊断,根据诊断结果在所述第二数据集中匹配对应的疾病解决方案,并生成认知报告。
[0094]
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献