一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种早期肺癌诊断的样本数据智能化处理方法及系统与流程

2021-11-05 23:57:00 来源:中国专利 TAG:


1.本发明涉及数据分析技术领域,尤其涉及一种早期肺癌诊断的样本数据智能化处理方法及系统。


背景技术:

2.肺癌是发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤之一。近50年来许多国家都报道肺癌的发病率和死亡率均明显增高,男性肺癌发病率和死亡率均占所有恶性肿瘤的第一位,女性发病率占第二位,死亡率占第二位。肺癌的病因至今尚不完全明确,大量资料表明,长期大量吸烟与肺癌的发生有非常密切的关系。已有的研究证明:长期大量吸烟者患肺癌的概率是不吸烟者的10~20倍,开始吸烟的年龄越小,患肺癌的几率越高。城市居民肺癌的发病率比农村高,这可能与城市大气污染和烟尘中含有致癌物质有关。肺癌的越早发现对于治疗越有利,如何加快诊断分析是胸外科研究的一个方向。通过加快肺癌早期的诊断分析可以有效提高诊断效果。


技术实现要素:

3.本发明的旨在至少解决上述技术缺陷之一,通过提供一种早期肺癌诊断的样本数据智能化处理方法及系统,用以解决现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。
4.为此,本发明第一个目的在于提出一种早期肺癌诊断的样本数据智能化处理方法,所述方法包括:获得实验数据要求;根据所述实验数据要求,构建诊断样本数据库;获得第一实验参数;基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;根据所述第一实验数据集,获得第一函数关系;将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;根据所述第一数据代价函数,获得第一系数;将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。
5.本发明第二个目的在于提供一种早期肺癌诊断的样本数据智能化处理系统,所述系统包括:
6.第一获得单元,所述第一获得单元用于获得实验数据要求;
7.第一构建单元,所述第一构建单元用于根据所述实验数据要求,构建诊断样本数据库;
8.第二获得单元,所述第二获得单元用于获得第一实验参数;
9.第三获得单元,所述第三获得单元用于基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;
10.第四获得单元,所述第四获得单元用于根据所述第一实验数据集,获得第一函数关系;
11.第五获得单元,所述第五获得单元用于将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;
12.第六获得单元,所述第六获得单元用于根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;
13.第七获得单元,所述第七获得单元用于根据所述第一数据代价函数,获得第一系数;
14.第八获得单元,所述第八获得单元用于将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;
15.第九获得单元,所述第九获得单元用于根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。
16.本发明第三个目的在于提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
17.本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
18.本发明实施例提供的一种早期肺癌诊断的样本数据智能化处理方法及系统,通过获得实验数据要求;根据所述实验数据要求,构建诊断样本数据库;获得第一实验参数;基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;根据所述第一实验数据集,获得第一函数关系;将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;根据所述第一数据代价函数,获得第一系数;将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。达到了对样本数据进行分类和智能化的处理,既能分类管理又进行整体处理,保证评判指标、样本数据的准确分类和有效性,进而保证肺癌诊断的实验结果可信度的技术效果。从而解决了现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。
19.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
20.图1为本技术实施例一种早期肺癌诊断的样本数据智能化处理方法的流程示意图;
21.图2为本技术实施例中另一种早期肺癌诊断的样本数据智能化处理方法的流程示意图;
22.图3为本技术实施例中另一种早期肺癌诊断的样本数据智能化处理方法的流程示意图;
23.图4为本技术实施例中另一种早期肺癌诊断的样本数据智能化处理方法的流程示意图;
24.图5为本技术实施例一种早期肺癌诊断的样本数据智能化处理系统的结构示意
图;
25.图6为本技术实施例示例性电子设备的结构示意图。
26.附图标记说明:第一获得单元11,第一构建单元12,第二获得单元13,第三获得单元14,第四获得单元15,第五获得单元16,第六获得单元17,第七获得单元18,第八获得单元19,第九获得单元20,总线300,接收器301,处理器302,发送器303,存储器304,总线接口305。
具体实施方式
27.下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
28.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
29.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
30.下面参考附图描述根据本发明实施例的一种早期肺癌诊断的样本数据智能化处理方法。
31.本技术的技术方案为:获得实验数据要求;根据所述实验数据要求,构建诊断样本数据库;获得第一实验参数;基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;根据所述第一实验数据集,获得第一函数关系;将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;根据所述第一数据代价函数,获得第一系数;将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。解决了现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。达到了对样本数据进行分类和智能化的处理,既能分类管理又进行整体处理,保证评判指标、样本数据的准确分类和有效性,进而保证肺癌诊断的实验结果可信度的技术效果。
32.实施例一
33.如图1所示,本技术实施例提供了一种早期肺癌诊断的样本数据智能化处理方法,所述方法包括:
34.步骤s100获得实验数据要求;
35.具体而言,实验数据要求为根据实验的分析内容进行设定的,包括那些内容,如肺
癌早期的诊断病例信息、某一个地区的历史病例、诊断数据、病程发展数据、治疗过程数据等等,需要对那些数据进行分析即对应给出数据要求,实验数据要求为大范围的要求,进行数据的整体查找,确保数据的全面性。
36.步骤s200根据所述实验数据要求,构建诊断样本数据库;
37.进一步,如图2所示,所述根据所述实验数据要求,构建诊断样本数据库,包括:根据所述实验数据要求,获得样本特征信息;根据所述样本特征信息,通过大数据获得样本数据集合;根据所述样本数据集合,获得第一参数信息,并将所述第一参数信息作为主库分类特征,构建主库;根据所述第一参数信息,获得第二参数信息,所述第二参数信息为所述第一参数信息的细化信息,并将所述第二参数信息作为子库分类特征,构建子库;根据所述主库、所述子库,构建所述诊断样本数据库。其中,所述主库与所述子库相关联,其中,所述第一参数信息包括多个参数,且各参数相互映射,所述第二参数信息包括多个参数,各参数相互映射。
38.具体而言,根据实验数据要求进行样本数据的搜集,得到对应的诊断样本数据库。为了方便进行数据库的管理,本技术实施例进行数据库构建时使用关系数据库,包括多个数据库,数据库之间建立映射关系,可以通过一个数据进行相关数据的提取,确保数据的全面性和完整性,同时也可以进行数据的过程分析,由于肺癌初期的诊断要牵扯到很多参数,为了确保分析数据不断章取义,通过一个案例为单位将各参数进行连接,能够实现病例数据的完整提取,同时还可以进行分类型管理,实现诊断样本数据库的智能化管理过程,完善数据库的管理。第一参数信息为常用参数,如用户姓名、症状、检查数据、诊断结果。第一参数信息中还包括细化参数信息,该细化参数信息为第二参数信息,将第二参数信息设定为子库,第一参数信息设定主库,其中主库、子库之间通过用户的身份证号码或者其他唯一的身份识别码进行映射连接,从而实现主库与子库的关联关系。利用第一参数信息构建主库,每个主库下面对应了子库,子库为其对应的细化参数信息即第二参数信息,这样实现了每个数据的分类管理,同时建立了连接,可以进行案例整体参数信息的提取,达到了既能分类进行数据管理又可以进行整体信息快速查找,确保数据库的有效管理,保证数据库中案例数据的完整性的技术效果。
39.步骤s300获得第一实验参数;
40.步骤s400基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;
41.具体而言,第一实验参数为当前实验要分析的参数,如要分析检查指标a和诊断结果b之间的关系时,第一实验参数为指标a及诊断结果b,根据第一实验参数的特征在诊断样本数据库中进行参数查找,获得第一实验数据集,第一实验数据集为诊断样本数据库中所有第一实验参数的数据集合。
42.步骤s500根据所述第一实验数据集,获得第一函数关系;
43.具体而言,根据第一实验数据集中第一实验参数的关系拟合第一函数关系。为a b(x
i
),从而得到第一实验参数之间的关系。若第一实验参数包含多个参数时,通过构建多元函数关系进行构建。
44.步骤s600将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;
45.步骤s700根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;
46.步骤s800根据所述第一数据代价函数,获得第一系数;
47.进一步,所述根据所述第一数据代价函数,获得第一系数,包括:根据公式获得代价集合,其中,a、b为系数,x为实验数据中参数,y为实验数据中结果;根据所述代价集合,获得第一代价值,所述第一代价值为最小值;根据所述第一代价值,获得所述第一系数。
48.具体而言,为了提高数据分析的准确性,本技术实施例利用代价函数对函数关系进行优化,利用第一函数关系得到的计算结果与实际诊断结果进行比较,得到所有数据的差值,将所有数据的差值求和然后计算平均误差,误差值越小则拟合的函数越准确,所以要得到代价函数的最小代价值,对应的系数则为优选结果。
49.步骤s900将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;
50.步骤s1000根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。
51.具体而言,将最优第一系数带入第一函数关系中,这样得到的拟合函数关系最准确,第一参数诊断关系即得到的经过代价函数优化的函数关系,将第一实验参数相对应的数据输入第一参数诊断关系中,得到其中的分析结果,即当利用第一实验参数相对应的数值进行肺癌早期诊断关系分析时,将该数据输入第一参数诊断关系中,得到对应的参数预测结果即第一参数诊断结果。实现了利用样本数据进行预测分析的技术效果。解决了现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。达到了对样本数据进行分类和智能化的处理,既能分类管理又进行整体处理,保证评判指标、样本数据的准确分类和有效性,进而保证肺癌诊断的实验结果可信度的技术效果。
52.进一步,如图3所示,所述方法还包括:获得第一用户信息;根据所述第一用户信息,获得第一用户检查信息集;根据所述第一用户检查信息集,获得数据类型;根据所述数据类型对所述第一用户检查信息集进行分类,获得第一用户数据分类集;依次判断所述第一用户数据分类集中各分类的数量是否达到预设条件;当达到时,对所述第一用户数据分类中的数据进行置信区间分析,获得数据置信区间;根据所述数据置信息区间、所述第一用户数据分类中的数据,获得置信区间数据集合;根据所述置信区间数据集合,获得区间预估值,并将所述区间预估值作为所述第一用户的分析数据。
53.具体而言,在对用户进行个体分析时,当用户存在大量的历史检查数据时,即第一用户检查信息集中包括数据量较大时,数据有重复性和时间性时,为了从大量历史数据中筛查有用的数据,从而提高对于用户的诊断分析结果,对第一用户的检查信息集中的数据作用分析样本,按照检查项目对数据进行分类,数据类型即用于表示检查信息的数据内容的,将同一类型的数据进行整合,分类处理,从每一类数据中进行筛选,找到其中可靠数据作为分析数据,如何进行筛选呢,本技术实施例利用置信区间分析,提高数据的准确性。置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的
测量值的可信程度,即前面所要求的“一个概率”。对第一偏差集中偏差值进行置信区间分析,置信区间越长则概率愈大,估值也就越准确,若计算得到的置信区间长度即其数值信息满足设定的一定数量要求时,则表明该置信区间合理,进行估值计算得到的数值较为可靠,此时选取的偏差值进行估值计算,提高运算速度。利用确定的置信区间进行第一用户样本数据的筛选,置信区间数据集合即为筛选得到的检查数据,利用置信区间中的检查数据进行区间估计,得到对应的估计值,该值作为各类型的数据的代表,每一个类型的数据依次进行分析,得到第一用户的分析数据,利用分析数据进行肺癌早期的诊断,减少了运算量同时提高了分析结果的可靠性。进一步解决了现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。
54.进一步的,所述根据所述第一用户检查信息集,获得数据类型,包括:获得预设时间要求;根据所述预设时间要求对所述第一用户检查信息集进行筛选,获得第二检查信息;根据所述第一用户检查信息集,获得检查机构信息;根据所述检查机构信息,获得机构历史诊断记录;根据所述机构历史诊断记录,获得机构评估值;根据所述机构评估值对所述第二检查信息进行筛选,获得第三检查信息;根据所述第三检查信息,获得所述数据类型。
55.具体而言,为了进一步提高样本的准确性,保证分析诊断结果的可靠性,对样本进行筛选,预设时间要求为对样本的采集时效性进行筛选,根据参数指标的特性进行预设时间的设定,如有些指标时间长了就没有参考性了,如体液检查,这些时间较短,则预设时间就越短,若有些指标历史数据具有参考性,则预设时间就越长,以确保样本数据都是有效数据,避免影响诊断结果。再通过机构的历史检查情况进行评估,如有些小机构的检查数据不可靠,做假数据的情况,这些机构的数据进行筛除,进一步提高数据的可靠性,对筛选得到的可靠数据进行进一步分析,分析数据类型进一步进行后续的步骤分析,进行诊断预测,从而确保样本的可靠性和诊断实验结果的可信度。
56.进一步,如图4所示,所述方法还包括:根据所述诊断样本数据库,获得用户特征信息,并作为一级分类要求;根据所述诊断样本数据库,获得数据指标信息,并作为二级分类要求;根据所述诊断样本数据库,获得症状特征信息,并将所述症状特征信息作为三级分类要求;根据所述一级分类要求、所述二级分类要求以及所述三级分类要求,基于所述诊断样本数据库构建数据分析决策树;将所述第一用户信息、所述第一用户检查信息集输入所述数据分析决策树中,获得第一分析诊断信息。
57.具体而言,利用用户的特征信息与诊断样本数据库中的信息进行匹配分析,可以得到对应的诊断结果分析,主要将用户的特征不断细化,与每一层级的特征依次进行诊断样本数据库的比对分析,分层越多则匹配的结果越准确,本技术实施例进行了三层的描述还可以进行四层甚至更多层的分析,这样得到的诊断结果就更贴合用户的实际情况。首先按照用户特征信息进行分类,特征信息包括年龄、地区、身体状态等级方面,可以进行对应条件的筛选和设定,第二层级为指标数据,即检查的指标数据范围相同,第三层级为症状,根据不断的分级得到的数据则与第一用户的情况越贴合,这样得到的分析结果也越贴合用户的诊断结果。这样将第一用户的对应数值输入到构建的数据分析决策树中,得到分析用户的第一分析诊断信息,即对用户的数值进行肺癌早期预测诊断的结果,为进一步的诊断提供有利支撑和帮助。
58.进一步,所述方法包括:对所述一级分类要求进行信息论编码运算,获得第一特征
信息熵,对所述二级分类要求进行信息论编码运算,获得第二特征信息熵,对所述三级分类要求进行信息论编码运算,获得第三特征信息熵;将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;基于所述第一根节点特征信息和所述诊断样本数据库的递归算法,构建所述数据分析决策树。
59.具体而言,为了具体构建所述数据分析决策树,可分别对所述一级分类要求、所述二级分类要求以及所述三级分类要求进行信息熵的运算,即通过信息论编码中的香农公式对其进行信息熵数值的具体计算,进而获得对应的所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵,进一步,信息熵表示信息的不确定度,当不确定性越大时,它所包含的信息量也就越大,信息熵也就越高,纯度也就越低,当集合中的所有样本均匀混合时,信息熵最大,纯度最低。因此,应基于所述数据大小比对模型对所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵对其大小数值的比对,继而获得熵值最小的特征,即第一根节点特征信息,通过对熵值最小的特征进行优先分类,继而按照熵值由小到大的顺序,依次对各特征进行分类,最终构建所述数据分析决策树,使得每个用户特征都匹配到准确可靠的诊断结果分析,进而实现了对数据分析决策树的具体构建。
60.实施例二
61.基于与前述实施例中一种早期肺癌诊断的样本数据智能化处理方法同样发明构思,本发明还提供了一种早期肺癌诊断的样本数据智能化处理系统,如图5所示,所述系统包括:
62.第一获得单元11,所述第一获得单元11用于获得实验数据要求;
63.第一构建单元12,所述第一构建单元12用于根据所述实验数据要求,构建诊断样本数据库;
64.第二获得单元13,所述第二获得单元13用于获得第一实验参数;
65.第三获得单元14,所述第三获得单元14用于基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;
66.第四获得单元15,所述第四获得单元15用于根据所述第一实验数据集,获得第一函数关系;
67.第五获得单元16,所述第五获得单元16用于将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;
68.第六获得单元17,所述第六获得单元17用于根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;
69.第七获得单元18,所述第七获得单元18用于根据所述第一数据代价函数,获得第一系数;
70.第八获得单元19,所述第八获得单元19用于将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;
71.第九获得单元20,所述第九获得单元20用于根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。
72.进一步,所述系统还包括:
73.第十获得单元,所述第十获得单元用于根据所述实验数据要求,获得样本特征信
息;
74.第十一获得单元,所述第十一获得单元用于根据所述样本特征信息,通过大数据获得样本数据集合;
75.第二构建单元,所述第二构建单元用于根据所述样本数据集合,获得第一参数信息,并将所述第一参数信息作为主库分类特征,构建主库;
76.第三构建单元,所述第三构建单元用于根据所述第一参数信息,获得第二参数信息,所述第二参数信息为所述第一参数信息的细化信息,并将所述第二参数信息作为子库分类特征,构建子库;
77.第四构建单元,所述第四构建单元用于根据所述主库、所述子库,构建所述诊断样本数据库。
78.其中,所述主库与所述子库相关联,其中,所述第一参数信息包括多个参数,且各参数相互映射,所述第二参数信息包括多个参数,各参数相互映射。
79.进一步,所述系统还包括:
80.第十二获得单元,所述第十二获得单元用于获得第一用户信息;
81.第十三获得单元,所述第十三获得单元用于根据所述第一用户信息,获得第一用户检查信息集;
82.第十四获得单元,所述第十四获得单元用于根据所述第一用户检查信息集,获得数据类型;
83.第十五获得单元,所述第十五获得单元用于根据所述数据类型对所述第一用户检查信息集进行分类,获得第一用户数据分类集;
84.第一判断单元,所述第一判断单元用于依次判断所述第一用户数据分类集中各分类的数量是否达到预设条件;
85.第十六获得单元,所述第十六获得单元用于当达到时,对所述第一用户数据分类中的数据进行置信区间分析,获得数据置信区间;
86.第十七获得单元,所述第十七获得单元用于根据所述数据置信息区间、所述第一用户数据分类中的数据,获得置信区间数据集合;
87.第十八获得单元,所述第十八获得单元用于根据所述置信区间数据集合,获得区间预估值,并将所述区间预估值作为所述第一用户的分析数据。
88.进一步,所述系统还包括:
89.第十九获得单元,所述第十九获得单元用于获得预设时间要求;
90.第二十获得单元,所述第二十获得单元用于根据所述预设时间要求对所述第一用户检查信息集进行筛选,获得第二检查信息;
91.第二十一获得单元,所述第二十一获得单元用于根据所述第一用户检查信息集,获得检查机构信息;
92.第二十二获得单元,所述第二十二获得单元用于根据所述检查机构信息,获得机构历史诊断记录;
93.第二十三获得单元,所述第二十三获得单元用于根据所述机构历史诊断记录,获得机构评估值;
94.第二十四获得单元,所述第二十四获得单元用于根据所述机构评估值对所述第二
检查信息进行筛选,获得第三检查信息;
95.第二十五获得单元,所述第二十五获得单元用于根据所述第三检查信息,获得所述数据类型。
96.进一步,所述系统还包括:
97.第一执行单元,所述第一执行单元用于根据所述诊断样本数据库,获得用户特征信息,并作为一级分类要求;
98.第二执行单元,所述第二执行单元用于根据所述诊断样本数据库,获得数据指标信息,并作为二级分类要求;
99.第三执行单元,所述第三执行单元用于根据所述诊断样本数据库,获得症状特征信息,并将所述症状特征信息作为三级分类要求;
100.第五构建单元,所述第五构建单元用于根据所述一级分类要求、所述二级分类要求以及所述三级分类要求,基于所述诊断样本数据库构建数据分析决策树;
101.第二十六获得单元,所述第二十六获得单元用于将所述第一用户信息、所述第一用户检查信息集输入所述数据分析决策树中,获得第一分析诊断信息。
102.进一步,所述系统还包括:
103.第二十七获得单元,所述第二十七获得单元用于对所述一级分类要求进行信息论编码运算,获得第一特征信息熵,对所述二级分类要求进行信息论编码运算,获得第二特征信息熵,对所述三级分类要求进行信息论编码运算,获得第三特征信息熵;
104.第二十八获得单元,所述第二十八获得单元用于将所述第一特征信息熵、所述第二特征信息熵以及所述第三特征信息熵输入数据大小比对模型进行训练,获得第一根节点特征信息;
105.第六构建单元,所述第六构建单元用于基于所述第一根节点特征信息和所述诊断样本数据库的递归算法,构建所述数据分析决策树。
106.进一步,所述系统还包括:
107.第二十九获得单元,所述第二十九获得单元用于根据公式第二十九获得单元,所述第二十九获得单元用于根据公式获得代价集合,其中,a、b为系数,x为实验数据中参数,y为实验数据中结果;
108.第三十获得单元,所述第三十获得单元用于根据所述代价集合,获得第一代价值,所述第一代价值为最小值;
109.第三十一获得单元,所述第三十一获得单元用于根据所述第一代价值,获得所述第一系数。
110.前述图1实施例一中的一种早期肺癌诊断的样本数据智能化处理方法的各种变化方式和具体实例同样适用于本实施例的一种早期肺癌诊断的样本数据智能化处理系统,通过前述对一种早期肺癌诊断的样本数据智能化处理方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种早期肺癌诊断的样本数据智能化处理系统的实施方法,所以为了说明书的简洁,在此不再详述。
111.示例性电子设备
112.下面参考图6来描述本技术实施例的电子设备。
113.图6图示了根据本技术实施例的电子设备的结构示意图。
114.基于与前述实施例中一种早期肺癌诊断的样本数据智能化处理方法的发明构思,本发明还提供一种计算机设备,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种早期肺癌诊断的样本数据智能化处理方法的任一方法的步骤。
115.其中,在图6中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口305在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。
116.处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
117.本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
118.本发明实施例提供的一种早期肺癌诊断的样本数据智能化处理方法及系统,通过获得实验数据要求;根据所述实验数据要求,构建诊断样本数据库;获得第一实验参数;基于所述第一实验参数,通过所述诊断样本数据库获得第一实验数据集;根据所述第一实验数据集,获得第一函数关系;将所述第一实验数据集依次输入所述第一函数关系,获得第一计算结果;根据所述第一计算结果、所述第一实验数据集,获得第一数据代价函数;根据所述第一数据代价函数,获得第一系数;将所述第一系数代入所述第一函数关系中,获得第一参数诊断关系;根据所述第一实验参数、所述第一参数诊断关系,获得第一参数诊断结果。达到了对样本数据进行分类和智能化的处理,既能分类管理又进行整体处理,保证评判指标、样本数据的准确分类和有效性,进而保证肺癌诊断的实验结果可信度的技术效果。从而解决了现有技术中肺癌早期诊断样本数据繁杂,样本数据的可靠性会影响到实验结果可靠性,降低实验效果的技术问题。
119.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
120.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品
存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
121.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献