一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种医疗影像数据预处理的方法与流程

2022-07-30 20:52:05 来源:中国专利 TAG:


1.本发明涉及大数据应用、医疗云、隐私计算领域,尤其涉及一种医疗影像数据预处理的方法。


背景技术:

2.在医疗领域收集到的数据中,大部分的数据是无法直接利用并产生价值,因为收集的数据通常是不完整的(缺少某些感兴趣的属性值)、不一致的(包含代码或者名称的差异)、极易受到噪声(错误或异常值)的侵扰的。因为数据库太大,而且数据集经常来自多个异种数据源,低质量的数据将导致低质量的挖掘结果。就像一个大厨现在要做美味的蒸鱼,如果不将鱼进行去鳞等处理,一定做不成我们口中美味的鱼。
3.在医疗领域收集到的数据中,医疗影像数据这类型数据常见于pacs系统,意为影像归档和通信系统。它是应用在医院影像科室的系统,主要的任务就是把日常产生的各种医学影像(包括核磁,ct,超声,各种x光机,各种红外仪、显微仪等设备产生的图像)通过各种接口(模拟,dicom,网络)以数字化的方式海量保存起来。
4.图像分析中,图像质量的好坏直接影响识别算法的设计与效果的精度,因此在图像分析(特征提取、分割、匹配和识别等)前,需要进行预处理。


技术实现要素:

5.基于背景技术存在的技术问题,本发明提出了一种医疗影像数据预处理的方法。
6.本发明采用的技术方案是:
7.一种医疗影像数据预处理的方法,其特征在于,包括:
8.(1)数据预处理:对医疗数据进行数据清洗、数据集成、数据规约以及数据变换处理;
9.所述数据清洗处理具体是对医疗数据进行消除错误、冗余和数据噪音处理;
10.所述数据集成处理具体是将数据由多个数据源合并成一个一致的数据存储;
11.所述数据归处理具体是对发现任务和数据本身内容理解的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据模型,从而在尽可能保持数据原貌的前提下最大限度的精简数据量;
12.所述数据变换处理具体是找到数据的特征表示,用维变换或转换来减少有效变量的数目或找到数据的不变式,包括规格化、规约、切换和投影操作;
13.2)图像预处理:对医疗图像进行灰度化、几何变换、图像增强处理;
14.所述灰度化处理具体是在rgb模型中,采用分量法、最大值法、平均值法或加权平均法对彩色图像进行灰度化处理;
15.所述几何变化处理具体是通过平移、转置、镜像、旋转、缩放的几何变换方式对采集的图像进行处理,用于改正图像采集系统的系统误差和仪器位置的随机误差;然后再使用灰度插值算法进行计算;
16.所述图像增强处理具体是将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征。
17.进一步地,所述的一种医疗影像数据预处理的方法,其特征在于,所述灰度插值算法采用的方法为最近邻插值、双线性插值或双三次插值。
18.本发明的优点是:
19.本发明方法将数据进行预处理,得到标准化的数据后可以进行数据的共享、分析及交易等协同应用,是医疗数据价值真正得到体现的途径。
20.本发明方法将图像进行预处理,可以消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性、最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性。
附图说明
21.图1为本发明数据预处理的流程图。
22.图2为本发明图像预处理的流程图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
24.实施例。
25.一种医疗影像数据预处理的方法,包括:
26.(1)数据预处理:如图1所示,对医疗数据进行数据清洗、数据集成、数据规约以及数据变换处理;
27.数据清洗处理具体是对医疗数据进行消除错误、冗余和数据噪音处理;
28.数据集成处理具体是将数据由多个数据源合并成一个一致的数据存储,如数据仓库。该部分主要涉及数据的选择、数据的冲突问题以及不一致数据的处理问题。
29.数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域,已经有了很多成熟的框架可以利用。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。
30.数据归处理具体是对发现任务和数据本身内容理解的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据模型,从而在尽可能保持数据原貌的前提下最大限度的精简数据量,简单的说就是压缩数据。
31.数据规约主要有两个途径:属性选择和数据采样,分别针对原始数据集中的属性和记录。假定在公司的数据仓库选择了数据,用于分析。这样数据集将非常大。在海量数据上进行复杂的数据分析扣挖掘将需要很长时间,使得这种分析不现实或不可行。数据归约技术可以用来得到数据集的归约表示,它虽然小,但仍大致保持原数据的完整性。这样,在归约后的数据集上挖掘将更有效,并产生相同(或几乎相同)的分析结果。
32.数据变换处理具体是找到数据的特征表示,用维变换或转换来减少有效变量的数目或找到数据的不变式,包括规格化、规约、切换和投影操作,就是指把原始数据转换成为
适合数据挖掘的形式。
33.数据变换在对数据进行统计分析时,要求数据必须满足一定的条件,如在方差分析时,要求试验误差具有独立性、无偏性、方差齐性和正态性二但在实际分析中,独立性、无偏性比较容易满足,方差齐性在大多数情况下能满足。正态性有时不能满足。有时若将数据经过适当的转换,如平方根转换、对数转换、平方根反正弦转换,则可以使数据满足方差分析的要求。所进行的此种数据转换,称为数据变换。
34.2)图像预处理:如图2所示,对医疗图像进行灰度化、几何变换、图像增强处理;图像预处理,是将每一个文字图像分检出来交给识别模块识别,这一过程称为图像预处理。在图像分析中,对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。
35.灰度化处理具体是在rgb模型中,采用分量法、最大值法、平均值法或加权平均法对彩色图像进行灰度化处理;
36.几何变化处理具体是通过平移、转置、镜像、旋转、缩放的几何变换方式对采集的图像进行处理,用于改正图像采集系统的系统误差和仪器位置(成像角度、透视关系乃至镜头自身原因)的随机误差;然后再使用灰度插值算法进行计算;
37.所图像增强处理具体是将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果。
38.灰度插值算法采用的方法为最近邻插值、双线性插值或双三次插值。
39.该项目以云数据平台为承载,以隐私计算模块为核心,解决数量巨大、结构多样的医疗影像数据,同时满足数据共享中的安全和隐私需求。
40.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献