一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

存储系统及其数据写入方法

2022-04-30 13:05:17 来源:中国专利 TAG:


1.本发明涉及数据存储技术领域,尤其涉及存储系统及其数据写入方法。


背景技术:

2.raid(redundant array of inexpensive disk),即廉价冗余磁盘阵列,是目前存储系统常用的一种数据冗余备份技术。根据磁盘不同的组合方式,raid可以分为raid0、raid1、raid10、raid3、raid5、raid6等多种级别。
3.随着网络技术及信息处理技术的发展,存储系统含有的物理磁盘越来越多,raid6级别因为能够同时容忍两块磁盘损坏,兼顾性能与磁盘空间率的同时,还能更大限度的保护用户数据的可靠性,因而在存储设备中广泛采用。
4.其中存在问题是,采用raid6的存储系统会存在写惩罚以及非一致性数据更新的问题,尤其是在小数据写入以及磁盘故障导致存储系统降级时,raid6的写惩罚对数据写入性能影响尤其明显。


技术实现要素:

5.发明目的:本发明提供一种存储系统及其数据写入方法,通过在多个物理磁盘上设置多种raid级别,根据存储系统的存储空间状态和写入数据的长度,适应性的选择最适合的raid级别,旨在保持数据冗余的同时仍然能够提供高性能的数据写入。
6.技术方案:本发明提供一种存储系统的数据写入方法,包括:接收数据写入请求,根据写入请求对应的数据和存储系统的状态,选择数据存储的raid级别;所述存储系统的物理磁盘切分为多个存储块,根据raid级别对应的存储结构,来自不同物理磁盘的多个存储块配置为存储组,多个存储组配置为相应raid级别的raid存储组;根据数据存储的raid级别分配存储空间,并确定存储组的条带关系,将写入请求按照条带与存储块之间的映射关系拆分为多个子请求;执行子请求,完成数据写入。
7.具体的,所述存储系统配置的raid级别,包括raid0、raid1、raid5和raid6中的至少一个。
8.具体的,所述选择数据存储的raid级别,包括:若存储系统的状态是,没有配置冗余存储空间或冗余存储空间不足时,选择raid0级别;若存储系统的状态是单冗余存储空间,由数据长度决定的写入性能确定两副本raid1或raid5;若存储系统的状态是双冗余存储空间,由数据长度决定的写入性能确定三副本raid1或raid6;所述冗余存储空间指镜像副本存储空间或校验存储空间。
9.具体的,所述执行子请求,还包括:记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系。
10.具体的,所述存储系统的物理磁盘切分为多个存储大小相等的存储块。
11.具体的,还包括数据迁移,步骤包括:将数据从存储空间中进行读取,按照条带关系重新组织;将组织完成的数据按照相应的raid级别分配新的存储空间,进行数据写入,更
新数据写入的逻辑地址和存储空间的物理地址之间的对应关系,同时释放迁移前占用存储空间。
12.本发明还提供一种存储系统,包括:raid部署模块、数据写入模块和磁盘阵列,其中:所述raid部署模块,用于接收数据写入请求,根据写入请求对应的数据和存储系统的状态,选择数据存储的raid级别;所述数据写入模块,用于根据数据存储的raid级别分配存储空间,并确定存储组的条带关系,将写入请求按照条带与存储块之间的映射关系拆分为多个子请求;执行子请求,完成数据写入;所述磁盘阵列,物理磁盘切分为多个存储块,根据raid级别对应的存储结构,来自不同物理磁盘的多个存储块配置为存储组,多个存储组配置为相应raid级别的raid存储组。
13.具体的,所述raid部署模块,用于若存储系统的状态是,没有配置冗余存储空间或冗余存储空间不足时,选择raid0级别;若存储系统的状态是单冗余存储空间,由数据长度决定的写入性能确定两副本raid1或raid5;若存储系统的状态是双冗余存储空间,由数据长度决定的写入性能确定三副本raid1或raid6;所述冗余存储空间指镜像副本存储空间或校验存储空间。
14.具体的,包括空间管理模块,用于分配存储空间,记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系。
15.具体的,包括数据迁移模块,用于将数据从存储空间中进行读取,按照条带关系重新组织;将组织完成的数据按照相应的raid级别分配存储空间,进行数据写入;空间管理模块用于记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系,更新并释放空闲的存储空间。
16.有益效果:与现有技术相比,本发明具有如下显著优点:保持数据冗余的同时仍然能够提供高性能的数据写入。
附图说明
17.图1a是raid6大写方式原理图。
18.图1b是raid6小写方式原理图。
19.图2a是降级条带的大写方式原理图。
20.图2b是降级条带的小写方式原理图。
21.图3是本发明提供的存储系统的结构示意图。
22.图4是本发明提供的数据映射关系的示意图。
23.图5是本发明提供的数据迁移方法的示意图。
24.图6本发明提供的存储系统的硬件示意图。
具体实施方式
25.下面结合附图对本发明的技术方案作进一步说明。
26.在对本发明提供的方案详细说明之前,先对本发明涉及的相关术语、原理进行简单的说明。
27.条带:raid是由多块磁盘组成,条带技术将数据以块的方式分布存储在多个磁盘中,从而可以对数据进行并发处理。这样写入和读取数据就可以在多个磁盘上并发进行,从
而良好的扩展i/o性能。
28.raid0:是一种简单的、无数据冗余的数据条带化技术,将数据分散存储在所有的磁盘中,以独立访问的方式实现多块磁盘的并发读写,从而实现多倍的带宽性能,读写的速度是所有raid级别中最快的一种。但raido没有镜像、校验等冗余信息,所以无法提供数据保护的功能,一旦出现磁盘损坏,则会丢失所有数据。
29.镜像raid:镜像raid条带化技术是根据数据的副本数,将数据完全一致地写到多块磁盘上。镜像raid是通过牺牲一定的存储空间来实现数据的冗余。如果镜像副本数为2,其整体的空间利用率只有50%。虽然镜像raid的空间利用率低,但却提供了很好的数据保护。一块磁盘损坏,不会导致数据丢失,同时对数据的读写性能影响很小。
30.raid5和raid6:这两种raid级别是通过将同一个条带上的数据按照某种格式进行编码计算得到校验信息,然后将数据写入对应的数据盘,而校验信息则写入校验盘。raid5只有一块校验盘,能够容忍存储池损坏一块磁盘。而raid6则有两个校验盘,能够容忍同时损坏两块磁盘。一般情况下,在配置存储池时,将数据盘配置为2的幂次,如4 1,表示4块数据盘,1块校验盘的raid5存储池;而4 2,则表示4块数据盘,2块校验盘的raid6存储池。raid5和raid6在没有磁盘损坏时,读性能与raid0和raid1有一样的高带宽。但数据写入时,由于需要计算校验数据,因此写性能会受到比较大的影响。而如果raid5和raid6条带上存在故障磁盘时,则对数据的读写性能影响都很大。计算校验数据一般有大写和小写两种方式,为了说明不同的写入方式对性能的影响,下面结合附图对大写、小写以及存在故障磁盘时的读写原理作简单的介绍。
31.图1a为raid6的4 2条带大写方式的原理示意图;图1b为raid6的4 2小写方式的原理示意图。具体地,如图1a和图1b所示,当对条带d1写入新的数据时,为了计算条带新的校验值p和q,可以通过采用大写或者小写的方式实现,其中大写方式,需要先预读出d2、d3和d4的数据,然后根据raid6计算得到校验值p和q,可得到newp1=newd1^d2^d3^d4;newq1=k1*newd1^k2*d2^k3*d3^k4*d4。计算完成后,将newd1以及newp1和newq1写入条带,完成数据写入。小写方式,需要先预读出d1以及p和q的数据,然后根据raid6大写的等价等式可计算得到新的p和q,即newp1=newd1^d1^p1,new q1=k1*newd1^k1*d1^q1。
32.图2为raid6的4 2条带存在故障磁盘数据写入原理示意图,其中存在两种情况,图2a为新写入的数据正好落在故障盘上,在这种场景下,则只能采用大写方式;图2b为新写入的数据落在其他正常的磁盘上,在这种场景下,则只能采用小写方式实现。
33.根据所述raid6的原理可知,具有两块校验盘,因此能够同时容忍两块磁盘损坏,在兼顾性能与磁盘空间率的同时,还能更大限度的保护用户数据的可靠性。但无论是采用大写方式还是小写方式写入数据,都不可避免的需要先通过预读数据盘或者校验盘上的老数据,才能计算出新的校验数据,并且每一次写入新的数据都需要写入校验盘,这种额外增加的预读和写校验盘就是raid5和raid6的写惩罚。写惩罚的次数越多,对性能的影响就越大。另外,根据raid5或者raid6的数据写入方式可知,写入的数据将会分布在不同的磁盘上,一旦在写入过程某块磁盘出现写入错误,而其他磁盘写入成功,则整个条带的数据将被破坏,无法再通过p或者q计算出正确的数据,这就是非一致性更新的问题。
34.参阅图3,本发明提供一种存储系统的数据写入方法,包括:接收数据写入请求,根据写入请求对应的数据和存储系统的状态,选择数据存储的raid级别;所述存储系统的物
理磁盘切分为多个存储块,根据raid级别对应的存储结构,来自不同物理磁盘的多个存储块配置为存储组,多个存储组配置为相应raid级别的raid存储组;根据数据存储的raid级别分配存储空间,并确定存储组的条带关系,将写入请求按照条带与存储块之间的映射关系拆分为多个子请求;执行子请求,完成数据写入。
35.本发明实施例中,所述存储系统配置的raid级别,包括raid0、raid1、raid5和raid6中的至少一个。
36.在具体实施中,可以选择系统内的部分或全部存储资源创建一个存储池,为存储池配置数据冗余模式,例如可以配置为4 2模式,则表示存储系统同一个条带上双冗余,允许同时损坏两块磁盘。
37.本发明实施例中,所述存储系统的物理磁盘切分为多个存储大小相等的存储块。
38.在具体实施中,将存储池内的每个物理磁盘,按照固定的大小进行切分,将所有的物理磁盘都切分成大小相等的存储块(chunk)。所述的固定大小可以根据实际需要设定,不做特殊限定。所有物理磁盘切分的存储块被虚拟化成一个存储池,供后续的空间管理分配使用。
39.在具体实施中,根据冗余模式(冗余存储空间),部署不同raid级别的空间管理模块。例如配置为4 2冗余模式,则可以部署以下raid级别:raid0;两副本raid1;三副本raid1;raid5;raid6。其中raid0用于当整个存储系统处于无冗余磁盘的场景时的数据写入;两副本raid1和raid5用于当整个存储系统只有一块冗余磁盘的场景时的数据写入,更具体地,两副本raid1用于小块数据写入,而raid6用于大块数据写入。在实际实施的过程中,可以选择部署其中几种raid级别或全部raid级别,根据实际部署的raid级别,选择其中性能最高的一种来完成数据的写入。
40.在具体实施中,根据冗余模式,将来自不同磁盘上的存储块组成raid存储组(chunk raid groups)。以4 2冗余模式的raid6为例,即需要分别从6块不同的物理磁盘上选择一个存储块组成存储组(chunk group),以便数据能够落在6块不同的物理磁盘上,确保当两块磁盘故障时,仍然能够保证数据能够正常读取和恢复。多个存储组组成了该raid级别的raid存储组。
41.在具体实施中,raid存储组中的存储组进一步切分成更细粒度的小存储块(blocks),来自于同一个存储组不同存储块上的小存储块组成一个条带。
42.在具体实施中,一个或多个条带即是逻辑存储单元(lun)存储数据的基本单位。所述的lun是可以直接映射给主机实现数据读写的存储单元,在处理用户的读写请求以及进行数据迁移时,lun向存储系统申请空间、释放空间和数据迁移都以空间管理模块的条带为单位进行的。
43.参阅图4,列举部署三副本raid1和raid6两种的存储系统,逻辑存储单元lun接收主机数据写入请求,根据数据写入的长度和存储系统当前的状态,选择合适的空间管理模块分配存储空间,数据写入完成后记录lun的逻辑地址到物理地址的映射。空间管理模块从存储池的不同磁盘上获取存储块,根据raid级别组成存储组,并进一步切分为更细粒度的小存储块,分配给lun。空间管理模块管理空闲空间,并维护存储组到各物理磁盘存储块之间的映射关系。物理磁盘存储池负责将物理磁盘切分为存储块,分配和维护每个磁盘存储块空间的使用情况。
44.在具体实施中,接收来自主机的数据写入请求,写入请求中包含写入lun的起始逻辑地址lba以及需要写入的数据长度。由于空间管理分配和释放的最小单位为存储系统定义的小存储块,因此在分配空间之前,先检查主机写入请求是否b1ock对齐,如逻辑地址以及数据长度为非对齐,则需要在写入请求的头部和尾部进行预读补齐,确保写入数据的完整性。
45.本发明实施例中,若存储系统的状态是,没有配置冗余存储空间或冗余存储空间不足时,选择raid0级别;若存储系统的状态是单冗余存储空间,由数据长度决定的写入性能确定两副本raid1或raid5;若存储系统的状态是双冗余存储空间,由数据长度决定的写入性能确定三副本raid1或raid6;所述冗余存储空间指,镜像副本存储空间或校验存储空间。
46.在具体实施中,假设创建存储池配置为raid6的4 2冗余模式,并且部署所有raid级别来进行说明的。如果系统当前为无冗余状态,则直接从raid0空间管理模块分配存储空间;如果系统当前只有单冗余状态,则进一步根据写请求的数据长度确定是从两副本raid1还是从raid5(4 1)空间管理模块分配存储空间,具体判定条件为:如果写入数据的长度小于4个blocks,则从两副本raid1中分配存储空间,否则从raid5分配。以写入数据长度为1个block为例,在保证同等数据冗余条件下,根据两副本raid1和raid5的原理可知,两副本raid1需要写入次数为2,而raid5最少需要预读3块盘,写3块盘,因此写入放大是6,从raid1分配存储空间性能是最高的。其他分配存储空间的情况同理,根据存储池磁盘配置(2 2、4 2或8 2等)和写入的数据长度,计算得到写入放大,根据写入放大选择写入性能更高的raid级别,并分配相应的存储空间。
47.本发明实施例中,记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系。
48.在具体实施中,根据确定的空间管理模块raid级别以及分配的存储空间,确定条带关系,完成多副本的数据写入或者计算p和q校验码后,完成整个条带的数据写入。所述的空间管理模块,维护raid存储组与物理磁盘之间的映射关系,主机的写入请求按照条带与物理磁盘之间的映射关系拆分成不同的子请求,下发到各个物理磁盘。主机写入请求中的写入地址为逻辑地址lba,空间管理模块分配的存储空间为物理地址pba,lba和pba的大小都对齐到block大小。block的编址方式为,高8位用来表示所属的chunk raid group标识,低56位用来表示在该raid存储组内的偏移。
49.在具体实施中,所有拆分的子请求写入完成后,空间管理模块记录本次写入请求分配的存储空间和管理本模块内的空闲空间,逻辑卷lun层记录lba到pba之间的映射关系,完成本次的写入请求。
50.在具体实施中,raid存储组到物理磁盘之间的映射关系,物理磁盘空间的使用情况,空间管理模块的block分配使用情况以及逻辑卷lun层lba到pba之间的映射关系等存储系统的元数据,可以有独立的存储介质,无数据数据结构可以采用数据库或者其他自定义的数据类型。
51.由raid的实现原理可知,不同的raid级别,其有效存储空间有很大的差别,其中两副本raid1的有效存储空间只有总磁盘空间的50%,三副本raid1的有效存储空间只有总磁盘空间的33%。对于配置为4 2的raid6的存储系统来说,其有效的存储空间是总磁盘空间
的66%。因此为了在保证写入性能的同时,还能充分利用磁盘的存储空间。
52.本发明实施例中,还包括数据迁移,步骤包括:将数据从存储空间中进行读取,按照条带关系重新组织;将组织完成的数据按照相应的raid级别新的分配存储空间,进行数据写入,更新数据写入的逻辑地址和存储空间的物理地址之间的对应关系,同时释放迁移前占用存储空间。
53.在具体实施中,数据迁移模块可以实现将用户的数据从低空间利用率级别的raid迁移到高空间利用率级别的raid。参阅图5,该示意图以两副本raid1迁移到4 2的raid6为例,实际使用中,可以从raid0、三副本raid1或者raid5存储空间的迁移,实现冗余度的提升或者提升有效存储空间。
54.在具体实施中,数据迁移开始,从待迁移的raid存储组获取待迁移的block列表。所述的待迁移b1ock指的是含有有效用户数据的存储空间。将这些有效存储空间上的用户数据读取出来,并按照raid6的4 2的条带关系,重新组织用户数据。从raid6对应的空间管理模块分配一个满条带的存储空间,用重新组织好的用户数据计算条带的p和q校验码,完成一个整条带的数据写入。写入完成后,首先需要更新逻辑卷lun的数据映射关系,然后再更新raid6空间管理模块的空闲空间和释放两副本raid1占用的存储空间。
55.本发明还提供一种存储系统,包括:raid部署模块、数据写入模块和磁盘阵列,其中:
56.所述raid部署模块,用于接收数据写入请求,根据写入请求对应的数据和存储系统的状态,选择数据存储的raid级别;
57.所述数据写入模块,用于根据数据存储的raid级别分配存储空间,并确定存储组的条带关系,将写入请求按照条带与存储块之间的映射关系拆分为多个子请求;执行子请求,完成数据写入;
58.所述磁盘阵列,物理磁盘切分为多个存储块,根据raid级别对应的存储结构,来自不同物理磁盘的多个存储块配置为存储组,多个存储组配置为相应raid级别的raid存储组。
59.本发明实施例中,包括空间管理模块,用于分配存储空间,记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系。
60.本发明实施例中,包括数据迁移模块,用于将数据从存储空间中进行读取,按照条带关系重新组织;将组织完成的数据按照相应的raid级别分配存储空间,进行数据写入;空间管理模块用于记录数据写入的逻辑地址和存储空间的物理地址之间的对应关系,更新并释放空闲的存储空间。
61.本发明实施例中,所述raid部署模块,用于若存储系统的状态是,没有配置冗余存储空间或冗余存储空间不足时,选择raid0级别;若存储系统的状态是单冗余存储空间,由数据长度决定的写入性能确定raid1或raid5;若存储系统的状态是双冗余存储空间,选择raid6;所述冗余存储空间指镜像副本存储空间或校验存储空间。
62.本发明实施例中,所述raid部署模块,用于数据长度小于4个小存储块时,选择raid1;数据长度大于等于4个小存储块时,选择raid5;所述小存储块为存储系统支持的最小粒度的数据块,由存储组进行进一步的划分得到。
63.参阅图6,存储系统的硬件包含存储系统控制器和磁盘阵列,其中存储系统控制器
为双控制器架构,互为备份和负荷分担。磁盘阵列为包含若干物理磁盘的磁盘柜,与存储系统控制器之间通过系统总线相连。存储系统控制器10和存储系统控制器20,具有相同的结构和功能,两个控制器之间互为备份和负荷分担,可有效保证存储系统的安全和可靠性,保证存储系统的写操作性能。
64.所述的磁盘阵列30,包含若干物理磁盘,为存储系统提供实际的物理存储空间。可为各种不同的存储介质,甚至可以不同的存储介质混合搭配。存储系统基于该磁盘阵列创建存储池并部署相应的存储系统控制器。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献