一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

管理针对临时操作条件的块引退的制作方法

2021-04-23 09:35:00 来源:中国专利 TAG:引退 子系统 存储器 临时 条件


1.本公开的实施例大体上涉及存储器子系统,且更具体来说,涉及管理针对临时操作条件的块引退。


背景技术:

2.存储器子系统可包含存储数据的一或多个存储器组件。存储器组件可以是例如非易失性存储器组件和易失性存储器组件。一般来说,主机系统可利用存储器子系统以在存储器组件处存储数据且从存储器组件检索数据。


技术实现要素:

3.根据本申请案的方面,提供一种系统。所述系统包括:存储器组件;和处理装置,其以可操作方式与所述存储器组件耦合以进行以下操作:检测所述存储器组件的块中的数据丢失发生;识别与所述存储器组件的所述块中的所述数据丢失发生相关联的行为准则;响应于所述行为准则的发生而使与所述块相关联的计数器递增,其中所述计数器的值对应于与所述块中的数据丢失发生相关联的多个行为准则的发生的数目;和响应于确定所述计数器的所述值满足第一阈值准则:将所述块指定为被隔离块,执行对所述块的多个应力测试中的应力测试,和响应于所述块未通过第一应力测试,引退所述存储器组件的所述块。
4.根据本申请案的另一方面,提供一种方法。所述方法包括:通过处理装置检测存储器组件的块中的数据丢失发生;识别与所述存储器组件的所述块中的所述数据丢失发生相关联的行为准则;响应于所述行为准则的发生而使与所述块相关联的计数器递增,其中所述计数器的值对应于与所述块中的数据丢失发生相关联的多个行为准则的发生的数目;和响应于确定所述计数器的所述值满足第一阈值准则:将所述块指定为被隔离块,对所述块执行多个应力测试中的应力测试,和响应于所述块未通过第一应力测试,引退所述存储器组件的所述块。
5.根据本申请案的又一方面,提供一种非暂时性计算机可读存储媒体。所述非暂时性计算机可读存储媒体包括在由处理装置执行时使所述处理装置进行以下操作的指令:识别与存储器组件的块中的数据丢失发生相关联的操作条件;和响应于所述操作条件满足行为准则:将所述块指定为被隔离块,执行对所述块的多个应力测试中的应力测试,和响应于所述块未通过第一应力测试,引退所述存储器组件的所述块。
附图说明
6.根据下文给出的详细描述和本公开的各种实施例的附图,将更充分地理解本公开。
7.图1说明根据本公开的一些实施例的包含存储器子系统的实例计算环境。
8.图2是说明根据本公开的一些实施例的块在给定时间点可占用的各种状态的示意性序列图。
9.图3是根据本公开的一些实施例的用于管理针对临时操作条件的块引退的实例方法的流程图。
10.图4是根据本公开的一些实施例的用于在引退块之前将致使数据丢失的块添加到观察名单的实例方法的流程图。
11.图5是根据本公开的一些实施例的用于在引退块之前将致使数据丢失的块添加到隔离队列的实例方法的流程图。
12.图6是其中可操作本公开的实施例的实例计算机系统的框图。
具体实施方式
13.本公开的方面针对于用于管理针对存储器子系统中的临时操作条件的块引退的系统和方法。存储器子系统可为存储装置、存储器模块,或存储装置和存储器模块的混合。结合图1描述存储装置和存储器模块的实例。一般来说,主机系统可利用包含一或多个存储器组件(例如,存储数据的存储器装置)的存储器子系统。主机系统可提供数据以存储于存储器子系统处并且可请求从存储器子系统检索数据。
14.存储器装置可为非易失性存储器装置。非易失性存储器装置是一或多个裸片的封装。每一裸片可由一或多个平面组成。平面可分组成逻辑单元(lun)。对于一些类型的非易失性存储器装置(例如,nand装置),每一平面由物理块集合组成。每一块由页集合组成。每一页由存储数据位的存储器单元集合组成。存储器子系统预期在被设计成允许在存储器子系统处恰当存储和检索主机数据的某些规范内操作。当存储器子系统在设计规范之外操作时,某些块可返回呈数据丢失形式的错误。当先前写入的数据位到块的读取操作失败且后续系统层级错误处置流未能恢复数据时,可发生块的数据丢失。在一个实例中,当顾客(例如在测试存储器子系统时)违反存储器子系统的设计规范时,存储器子系统可经历数据丢失。举例来说,存储器子系统可在违反设计规范的操作温度下操作,这可能致使发生交叉温度失效。当在具有广泛变化的温度的环境中操作存储器子系统以使得存储器单元在第一温度下经编程且稍后在显著不同的温度下被读取时,可发生交叉温度失效。在另一实例中,当存储器子系统存储于异常断电存储温度下达延长的时间段(例如,当可允许的断电存储温度是30摄氏度时,存储器驱动器在55摄氏度下存储数月)时,可发生设计规范违反。
15.因为无法通过错误处置机构恢复由设计规范违反导致的数据丢失,所以存储器子系统可引退遭受数据丢失的块,原因是推测数据丢失是有缺陷块的指示。“被引退块”是指永久地标记为不可用的块,使得其在块的寿命内无法供存储器子系统用于存储主机数据。因此,当存储器组件本身在其它方面健康并且无缺陷时,归因于临时操作条件而像当存储器子系统在违反设计规范的条件下操作时的情况那样引退块可能并非所要的。因此,块引退机构需要并入有减缓过程,使得归因于临时异常操作条件的数据丢失不会引起健康块引退。
16.常规地,管理块引退的常见惯例包含执行系统级错误处置程序以尝试在引退块之前恢复数据丢失。举例来说,如果错误处置程序能够恢复块中的数据丢失,那么块可不被标记为需引退。如果另一方面,错误处置程序不能够恢复数据丢失,那么块可被标记为需引退。虽然在一些情况下,使用错误处置程序可减缓块引退,但错误处置程序可能仍无法恢复由临时操作条件所导致的数据丢失,因此可能即使当块本身并非固有缺陷时仍无法减缓归
因于临时操作条件的块引退。举例来说,当存储器子系统在违反设计规范的交叉温度下操作时,存储器子系统的块可经历触发错误处置程序的数据丢失。在尝试恢复数据丢失时,错误处置程序可能无法辨识当前异常的交叉温度是临时的,因此,如果错误处置程序未能恢复数据丢失,那么所述块可被标记为引退。在此情况下引退块可能并非所要的,这是因为所述块当在遵守设计规范的正常交叉温度下操作时可正确地执行。因此,可偏好用于管理块引退的不同技术以改进性能并且减少数据丢失,同时确保不会过早引退健康块。
17.本公开的方面通过实施用于管理针对临时操作条件的块引退的系统和方法来解决上述和其它缺陷。存储器子系统最初可检测块中的无法通过系统级错误处置程序恢复的数据丢失发生。存储器子系统接着可识别致使块中的数据丢失发生的行为准则。在某些实施方案中,所述行为准则可为数个失效机制中的一个是否满足预定阈值准则。失效机制可包含与块的交叉温度、编程/擦除循环(在下文为p/e循环)、读取干扰或其组合相关的异常操作条件。管理临时操作条件下的块引退可确保当违反设计规范时,驱动器仍保持起作用。其可进一步保护以免受归因于客户的偶然使用异常引起的写入保护影响。当存储器子系统在只读条件操作时归因于不可校正错误而发生写入保护状态。在无法恰当管理块引退事件的情况下,存储器子系统进入写入保护状态的几率可增加写入保护状态。此外,管理临时操作条件下的块引退也可防止免受可触发不必要的块引退事件的微小固件漏洞(bug)。
18.在某些实施方案中,一旦已识别到行为准则,存储器子系统可将所述块添加到观察名单,使得可监测所述块的另外的数据丢失事件。在一个实例中,响应于行为准则的发生,可通过使与所述块相关联的观察名单计数器递增将所述块添加到观察名单。当在观察名单中时,可在使所述存储器块继续可供存储器子系统用于存储主机数据的同时,监测所述存储器块的异常行为(例如另外的数据丢失事件)。举例来说,每当归因于与所述块对应的存储器单元异常交叉温度而发生数据丢失事件时,可使用于所述块的观察名单计数器递增。响应于确定所述块的观察名单计数器的所述值超过预定阈值,存储器子系统可通过将所述块添加到隔离队列来将所述块指定为隔离块。
19.存储器子系统可维持隔离队列以对被隔离块执行某些应力测试来评估被隔离块的健康状况。被隔离块的应力测试可包含所述块的交叉温度测试、p/e循环测试、读取干扰测试、或其组合。在处于隔离队列中时,块可被指定为在预定时间段内不可供存储器组件用于存储主机数据。在将所述块指定为被隔离之后,存储器子系统可使用测试数据执行所述块的应力测试,以基于应力测试的结果评估所述块的健康状况。如将在本文中更详细地描述,在一个实施方案中,如果块的应力测试结果不满足测试准则,那么存储器子系统可确定所述块有缺陷并且可引退所述块。如果另一方面,存储器子系统确定第一应力测试结果满足测试准则,那么存储器子系统可将所述块指定为不被隔离块,因此允许所述块退出隔离队列。所述块随后可被存储器子系统视为健康块并且可用于存储主机数据。
20.图1说明根据本公开的一些实施例的包含存储器子系统110的实例计算环境100。存储器子系统110可包含媒体,例如存储器组件112a到112n(下文还称为“存储器装置”)。存储器组件112a到112n可以是易失性存储器组件、非易失性存储器组件或此类组件的组合。存储器子系统110可为存储装置、存储器模块,或存储装置和存储器模块的混合。存储装置的实例包含固态驱动器(ssd)、快闪驱动器、通用串行总线(usb)快闪驱动器、嵌入式多媒体控制器(emmc)驱动器、通用快闪存储装置(ufs)驱动器以及硬盘驱动器(hdd)。存储器模块
的实例包含双列直插式存储器模块(dimm)、小型dimm(so-dimm)和非易失性双列直插式存储器模块(nvdimm)。
21.计算环境100可包含耦合到存储器系统的主机系统120。存储器系统可包含一或多个存储器子系统110。在一些实施例中,主机系统120耦合到不同类型的存储器子系统110。图1说明耦合到一个存储器子系统110的主机系统120的一个实例。主机系统120使用例如存储器子系统110将数据写入到存储器子系统110并从存储器子系统110读取数据。如本文中所使用,“耦合到”通常是指组件之间的连接,其可以是间接通信连接或直接通信连接(例如不具有介入组件),无论有线或无线,包含例如电连接、光学连接、磁连接等连接。
22.主机系统120可为计算装置,例如台式计算机、手提式计算机、网络服务器、移动装置、嵌入式计算机(例如,包含在车辆、工业设备或连网的商业装置中的计算机),或包含存储器和处理装置的这类计算装置。主机系统120可包含或耦合到存储器子系统110使得主机系统120可从存储器子系统110读取数据或将数据写入到存储器子系统110。主机系统120可经由物理主机接口耦合到存储器子系统110。物理主机接口的实例包含但不限于串行高级技术附件(sata)接口、外围组件互连高速(pcie)接口、通用串行总线(usb)接口、光纤通道、串行连接的scsi(sas)等。物理主机接口可用于在主机系统120与存储器子系统110之间发射数据。当存储器子系统110通过pcie接口与主机系统120耦合时,主机系统120还可利用nvm高速(nvme)接口来存取存储器组件112a到112n。物理主机接口可提供接口以用于在存储器子系统110与主机系统120之间传送控制、地址、数据以及其它信号。
23.存储器组件112a到112n可包含不同类型的非易失性存储器组件和/或易失性存储器组件的任何组合。非易失性存储器组件的实例包含与非(nand)类型闪存存储器。存储器组件112a到112n中的每一个可包含存储器单元的一或多个阵列,所述存储器单元如单层级单元(slc)、多层级单元(mlc)、三层级单元(tlc)或四层级单元(qlc)。在一些实施例中,特定存储器组件可包含存储器单元的slc部分和mlc部分两者。存储器单元中的每一个可存储供主机系统120使用的一或多个数据位。虽然描述如nand类型快闪存储器的非易失性存储器组件,但存储器组件112a到112n可基于任何其它类型的存储器,如易失性存储器。在一些实施例中,存储器组件112a到112n可以是但不限于随机存取存储器(ram)、只读存储器(rom)、动态随机存取存储器(dram)、同步动态随机存取存储器(sdram)、相变存储器(pcm)、磁随机存取存储器(mram)、或非(nor)闪存存储器、电可擦除可编程只读存储器(eeprom)以及非易失性存储器单元的交叉点阵列。非易失性存储器的交叉点阵列可结合可堆叠交叉网格化数据存取阵列基于体电阻的改变来执行位存储。另外,相较于许多基于快闪的存储器,交叉点非易失性存储器可进行就地写入操作,其中可在不预先擦除非易失性存储器单元的情况下对非易失性存储器单元进行编程。此外,存储器组件112a到112n的存储器单元可分组为存储器页或块,其可指用于存储数据的存储器组件的单元。数据块可进一步分组成存储器组件112a到112n中的每一个上的一或多个平面,其中可同时对平面中的每一个执行操作。来自不同平面的对应块可以条带的形式彼此相关联,横跨多个平面。
24.存储器系统控制器115(下文称为“控制器”)可与存储器组件112a到112n通信以执行操作,例如在存储器组件112a到112n处读取数据、写入数据或擦除数据,以及其它此类操作。控制器115可包含硬件,例如一或多个集成电路和/或离散组件、缓冲存储器,或其组合。控制器115可以是微控制器、专用逻辑电路(例如,现场可编程门阵列(fpga)、专用集成电路
(asic)等)或其它合适的处理器。控制器115可包含被配置成执行存储在本地存储器119中的指令的处理器(处理装置)117。在所说明的实例中,控制器115的本地存储器119包含被配置成存储指令以用于执行控制存储器子系统110的操作(包含处置存储器子系统110与主机系统120之间的通信)的各种过程、操作、逻辑流程以及例程的嵌入式存储器。在一些实例中,本地存储器119可以包含存储器寄存器,其存储存储器指针、提取的数据等。本地存储器119还可以包含用于存储微码的只读存储器(rom)。虽然图1中的实例存储器子系统110已说明为包含控制器115,但在本公开的另一实施例中,存储器子系统110可能不包含控制器115,且可改为依靠(例如由外部主机或由与存储器子系统分离的处理器或控制器提供的)外部控制。
25.一般来说,控制器115可从主机系统120接收命令或操作且可将所述命令或操作转换成指令或适合的命令以实现对存储器组件112a到112n的所需存取。控制器115可负责其它操作,例如耗损均衡操作、垃圾收集操作、错误检测和错误校正码(ecc)操作、加密操作、高速缓存操作和在与存储器组件112a到112n相关联的逻辑块地址与物理块地址之间的地址转译。控制器115可另外包含主机接口电路系统以经由物理主机接口与主机系统120通信。主机接口电路可将从主机系统接收到的命令转换成命令指令以存取存储器组件112a到112n,以及将与存储器组件112a到112n相关联的响应转换成用于主机系统120的信息。
26.存储器子系统110还可以包含未示出的额外电路系统或组件。在一些实施例中,存储器子系统110可包含高速缓存或缓冲(例如dram)和地址电路(例如行解码器和列解码器),其可从控制器115接收地址且对地址进行解码以存取存储器组件112a到112n。
27.在一个实施方案中,存储器子系统110包含块引退组件113,其可用以通过监测和测试块的操作条件,管理存储器子系统110的存储器组件112a到112n中的一或多个中的块引退。在一个实施方案中,块引退组件113可检测块中的无法通过系统级错误处置程序恢复的数据丢失发生。块引退组件113接着可识别致使所述块中的数据丢失发生的行为准则。在某些实施方案中,行为准则可为数个失效机制中的一个是否满足预定阈值准则。举例来说,如果失效机制超过预定阈值,那么其满足阈值准则。类似地,当失效机制满足预定阈值准则时,失效机制超过预定阈值。失效机制可包含与块的交叉温度、p/e循环、读取干扰或其组合相关的异常操作条件。当在具有广泛变化的温度的环境中操作存储器子系统以使得存储器单元在给定温度下经编程且稍后在显著不同的温度下被读取时,可发生交叉温度失效。当存储器子系统内的存储器单元归因于在相应存储器单元上操作的多个p/e循环而随时间推移丢失电荷时,数个p/e循环可出现问题。当对存储器子系统的特定方位(例如,块的存储器单元的一个行)的读取影响未读相邻方位(例如,同一块的不同行)的阈值电压时,发生读取干扰问题。
28.在识别行为准则后,块引退组件113即刻可将所述块添加到观察名单,使得可监测所述块的另外的数据丢失事件。在一个实例中,块引退组件113可通过响应于发生行为准则而使与所述块相关联的观察名单计数器递增,将所述块添加到观察名单。响应于确定所述块的观察名单计数器的所述值满足预定阈值准则,块引退组件113可通过将所述块添加到隔离队列并且将所述块标记为不可供存储器子系统110用于存储主机数据,将所述块指定为被隔离块。
29.块引退组件113可维持隔离队列以对被隔离块执行某些应力测试来评估被隔离块
的健康状况。被隔离块的应力测试可包含块的交叉温度测试、p/e循环测试、读取干扰测试,或其组合。在将所述块指定为被隔离之后,块引退组件113可执行所述块的应力测试以基于应力测试的结果评估块的健康状况。在一个实施方案中,测试准则可将所述块的第一应力测试结果与健康块的第二应力测试结果进行比较并确定第一应力测试结果是否在与健康块的第二应力测试结果的预期方差内。如果所述块的第一应力测试结果不满足测试准则,那么块引退组件113可引退所述块。如果另一方面,块引退组件113确定第一应力测试结果满足测试准则,那么块引退组件113可将所述块指定为不被隔离块,因此允许所述块退出隔离队列。所述块随后可被存储器子系统110视为健康块并且可用于存储主机数据。
30.图2是说明根据本公开的一些实施例的块在给定时间可占用的各种状态的示意性序列图200。在一个实施方案中,图1的每一存储器组件112a-n可含有数百个块。块210当首次被存储器子系统110打开时可被指配健康状态220。在某些实施方案中,健康状态220可指示所述块不被存储器子系统110标记为在观察名单中被监测或在隔离队列中进行应力测试。在操作224处,块210可经历可被存储器子系统110检测到的数据丢失事件。当先前写入的数据位到块的读取操作失败且后续系统级错误处置流未能恢复数据时,可发生数据丢失。在一个实例中,当顾客(例如在测试存储器子系统时)违反存储器子系统的设计规范时,存储器子系统110可经历数据丢失。在一个实施方案中,存储器子系统可在违反设计规范的交叉温度下操作,这致使发生交叉温度失效。在检测到块210中的数据丢失之后,存储器子系统110可识别致使块210中的数据丢失发生的行为准则。在某些实施方案中,行为准则可为失效机制是否满足预定阈值准则。失效机制可包含与块210的交叉温度、p/e循环、读取干扰或其组合相关的异常操作条件。
31.存储器子系统110接着可将块210指配到“观察名单中”状态230。“观察名单中”状态230致使存储器子系统110监测块210进一步发生引起数据丢失事件的行为准则,或其它行为准则。在一个实例中,存储器子系统110可通过在操作233处,使与块210相关联的观察名单计数器递增,将块210指配到“观察名单中”状态230。可针对块210的行为准则的每次出现,使与块210相关联的观察名单计数器递增。此外,块210可在处于“观察名单中”状态230的同时继续可供存储器子系统110用于存储主机数据。举例来说,块210可归因于与块210对应的存储器单元异常交叉温度而被指配“观察名单中”状态230。在存储器子系统110的下一通电事件期间,可测量存储器单元的交叉温度并且如果再次检测到异常交叉温度,那么可再次使块210的观察名单计数器递增。
32.在操作“与其它块相比更多地出现于观察名单中”252处,存储器子系统110可检测到块210与存储器子系统110内的其它块相比以显著更高的频率出现在“观察名单中”状态230中(例如通过将与块210相关联的观察名单计数器和存储器子系统110内的其它块的观察名单计数器进行比较)。存储器子系统110接着可确定块210中的数据丢失不归因于存储器子系统110的异常操作条件,这是由于子系统110内的其它块不经历同速率的数据丢失。存储器子系统110接着可确定块210不健康并且可通过为其指配引退状态250将块210标记为被引退。当块210处于引退状态250中时,可推测其在其寿命的持续时间内为有缺陷块260,且存储器子系统110可能不使用块210用于存储主机数据。
33.在操作“计数器满足阈值准则”235处,存储器子系统110可检测到块210以满足预定阈值准则的次数出现在“观察名单中”状态230中(例如通过查阅与块210相关联的观察名
单计数器)。举例来说,当观察名单计数器超过预定阈值时,观察名单计数器的值可满足阈值准则。响应于确定块210的观察名单计数器的值满足预定阈值准则,存储器子系统110可为块210指配隔离状态240。在一个实例中,存储器子系统110可通过将块210添加到隔离队列,为块210指配隔离状态240。存储器子系统110可维持隔离队列以对被隔离块执行某些应力测试来评估被隔离块的健康状况。被隔离块的应力测试可包含所述块的交叉温度测试、p/e循环测试、读取干扰测试、或其组合。在一个实例中,被隔离块的应力测试可在存储器子系统110的空闲时间期间运行以避免给存储器驱动器引入时延。此外,当处于隔离状态240中时,块210可被指定为不可供存储器子系统110用于存储主机数据。
34.在将块210指定为被隔离之后,存储器子系统可对块210执行应力测试,以基于应力测试的结果评估所述块的健康状况。举例来说,存储器子系统110可应用自热机构以短暂地增加存储器驱动器的温度并且接着观察由此操作温度增加引起的块210的行为。接着可评估所述块的应力测试结果以确定所述块的应力测试结果是否满足测试准则。
35.在一个实施方案中,测试准则可将块210的第一应力测试结果与健康块的第二应力测试结果进行比较并确定第一应力测试结果是否在与健康块的第二应力测试结果的预期方差内。在一个实例中,可从在其中可出于基准目的存储测试结果的预定存储方位检索健康块的第二应力测试结果。预期方差可为与健康块的基准测试结果的预期偏离百分点。
36.在“未通过应力测试”操作248处,存储器子系统110可确定块210的第一应力测试结果不在与健康块的第二应力测试结果的预期方差内,因此可为块210指配引退状态250。在一个实例中,如果发现对应于块210的字线的阈值电压比对应于健康块的第二字线的阈值电压高大于20%,那么存储器子系统110可确定20%不在与健康测试结果的预期方差内。存储器子系统110接着可确定块210不健康并且可通过为其指配引退状态250来将块210标记为引退。当块210处于引退状态250中时,可推测其在其寿命的持续时间内为有缺陷块260,并且存储器子系统110可能不使用块210用于存储主机数据。
37.在“通过应力测试”操作242处,如果存储器子系统110确定块210的第一应力测试结果在与健康块的第二应力测试结果的预期方差内,那么存储器子系统110可通过为块210指配健康状态220而将其指定为不被隔离块,因此允许块210退出隔离队列。举例来说,如果发现对应于块210的字线的阈值电压略微高于对应于健康块的第二字线的阈值电压(高5%),那么存储器子系统110可确定块210健康并且可为块210指配健康状态220。在另一实例中,如果发现块210的p/e循环的数目小于可接受p/e循环的预定阈值,那么存储器子系统110可类似地确定块210健康并且可为块210指配健康状态220。块210随后可被存储器子系统110视为正常块并且并且可用于存储主机数据。
38.图3是根据本公开的一些实施例的用于管理针对临时操作条件的块引退的实例方法的流程图。方法300可由处理逻辑执行,所述处理逻辑可包含硬件(例如,处理装置、电路、专用逻辑、可编程逻辑、微码、装置的硬件、集成电路等)、软件(例如,在处理装置上运行或执行的指令)或其组合。在一些实施例中,方法300是由图1的块引退组件113执行。虽然以特定顺序或次序来展示,但是除非另有指定,否则可修改所述过程的次序。因此,所说明实施例应仅作为实例理解,且所说明过程可以不同次序进行,且一些过程可并行进行。另外,在各种实施例中可省去一或多个过程。因此,在每一实施例中并非需要全部过程。其它过程流也是可能的。
39.在操作310处,处理装置检测块中的数据丢失发生。当先前写入的数据位到块的读取操作失败且后续系统级错误处置流未能恢复数据时,可发生数据丢失。在一个实例中,当顾客(例如在测试存储器子系统时)违反存储器子系统的设计规范时,处理装置可报告数据丢失。
40.在操作320处,处理装置可识别致使块中的数据丢失发生的行为准则。在某些实施方案中,行为准则可为数个失效机制中的一个是否满足预定阈值准则(例如通过具有超过预定阈值的值)。失效机制可包含与块的交叉温度、编程/擦除循环(在下文中为p/e循环)、读取干扰或其组合相关的异常操作条件,如本文中在上文更详细地解释。
41.当已识别行为准则时,在操作330处,处理装置可响应于发生行为准则而使与所述块相关联的观察名单计数器递增。在一个实施方案中,使观察名单计数器递增可致使所述块添加到观察名单,使得可监测所述块的另外的行为准则。当在观察名单中时,可在使所述存储器块继续可供存储器子系统用于存储主机数据的同时,监测所述存储器块的异常行为(例如另外的数据丢失事件)。每当所述块中发生数据丢失事件时,可使用于所述块的观察名单计数器递增。
42.在操作340处,响应于确定所述块的观察名单计数器的值满足预定阈值准则,处理装置可为所述块指配隔离状态,因此将所述块添加到隔离队列。举例来说,可将在观察名单中出现十次的块添加到隔离队列。如本文中在上文更详细地解释,处理装置可维持隔离队列以在将所述块标记为不可用于存储主机数据的同时,对被隔离块执行某些应力测试来评估被隔离块的健康状况。
43.在将所述块指定为被隔离之后,在操作350处,处理装置可对所述块执行应力测试以基于应力测试的结果评估块的健康状况。接着可评估所述块的应力测试结果以确定所述块的应力测试结果是否满足测试准则。在一个实施方案中,如本文中在上文更详细地解释,测试准则可将所述块的第一应力测试结果与健康块的第二应力测试结果进行比较并确定第一应力测试结果是否在与健康块的第二应力测试结果的预期方差内。
44.最后,在操作360处,响应于确定所述块的应力测试结果满足预定阈值准则,处理装置可通过为所述块指配引退状态来引退所述块。举例来说,如果发现对应于所述块的字线的阈值电压比对应于健康块的第二字线的阈值电压高大于20%,那么处理装置可确定所述块不健康并且可引退所述块。
45.图4是根据本公开的一些实施例的用于在引退块之前将致使数据丢失的块添加到观察名单的实例方法的流程图。方法400可以通过处理逻辑来执行,所述处理逻辑可以包含硬件(例如,处理装置、电路系统、专用逻辑、可编程逻辑、微码、装置的硬件、集成电路等)、软件(例如,在处理装置上运行或执行的指令),或其组合。在一些实施例中,方法400是由图1的块引退组件113执行。虽然以特定顺序或次序来展示,但是除非另有指定,否则可修改所述过程的次序。因此,所说明实施例应仅作为实例理解,且所说明过程可以不同次序进行,且一些过程可并行进行。另外,在各种实施例中可省去一或多个过程。因此,在每一实施例中并非需要全部过程。其它过程流也是可能的。
46.在操作410处,处理装置检测块210中的数据丢失发生,其中数据丢失未能通过系统级错误处置机构恢复,如本文中在上文更详细地解释。处理装置可在操作420处,确定块210的一或多个操作条件,以确定是否已存在与块210中的数据丢失发生相关联的行为准
则。在一个实例中,处理装置可确定数个p/e循环是否满足预定准则,是否已发生交叉温度失效等。如果处理装置在框425处,确定至少一个操作条件满足预定准则,因此确定已发生至少一个失效,那么处理装置可将块210标记为进行进一步监测(例如通过添加到观察名单)。
47.在操作435处,当发现至少一个操作条件满足预定准则时,处理装置可响应于一或多个操作条件满足预定准则而使与块210相关联的观察名单计数器递增。在一个实施方案中,使观察名单计数器递增可致使所述块添加到观察名单,使得可监测所述块的另外的行为准则。当在观察名单中时,可在使存储器块210继续可供处理装置用于存储主机数据的同时,监测所述存储器块的异常行为(例如另外的数据丢失事件)。在一个实例中,每当操作条件满足预定准则时(例如当在所述块的通电时间进行测量时),可使用于块210的观察名单计数器递增。
48.如果另一方面,块210的操作条件不满足预定准则,那么在操作450处,处理装置可确定块210可在正常操作条件内操作。在某些实施方案中,处理装置可将与块210相关联的观察名单计数器重置为零,因此结束块210的监测过程并且为块210指配健康状态。在其它实施方案中,处理装置可确定应针对监测评估块210的不同操作条件(例如交叉温度、读取干扰、p/e循环或数据保持)。
49.在操作445处,处理装置可确定块210的观察名单计数器的值是否满足可配置阈值准则。在某些实施方案中,如果块210的观察名单计数器的值超过可配置阈值,那么其满足阈值准则,且反之亦然。举例来说,处理装置可确定块210可在与存储器子系统内的其它块相比显著更次出现在观察名单中之后被引退。在此情况下,所述块被引退可能是因为存储器子系统可确定块210的重复数据丢失事件不归因于适用于所有块的临时操作条件。如果块210的观察名单计数器的值满足可配置阈值准则,那么在操作470处,处理装置可通过为块210指配引退状态来引退块210。
50.替代地,在操作440处,如果处理装置确定块210的观察名单计数器的值不满足可配置阈值准则,那么处理装置可通过将块210保持于观察名单中来继续监测所述块210。在一个实例中,处理装置可确定块210的下一次重复使用处块210的操作条件。块210的下一次重复使用可为存储器子系统110的下一通电事件。处理装置接着可继续进行到对照如上文在操作425处所述的预定准则来评估操作条件。
51.图5是根据本公开的一些实施例的用于在引退块之前将致使数据丢失的块添加标记为隔离的实例方法的流程图。可以通过处理逻辑来执行方法500,所述处理逻辑可以包含硬件(例如处理装置、电路系统、专用逻辑、可编程逻辑、微码、装置的硬件、集成电路等)、软件(例如在处理装置上运行或执行的指令),或其组合。在一些实施例中,方法500是由图1的块引退组件113执行。虽然以特定顺序或次序来展示,但是除非另有指定,否则可修改所述过程的次序。因此,所说明实施例应仅作为实例理解,且所说明过程可以不同次序进行,且一些过程可并行进行。另外,在各种实施例中可省去一或多个过程。因此,在每一实施例中并非需要全部过程。其它过程流也是可能的。
52.在操作510处,处理装置检测块210中的数个数据丢失发生,其中数据丢失发生无法由系统级错误处置机构恢复。在某些实施方案中,数据丢失发生可由一或多个失效机制超过预定阈值引起。如本文中在上文更详细地解释,失效机制可包含与块的交叉温度、p/e
循环、读取干扰或其组合相关的异常操作条件。
53.在操作520处,响应于检测到数据丢失事件,块引退组件113可通过为块210指配隔离状态将块210标记为被隔离。块引退组件113可维持隔离队列以在将所述块标记为不可用于存储主机数据的同时对被隔离块执行某些应力测试来评估被隔离块的健康状况,如本文中在上文更详细地解释。
54.在为块210指配隔离状态之后,在操作540处,块引退组件113可对块210执行高操作温度的应力测试。在一个实例中,块引退组件113可应用自热机构以短暂地增加存储器子系统110的温度并且接着观察由此操作温度增加引起的块210的行为。接着可评估块210的应力测试结果以确定所述块的应力测试结果是否满足测试准则(例如通过将应力测试结果与健康块的另一应力测试结果进行比较)。
55.在操作545处,块引退组件113可将块210的第一应力测试结果与健康块的第二应力测试结果进行比较。在一个实例中,可从在其中先前可出于基准目的存储测试结果的预定存储方位检索健康块的第二应力测试结果。块引退组件113接着在操作550处,确定第一应力测试结果是否在与健康块的第二应力测试结果的可接受方差内,如本文中在上文更详细地解释。举例来说,存储器子系统110的高操作温度可致使对应于块的字线的阈值电压增加。因此,如果发现对应于块210的字线的阈值电压比对应于健康块的第二字线的阈值电压高大于20%,那么块引退组件113可确定20%不为可接受方差且因此可将块210标记为不可用。
56.在操作555处,如果块引退组件113确定块210的第一应力测试结果不在与健康块的第二应力测试结果的可接受方差内,那么块引退组件113可通过为块210指配引退状态来致使块210引退。如本文中在上文更详细地描述,被引退块210可不用于存储主机数据。
57.在操作560处,如果另一方面,块引退组件113确定块210的第一应力测试结果在与健康块的第二应力测试结果的可接受方差内,那么块引退组件113可通过为块210指配健康状态而使块210退出隔离队列。块210接着可用于存储主机数据,如本文中在上文更详细地解释。
58.图6说明计算机系统600的实例机器,可执行所述计算机系统600内的用于致使所述机器执行本文中所论述的方法中的任一种或多种方法的指令集。在一些实施例中,计算机系统600可对应于包含、耦合到或使用存储器子系统(例如,图1的存储器子系统110)或可用以执行控制器的操作(例如,以执行操作系统从而进行对应于图1的块引退组件113的操作)的主机系统(例如,图1的主机系统120)。在替代性实施例中,机器可连接(例如,网络连接)到lan、内联网、外联网或互联网中的其它机器。机器可作为对等(或分散式)网络环境中的对等机器或作为云计算基础设施或环境中的服务器或客户端机器而在客户端-服务器网络环境中的服务器或客户端机器的容量中操作。
59.机器可以是个人计算机(pc)、平板pc、机顶盒(stb)、个人数字助理(pda)、蜂窝式电话、网络器具、服务器、网络路由器、开关或桥接器、汽车或能够(依序或以其它方式)执行指定由机器采取的动作的一组指令的任何机器。另外,尽管说明单个机器,但还应认为术语“机器”包含机器的任何集合,所述集合单独地或共同地执行一(或多个)指令集以进行本文中所论述的方法中的任何一或多种。
60.实例计算机系统600包含处理装置602、主存储器604(例如,只读存储器(rom)、闪
存存储器、动态随机存取存储器(dram)例如同步dram(sdram)或rambus dram(rdram)等)、静态存储器606(例如,闪存存储器、静态随机存取存储器(sram)等),以及数据存储系统618,其经由总线630彼此通信。
61.处理装置602表示一或多个通用处理装置,例如微处理器、中央处理单元或类似物。更特定来说,处理装置可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器或实施其它指令集的处理器,或实施指令集的组合的处理器。处理装置602也可为一或多个专用处理装置,例如专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器等。处理装置602被配置成执行指令626以用于执行本文中所论述的操作和步骤。计算机系统600可另外包含网络接口装置608以在网络620上通信。
62.数据存储系统618可包含机器可读存储媒体624(也称为计算机可读媒体),其上存储有一或多个指令集626或体现本文中所描述的方法或功能中的任一或多种的软件。指令626还可在其由计算机系统600执行期间完全或至少部分地驻存在主存储器604内和/或处理装置602内,主存储器604和处理装置602也构成机器可读存储媒体。机器可读存储媒体624、数据存储系统618和/或主存储器604可对应于图1的存储器子系统110。
63.在一个实施例中,指令626包含用于实施对应于图1的块引退组件113的功能性的指令。尽管在实例实施例中将机器可读存储媒体624展示为单个媒体,但术语“机器可读存储媒体”应被认为包含存储一组或多组指令的单个媒体或多个媒体。术语“机器可读存储媒体”还应被认为包含能够存储或编码供机器执行的指令集合且致使机器执行本公开的方法中的任何一种或多种的任何媒体。因此,应认为术语“机器可读存储媒体”包含但不限于固态存储器、光学媒体以及磁性媒体。
64.已关于计算机存储器内的数据位的操作的算法和符号表示而呈现先前详细描述的一些部分。这些算法描述和表示是数据处理领域的技术人员用以将其工作的主旨最有效地传达给本领域的其它技术人员的方式。算法在这里并且通常被认为是导致期望的结果的操作的自洽序列。操作是要求对物理量进行物理控制的操作。这些量通常但未必呈能够被存储、组合、比较和以其它方式操控的电或磁信号的形式。有时,主要出于通用的原因,已经证明将这些信号称为位、值、元件、符号、字符、术语、数目等是方便的。
65.然而,应牢记,所有这些和类似术语应与适当物理量相关联,且仅仅是应用于这些量的方便标签。本公开可以指操控和变换计算机系统的寄存器和存储器内的表示为物理(电子)数量的数据为计算机系统存储器或寄存器或其它这类信息存储系统内的类似地表示为物理量的其它数据的计算机系统或类似电子计算装置的动作和过程。
66.本公开还涉及用于执行本文中的操作的设备。此设备可以出于所需目的而专门构造,或其可以包含通过存储在计算机中的计算机程序选择性地激活或重新配置的通用计算机。此类计算机程序可存储在计算机可读存储媒体中,如但不限于任何类型的盘(包含软盘、光盘、cd-rom和磁性光盘)、只读存储器(rom)、随机存取存储器(ram)、eprom、eeprom、磁卡或光卡或适合于存储电子指令的任何类型的媒体,它们各自耦合到计算机系统总线。
67.本文中呈现的算法和显示器在本质上并不与任何特定计算机或其它设备相关。各种通用系统可与根据本文中的教示的程序一起使用,或其可证明构造用以执行所述方法更加专用的设备是方便的。将如下文描述中所阐述的那样来呈现多种这些系统的结构。此外,
并不参考任何特定编程语言来描述本公开。应了解,可以使用各种编程语言来实施如本文所描述的本公开的教示内容。
68.本公开可提供为计算机程序产品或软件,其可包含在其上存储有可用于编程计算机系统(或其它电子装置)以进行根据本公开的过程的指令的机器可读媒体。机器可读媒体包含用于以机器(例如,计算机)可读的形式存储信息的任何机构。在一些实施例中,机器可读(例如计算机可读)媒体包含机器(例如计算机)可读存储媒体,例如只读存储器(“rom”)、随机存取存储器(“ram”)、磁盘存储媒体、光学存储媒体、闪存存储器组件等。
69.在前述说明书中,已参考其特定实例实施例描述了本公开的实施例。应显而易见的是,可在不脱离如所附权利要求书中阐述的本公开的实施例的更广精神和范围的情况下对本公开进行各种修改。因此,应在说明性意义上而非限制性意义上看待说明书和图式。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜