高级格式化4KB扇区硬盘深度解析
4K 扇区引发的问题?
关于“高级格式化4K扇区硬盘”这个话题,我想很多读者已经不陌生了,下面先简单介绍一下市场现状: 目前,希捷和西部数据都已经推出了采用4K扇区(高级格式化)的硬盘产品,对于使用低版本操作系统(如:Windows XP)或者硬盘实用程序时“分区未对齐”可能出现的性能降低问题,这两家厂商采取的是不同的解决方法。
西部数据使用4K扇区(高级格式化)技术的640GB蓝盘(Caviar Blue)
西部数据提供了两种方案。首先,只要在硬盘上短接7号和8号跳线,硬盘控制器芯片即可提供一个逻辑分区的偏移量,使LBA63变成LBA64,解决校准问题。不过这种方案仅能针对全盘只有一个分区的情况(实用性不大)。第二种方案,则是一款名为WD Align的工具软件。该工具可以移动分区和数据,“对齐”文件系统簇与4KB扇区。推荐使用Windows 5.x(2000、XP、Server 2003)操作系统,或是需要磁盘镜像软件的用户使用该工具。由于WD Align需要移动全盘数据,因此最好在分区或操作系统安装完毕后即使用该工具进行迁移。
而希捷则提出了自己的技术“SmartAlign”,宣称能够在硬盘内部实时、自动管理离散的扇区状况,并交给系统使用,不会造成任何延迟和性能损失。当然了,最好的解决方案还是把系统升级到Windows Vista/7。
这样来看应该是希捷的做法更好一些,那么SmartAlign是否真的像宣传的那样有效?希捷具体是如何实现的?WD为什么没有采用类似的方式呢?
希捷Momentus 7200 2.5英寸硬盘产品线
西部数据推出的第一款采用4K扇区的硬盘是3.5英寸绿盘(Caviar Green),后来又逐渐加入了蓝盘(Caviar Blue)中的几款型号,希捷的4K扇区硬盘现在只有发布不久的2.5英寸Momentus 750GB一款。不过,所有参与IDEMA(国际磁盘驱动器设备与材料协会)的各主要硬盘制造商已经达成一致:2011年1月1日起,面向渠道出货的所有台式机和笔记本硬盘(新推出的型号)都将采用高级格式标准。值得注意的是:这当中不包括对OEM客户出货和企业级硬盘,为什么呢?
高级格式硬盘扇区的扩大可以带来更高的密度和更大的容量,同时还有纠错能力的增强。ECC校验码的集中和占用空间减少(下文中有详细说明)能够提高硬盘容量利用率,这一点还比较好理解,而纠错能力又是如何增强的呢? 除了“分区对齐”的问题之外,4K扇区硬盘还有其它可能会导致性能下降的因素吗?
我想这些问题应该是大家普遍比较关心的,希望您能够在本文接下来的几页中找到它们的答案...
概述
硬盘行业正在经历一次变革。近年内,在存储密度大幅增长的同时,作为硬盘设计最主要因素之一的逻辑块格式化大小(也称为扇区)却仍然没有变化。
开始于 2009 年晚期,在 2010 年加速,2011 年力争成为主流,硬盘公司正在从传统的 512 字节扇区迁移到更大、更高效的 4096 字节扇区(一般称为 4K 扇区),国际硬盘设备与材料协会(International Disk Drive Equipment and Materials Association,IDEMA)将之称为高级格式化。
下面我们将分别阐述此迁移的背景,指出为客户带来的长期利益,同时提出从 512 字节迁移到 4K 扇区的过程中要避免的潜在隐患。
背景
30 多年来,硬盘上储存的数据都要格式化到小的逻辑块中,这种逻辑块称为扇区。传统的扇区大小是 512 字节。实际上,现代计算机系统很多的设计方面仍假设硬盘扇区采用此基础格式标准。
传统扇区格式中包含间隙 (Gap)、同步 (Sync) 和地址标记 (Address Mark)、数据和纠错代码 (ECC) 部分(见图 1)。
图 1.硬盘介质上的传统扇区布局
此扇区布局的结构设计如下:
间隙 (Gap) 部分:间隙,用于分隔扇区。
同步 (Sync) 部分:同步标记,用于表示扇区开始处并提供计时对齐。
地址标记 (Address Mark) 部分:地址标记,包含可识别扇区号和位置的数据。还可提供扇区本身的状态。 数据部分:数据,包含所有用户数据。
ECC 部分:ECC 部分包含用于修复或复原读写过程可能受损的数据的纠错代码。
多年来,硬盘行业一直采用这种低级别的格式。然而,随着硬盘容量的不断增长,扇区大小日渐成为提高硬盘容量和纠错效率方面的限制性设计因素。例如,将以前的扇区大小和总容量的比率与最近硬盘的扇区大小和总容量的比率相对比就可以发现,扇区分辨率已变得非常低。扇区分辨率(扇区大小和总存储大小的百分比)已经非常低,几乎可以忽略不计(见表 1)。
表 1.在一个可测量的总容量内的扇区分辨率。
管理小型离散数据时,分辨率越低越好。但是,现代计算系统中的常用应用管理的都是大型数据块,实际上远比传统 512 字节扇区大小要大得多。
另外,随着区域密度的增加,小型 512 字节扇区在硬盘表面上占用的空间也将越来越小。从纠错和介质缺陷风险方面看,更小的空间也会引发问题。如图 2 所示,硬盘扇区中的数据占据的空间越小,错误纠正就会变得越困难,因为同样大小的介质缺陷对总体数据负载损害的百分比更高,因此需要更大的纠错强度。
图 2.介质缺陷和区域密度(更高的区域密度使同样大小介质缺陷带来的危害更高)
512 字节扇区一般可纠正高达 50 字节长度的缺陷。现在,硬盘开始通过先进的区域密度来提高错误纠正的上限。因此,为了改善错误纠正和实现格式化效率,迁移到较大扇区是硬盘行业内的基本要求。
过渡到 4K 扇区(高级格式化)
数年来,存储行业一直在通力协作,致力于向较大扇区硬盘格式过渡;至少 5 年以前,希捷以及硬盘行业内的同行就已开始努力,并获得了卓越的成果(见图 3)。2009 年 12 月,经过与 IDEMA 的通力合作,将高级格式化提名作为 4K 字节扇区标准的名称,并获得批准。此外,所有硬盘制造商还承诺,自 2011 年 1 月开始,所发行的台式机和笔记本电脑产品的新型硬盘平台都采用高级格式化扇区格式。在此之前,高级格式化硬盘将开始逐步进入市场。从 2009 年 12 月起,西部数据就开始推出了高级格式化硬盘;有段时间,希捷也为 OEM 客户和品牌零售产品中提供过大扇区硬盘,其中值得关注的是 USB 连接外置硬盘,如 Seagate FreeAgent 系列。
图 3.高级格式化标准发展的重要里程碑
4K 扇区的长期利益
所有硬盘制造商一致同意,到 2011 年 1 月,实现向高级格式化扇区设计的过渡,因此,硬盘行业需要适应并采用此更改,以最小化潜在的负面作用。短期内,最终用户不会明显感受到硬盘容量的增长。但是,迁移到 4K 大小扇区后,肯定能为实现更高的区域密度、硬盘容量和更强大的纠错功能提供一条捷径。 通过降低错误纠正代码所用空间来提高格式化效率
图 4 显示了传统的 512 字节扇区布局。其中,在每个 512 字节扇区中,都留有 50 字节与数据无关的开销用于 ECC,以及另外 15 字节的开销用于间隙 (Gap)、同步 (Sync) 和地址标记 (Address Mark) 部分。这样就造成扇区格式化效率仅约为 88% (512/(512 + 65))。
图 4.传统 512 字节扇区布局
新的高级格式化标准使得 4K 字节扇区有了不小进步,在 4K 字节扇区中,8 个传统 512 字节扇区合并为一个 4K 字节扇区(见图 5)。
图 5.高级格式化:4K 字节扇区布局
高级格式化标准用于间隙 (Gap)、同步 (Sync) 和地址标记 (Address Mark) 的字节数与传统扇区相同,但将 ECC 字段增加至 100 字节。这样,扇区格式化效率达到了 97% (4096/(4096 + 115)),比传统扇区提高了将近 10%。
这些格式化效率将逐渐发挥作用,有助于产生更高的容量和改善数据完整性。 可靠性和错误纠正
硬盘扇区的物理大小在不断缩减,所占空间也越来越少,但介质缺陷却没有同时减少。图 6 中显示了我们认为很小的物体的图像。但与硬盘读/写磁头的飞行高度相对而言,这些物体显得非常庞大。比图中显示物体更小的微小颗粒也会造成硬盘的介质缺陷。