企业存储

    解析:如何利用固态硬盘进行存储分层

         [ TT存储 转载 ] 暂无评论

      科技的发展遵循可预测的进化。在开始的时候,新功能以一种“排外”的竞争姿态,只是由一个或者很少的几个公司提供,紧接着通过激烈的高度差异化产品的行业竞争,最终形成包含在大多数产品中的“基本配置”。存储分层技术以及更加独特的自动存储分层技术,已经成为这样一种基本配置了。即便如此,当涉及到评价竞争对手的解决方案时,它们之间的显著差异还是为存储管理者提供了一个令人垂涎的选择。这个差异对于正在寻找最佳产品的企业来讲是相当重要的,其中分层数据存储就是一个重要的需求。

      所有的分层产品有一些共同的特点。首先,当然也是最低限度,磁盘阵列会把多种类型的物理介质进行大量的组合排列,通常包括固态硬盘、高性能硬盘(包括光纤通道硬盘或者 SAS 硬盘)和大容量硬盘。其次,系统包含了数据从某个物理层移动到其它层的规则和方法的软件。尽管这些功能都是最基本的功能要求,但其在实施部署的方法上仍存在巨大的变化。

      固态存储驱动器层

      采用分层技术的重要驱动者就是固态存储或者叫固态硬盘(SSD)的出现。早期的分层技术围绕着第一层(光纤通道硬盘)、第二层(SAS硬盘)以及第三层(SATA硬盘),由于使用者无法准确区分热点数据从而导致了失败。因此,许多采用了分层技术的磁盘阵列为了保证足够的性能,需要把80%保留在第一层。剩余20%所带来的成本节省,根本无法平衡其所增加的复杂性和消耗的努力。SSD 的出现改变了游戏规则,它可以通过非常少的硬盘提供巨大的 IOPS 性能(尽管一块都非常昂贵)。在这一点,几乎所有的存储厂商都赞同采用少量百分比的 SSD 硬盘加上大容量硬盘(HDD),从而大大减少硬盘数量是最佳的体系架构。通过较低的获得成本,就常常可以得到较高的聚合吞吐量。

      本文所探讨的目标,就是要描绘出 SSD 固态硬盘和高速闪存的区别,尽管其基本技术是相同的。SSD 可以被认作是一个特别的 Tier 0层,像其他存储介质一样供应给应用系统使用。从本质上来看,高速闪存的主要目的是增强整个磁盘阵列。大部分厂商都支持这两种类型,并且其中有很多也支持一种“混合池”,其 LUN 是由 SSD 硬盘和其它各种类型硬盘组合而成。

      存储厂商是如何利用高速闪存进行分层的

      EMC公司在引入固态硬盘时,推荐一种“闪存优先”的方法。在其VNX系列的磁盘阵列上,使用这种方法的产品叫做全自动存储分层缓存(FAST Cache)。它不同于 DRAM 的高速缓存,其真正的功能介于 DRAM 和硬盘之间。EMC 公司发现,采用总容量5%的FAST Cache,可以获得300%到600%的整体性能提升。此外,他们还发现,如果通过 SATA 硬盘替代光纤通道硬盘,其 5%的闪存,可以把整个硬盘的数量减少三分之二。结论就是更好的性能、更低的获得成本和更低的运维成本——EMC 把这称为“三重角色存储系统”。

      NetApp 公司为闪存做了三种定位。第一种是在主机层面,使用 Flash Accel产品。第二种是 Flash Cache,这是部署在存储控制器上面的。第三种方法是由闪存池组成,也称混合式聚合。最后这种是 tier-0 层的部署,可以专门针对特定的应用程序。NetApp 公司的方法与 EMC 公司的不同的是,他们推荐有底向上的方法——在工作方式中需要额外时使用存储缓存。然而,他们不赞成用闪存式缓存替代闪存池。当涉及到调整闪存的时候,NetApp 寻找90%的缓存命中率作为最佳选择。如果命中率相当低,比如说50%,这可能预示着缓存容量不足。在部署了多层缓存的时候,最高层(最接近服务器的一层)将会首先负载必要的 I/O。基本逻辑是把数据存储在最低层、最便宜的设备上,并且允许系统提升数据到合适的存储层级以匹配性能的需要。

      惠普(HP)公司的 Ibrix 系列可横向扩展的 NAS 系统,利用更传统的方法进行分层。在这些磁盘阵列中,SSD 功能是用作缓存,并且存储管理者可以部署由光纤通道硬盘、SAS 硬盘和 SATA 硬盘组成的物理分层。惠普公司的企业级磁盘阵列3PAR 系列在其自适应优化分层解决方案中使用“子卷”技术实现分层。子卷分层技术从本质上是借助 SSD 性能的混合卷技术。这种混合卷可以最多包含三个物理层。

      日立数据系统公司和 EMC 公司分别在他们的虚拟存储平台(VSP)和 VMAX系统中都采用了物理分层的技术。两种磁盘阵列都具备在其系统架构中虚拟化第三方磁盘阵列的功能。(NetApp 公司在其 V 系列控制器后端也能够虚拟化第三方存储系统。)EMC 公司把这作为其联合分层存储(FTS)解决方案的“第四层”来对待。这种方式扩展了 EMC 公司的 FAST 功能,其中包括 SSD 和众多 HDD 选项。EMC VMAX 系列产品推荐使用 “80/20 I/O 倾斜规则”来划分缓存。这个规则假设在任意给定的时间里,只有20%的卷是“热”的。而在这20%的热卷里,也只有20%的数据是热的。这就意味着占整个数据的4%是作为进行磁盘阵列 SSD 规划的依据。有意思的是,存储厂商使用的各种不同估测方法都接近5%这个值。如果大家都同意,那么一定其合理性。

      日立公司,也可提供闪存、SSD 硬盘和第三方存储的分层,其建议采用从上至下的方法使用闪存以提升性能。日立公司的动态分层(HDT)策略,首先假设新的数据是最热的数据。因此,开始的时候新数据移动到闪存中,当更热的数据取代它的时候,再将其迁移到较慢的层中。值得一提的是日立公司和 EMC 公司也把其分层数据存储产品拓展到了大型机环境。

      尽管厂商硬件架构不同,但底层的驱动器和电路板往往是非常相似的。然而日立公司却不同,它设计了专用的 ASIC 芯片和处理器作为混合控制单元。 ASIC 芯片用于数据移动,而四核的 Intel 处理器用于跟踪源数据。其理念是将尽可能多的工作量交给硬件层来完成,从而获得最高的性能。

    解析:如何利用固态硬盘进行存储分层

      作为实用的分层解决方案,自动数据迁移软件有着显著的不同,并且它是进入“目前最先进技术”领域的“艺术”。例如,日立公司把他的硬件架构和一个基于对象的文件系统相结合,用于跟踪源数据,这被认为是最有效的过程。数据的移动是基于策略和使用特点。数据按照42MB 大小的页面进行迁移,这恰好适应了缓存的大小。日立公司使用“设置然后忘记”的理念以最大限度的减少人为的努力,而数据可以在其预期会被使用的情况下手工迁移到更高的层级。这方面的一个例子是在月末处理某些特定的数据集。

      数据什么时候要被移动以及原因

      存储管理员或许会假定热数据是无法预测的,并且可能会在任何时候发生,因此数据移动会很频繁。大部分数据的移动计划发生在几小时内,并且可能持续一天,这意味着数据在层之间的移动更多是基于趋势的,而不是对情况立刻做出反应。因为这个原因,惠普公司认为缓存是应对实时的、不可预知的突发 I/O 的最好技术。如果不可预测性很高,那么 IT 管理者应该补充加强缓存,而不是采用混合池。

      什么时候移动数据是适当的调整系统的一个重要方面。EMC 公司的 VNX 系列产品缺省的数据移动周期是一天一次,不过用户可以通过设置策略实现数据更频繁的移动。惠普公司的 Ibrix 系统也是以天为周期进行数据移动的,但可以做到小时级的移动数据。数据的移动是基于对数据段变热的源数据的扫描。尽管可以并行的进行扫描查找,但厂商警告,太多的扫描作业会非生产性的消耗后端 IOPS 。3PAR 磁盘阵列具有“不中断”数据移动功能(这实际上是对主机和应用程序透明的自我调节功能),“热”数据可以做到每30分钟进行取样。即使这样,惠普公司仍然推荐、限制数据移动的频率到必要的程度。

      另外的一种类型,EMC 公司的 VMAX 和 NetApp 公司的系统都设计成频繁的数据移动。VMAX 移动768KB 的数据段,而 NetApp 是4KB的数据块。因为需要移动的这么小的数据的 I/O 数量非常低,所以对于整个计划的破坏也是最小的。此外, EMC 允许数据被“订”到缓存里,手工移动或者在特定窗口按计划执行,例如在午夜到凌晨2点之间。

      最适合分层的数据类型

      什么情况适用于存储分层?几乎所有的厂商都认为是虚拟化桌面(VDI)和服务器虚拟化环境。在共享存储的虚拟化环境中,NetApp 推荐分配双倍的缓存。 EMC 公司的 VNX 系列的最佳使用情况是作为“倾斜的数据集”,作为在任意时刻热数据的子集。除了 VDI 之外,还可以用于在线交易处理(OLTP)的应用。基于 Web 的文件服务是另外一个好的用处,这是因为某些页或许比其其它的更更频繁被命中。

      分层数据存储策略,通过利用 SSD 和闪存以获得最佳性价比,只会变得更加强大。尽管它现在已是大多数存储阵列的基本功能,分层目前已经是存储管理员考虑的最重要技术之一。因为固态技术与服务器内存从根本上讲是相同的,它遵循莫尔斯法则的性价比曲线;每 IOPS 的成本将会在来年显著降低。

    关注排行榜

    NASSAN磁盘阵列企业硬盘

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询