热点:

    一路无惧前行如赤子 华为数据存储亮剑云原生

      [  中关村在线 原创  ]   作者:陈赫

    自人类文明产生以来,就有着记录保存信息的“本能”,从生物学上来看,这是为了后代能顺利继承和解读,以便文明得以存续,毕竟信息本身并没有固定的物理形态,只能通过载体来存储和共享,而数字信息技术诞生以后,不仅信息存储技术迎来了质的飞跃,数据产生的总量也在大幅度上升,根据IDC的预测,2026年全球数据圈将达到221ZB,2022至2026年将实现2倍增长,种种因素都在推动着存储技术的创新和发展。

    三十年来谁著史?—存储技术的四个变迁

    “进入数字时代以后的存储,其实就是通过磁盘或者其他介质来存储企业的数据,近三十多年来,存储技术历经了多次变迁,主要的驱动力来自两个方面,一方面是存储在整个数据中心的部署环境产生了变化,我们可以把它称为数据驱动。另一方面则是存储技术本身发生了变化,例如CPU、介质类型、网络技术的改变,也就是所谓的技术驱动。”华为数据存储首席科学家张国彬在接受采访时表示。

    事实上,在近30年来,整个存储技术一共历经了四个阶段的变迁,具体来说,在2010年之前,存储处在一个相当蓬勃发展的时期,高端存储、中端存储、文件存储这些围绕数据库和文件共享等数据类型的存储品类就已经开始丰富多样起来,基本上构筑成了现在来看也比较完整的存储品类体系。在2010年之后,基础层面上看,以虚拟化为代表的云计算和大数据两大新技术开始渐露头角,推动了存储技术彼时的升级,而介质层面上看,SSD开始出现,一众厂商开始探索如何提高SSD性能的同时降低成本,以取代一些高性能的机械硬盘,并在2016年左右开始大规模商用。而到2019年左右,随着芯片技术的进步,高端存储使用的芯片由定制专用芯片也开始向通用的商用芯片转移,也让高端存储的架构进行了全面的迭代升级。最后则是近几年来飞速发展的AI,让大数据走上了新的台阶,新的应用进一步推动着存储技术的升级。

    八千里外欲封侯—华为数据存储从跟跑到领跑业界

    对任何一家企业来说,“出道即巅峰”都只存在于传说之中,华为也不例外,在2010年前,华为的主要目标就是“跟上市场”,不过所幸在当时整个存储市场都处于一个比较静默的状态,也给了华为充足的时间来做出自己的产品系列,不过在2010年云计算出现以后,情况产生了一些变化。彼时的虚拟化要求存储进行资源池化,即一套存储存储要支持多个应用,在彼时,业界面临的问题就是SAN和NAS需要在一套存储里实现,当时企业为了控制投资成本、简化管理难度,试图把SAN和NAS“绑定”为一套系统,不过考虑到硬件架构上的隔阂,能真正做到融合的厂商并不多。而OceanStor 融合存储的出现,不仅打破了传统硬件之间的壁垒,在存储系统组件级别实现融合,还在数据服务软件层面实现了融合,采用面向云架构的存储软件,用一套操作系统同时处理不同类型的数据服务,在一套数据服务软件堆栈下实现了各种数据服务。

    这种软硬件上的协同创新离不开华为长久以来的技术投入,给了其挑战国际巨头的十足信心。如果翻看华为在企业级存储领域的发展历程,就会发现这条路与其坚守的独立自研精神密不可分,从底层处理器到上层算法都持续领先。

    2010年之后掀起的闪存热潮让华为看到了更多的机会,从2010年开始,华为就开始投入相当多的精力在闪存身上,为了实现性能提升和成本的降低,华为做了很多前瞻性的事情,包括存储产品软件的核心代码重构等等,几乎可以说,在当时整个业界,针对闪存进行大量投入,相当激进的公司,除了海外的Pure Storage之外,便是华为了,而华为也为业界贡献了OceanStor Dorado系列全闪存存储,率先支持了NVMe(非易失性内存主机控制器接口规范)架构,为企业客户提供更高品质的数据服务。

    时至今日,全闪存储的发展前景早已成为业界共识。相应的,全闪存阵列的设计思路也逐渐清晰,既要有闪存的高性能又要具有传统阵列丰富的软件功能。为此,华为从底层的SSD到上层的资源管理算法和系统都进行了针对性的设计,例如自研的SSD控制器芯片,包括FTL在内的SSD核心功能和算法放在控制器芯片中实现,性能高并且不会过多占用系统CPU资源。同时,基于算法集合FlashLink还能实现大块顺序写、元数据独立分区以及I/O优先级调整等技术,像是盘控配合技术可以通过SSD驱动与控制器软件的配合,将数据更均匀的分配到每一块SSD盘中,并根据SSD盘的状态动态调整分配算法以实现更高性能。

    上文中提到过,存储处理器的变革同样推动了存储架构的变革。2009年之前,高端存储普遍采用存储专用处理器为基础的全互联架构。在2009年到2019年间,在业界都走向以通用处理器为基础的模块化架构时,华为则走了一条与众不同的道路:全互联+模块化的架构。当然,华为做这件事并不是头脑一热,而是有着充分的考虑,首先,华为从2016年开始采用自研存储处理器,这为算法设计打下了良好的基础,也让华为更有信心从模块化架构转变为全互联+模块化的架构,彼时的OceanStor Dorado高端全闪存存储基于高性能芯片、SmartMatrix全互联高可靠架构以及AI使能的全生命周期智能管理,进一步发挥了华为在全闪存领域的技术优势,也让这款产品在国内外市场上披荆斩棘。

    从OceanStor Dorado全闪存存储的特点可以看出,华为在云化全融合、自动化、闪存普惠三个方向上的发展方向。这一次,华为拥有了完全自研的端到端IO处理的五个芯片,覆盖“传、算、存、管、智”五个维度,分别是网络芯片、处理器芯片、SSD控制芯片、管理芯片和AI芯片。这种高度的自主研发使得华为在存储控制器等关键组件上凭借软硬件协同获得了独特的优势。

    举个例子,存储系统中多个控制器同时发生故障的情况偶有发生,会直接影响核心业务。利用SmartMatrix全互联高可靠架构,确保单系统最多可容忍7个控制器同时失效的时候,业务仍然稳定在线。OceanStor Dorado全闪存存储的上市,为下一代存储带来了更多的思考。

    存储的发展与数据应用的趋势密切相关。当云和AI成为承载和处理数据的重要途径,存储的形态也随之发生了改变,较为显著的现象之一就是分布式存储市场的增长。在中国,千行百业的数字化带来了百花齐放的应用类型,企业需要处理的“单一数据”变成了“混合数据”。目前,文件和对象市场是华为在分布式存储领域关注的重点之一,另一方面则是结合超融合来满足中小企业的需求。

    因此围绕着AI、大数据这类负载,华为也在积极进行架构的变革,并在2021年发布了OceanStor Pacific,该系列是专为海量数据场景设计的分布式存储系统。其使命是高性能计算、为虚拟化/云资源池、大数据分析、视频、内容存储/备份归档等类型应用提供多样性存储服务,能够帮助企业释放海量数据价值。

    据了解,华为OceanStor Pacific分布式存储是一款可大规模横向扩展的智能分布式存储产品,是既具备云基础架构的弹性按需服务能力、又满足企业级关键业务和新兴业务需求的全自研存储系统,可以按需为上层应用提供文件存储、对象存储、大数据存储等多样化服务。在架构设计上,SmartBalance全均衡系统可以支撑HPC、大数据分析、AI等混合负载,大幅提升数据分析的效率,并且支持湖仓融合的数据格式,一份数据可支持数据湖、数据仓库同时访问,向湖仓一体、一湖多云和实时分析演进,利用下一代存算分离架构大幅提升了数据分析的实效性。在可靠性方面,OceanStor Pacific提供了面向EB级数据的持久化存储节点故障的切换时间为秒级,业务可用性达到“6个9”。

    可以看到的是,企业在发展过程中所积累的海量数据和性能提升需要一个能够创造更高价值的出口,而数字化转型则为企业业务确立了以数据为中心的发展方向,也让存储迎来一次又一次的发展,从最早的追赶市场到后来的独具慧眼,华为走出了一条颇为成功的道路。

    满眼生机转化钧——拥抱云原生的华为数据存储

    走过了融合存储的山,翻过了分布式存储的岭,华为数据存储又站在了“下一步该往哪里去?”的命运分叉口。数字经济当下正在全球各国的国民生产总值中,占据越来越重的比例。发展数字经济,关键在于筑牢数字基础设施。除了网络、算力之外,存储同样也是数字经济的重要底座之一。

    在华为全联接大会2022上,华为正式发布了面向多云的存储战略,宣布全面拥抱云原生,打造跨多私有云、公有云的可靠存储系统,助力企业构建数据集中共享、应用多云部署的 IT 架构,实现最大程度的数据资源共享和流通。

    千行百业数字化程度的不断提升,越来越多的企业决定上云,已经上云的企业则不断让自己的业务与云结合的越来越深。而问题也随之出现,许多企业选择了多公有云+多私有云的上云方式,想要借助多家公有云服务商的各自技术优势来发展自身的业务。但实际效果却很惨痛,多云建设模式直接导致了各个云之间的数据形成了数据孤岛,数据难以在多云应用之间形成共享。还有重要的一点就是,各家云服务商的服务各有差异,生态难以互相打通。

    未来毫无疑问是云原生的世界,华为数据存储产品线总裁周跃峰在华为全联接大会2022上宣布,“华为数据存储将全面拥抱云原生时代,将企业级存储能力融入到企业私有云及公有云,为客户构建多云时代全局共享、云上云下能力一致的可靠存储底座。”

    一路无惧前行如赤子 华为数据存储亮剑云原生

    当然,空谈从来不是华为的作风,要实现上面这些目标,助力客户“迈”进云原生时代,华为正在推进六项工作:

    第一,夯实智能数据分级存储能力,全局共享存储资源池使能数据跨云自由流动。Cloud Tier根据数据分级策略,形成完整的热、温、冷数据的分级分层机制,数据可以在本地存储与云之间按需流动。

    第二,夯实数据管理能力,通过全局文件系统GFS能够实现跨地域、跨云统一数据视图和调度。有了全局数据视图,就能够打破地域限制,让数据看得见;再通过统一数据调度,让数据按需高效、安全流动起来。

    第三,夯实多云连接能力,存储中数据的流通首先要保证多云之间能够顺利的互相访问。华为通过业界开放、标准的接口,广泛对接主流的云平台。一方面,能够通过全局存储资源池实现数据共享,避免数据跨云迁移带来的麻烦;另一方面,将华为数据存储的企业级特性平滑融入云,让云上享有稳定低时延、企业级高可靠的企业级存储能力。

    第四,夯实容器存储能力,为了拥抱云原生生态,华为数据存储产品已经全面支持容器。华为OceanStor Dorado、OceanStor Pacific全系列存储产品,通过华为CSI/CDR插件直接对接主流容器云平台,支持有状态容器应用,资源发放效率直接领先业界30%,并且实现了跨集群应用级灾备。

    第五,面向服务器Diskless架构,微存储筑牢多云时代数据中心存储底座。云和互联网数据中心广泛采用存算一体的通用服务器架构,算力和数据的生命周期管理存在巨大鸿沟,难以满足海量数据增长的复杂管理要求。华为推出业界首个微存储,实现计算和存储独立弹性扩容,计算升级时免数据迁移,以通用化标准部件的方式将企业级存储能力赋能到公有云数据中心,降低40%机柜空间和设备能耗。

    第六,华为积极参与产业合作,构建跨公有云、私有云的云原生PaaS、SaaS数据生态。通过与广大合作伙伴携手,共同推出云原生数据仓库存储解决方案、OLTP分布式数据库存储解决方案。

    目标永远是—向前!向前!向前!

    在数字经济蓬勃发展的当下,数据正成为最关键的生产要素之一。如何帮助企业令其自身的数据完全发挥价值,也是数据基础设施的另一大挑战。诚如周跃峰所言,“我们正在迎来 YB 数据时代,华为数据存储深入践行“以数据为中心”的理念,全面拥抱云原生时代,与全球的存储客户和伙伴一起携手并进,共创数据存储产业新未来。”

    一路无惧前行如赤子 华为数据存储亮剑云原生
    华为数据存储产品线总裁周跃峰

    回顾华为数据存储的发展之路,从跟跑到通过持续创新领跑业界,再到树立拥抱云原生时代的新目标,这一路可以说是“千淘万漉虽辛苦,吹尽狂沙始到金”。经过千锤百炼的华为数据存储,目标只有一个,那就是“向前!向前!向前!”!

    本文属于原创文章,如若转载,请注明来源:一路无惧前行如赤子 华为数据存储亮剑云原生https://stor.zol.com.cn/806/8065632.html

    stor.zol.com.cn true https://stor.zol.com.cn/806/8065632.html report 9286 自人类文明产生以来,就有着记录保存信息的“本能”,从生物学上来看,这是为了后代能顺利继承和解读,以便文明得以存续,毕竟信息本身并没有固定的物理形态,只能通过载体来存储和共享,而数字信息技术诞生以后,不仅信息存储技术迎来了质的飞跃,数据产生的总量也在大...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    0

    下载ZOL APP
    秒看最新热品

    内容纠错