广告

NVMe-oF已准备好进行到底

2020-11-23 Gary Hilson 阅读:
NVMe-oF规范支持在主机与固态存储设备或系统之间通过网络进行数据传输。其最新修订版包含了对TCP传输绑定的支持,这样就能在标准的以太网网络上使用它,而无需进行配置更改或增加特殊设备。可能正是这个原因使今年成为了NVMe-oF真正腾飞的一年,同时其又扩展了NVMe核心价值——释放了NAND闪存的全部优势。

2020年是NVMe over Fabrics(NVMe-oF)最终起飞的一年吗?hYcednc

非易失性快速内存(NVM Express,或NVMe)协议现已比较成熟了;作为其扩展,NVMe-oF规范使用NVMe将主机连接到整个网络矩阵(Fabric)中的存储器。NVMe-oF支持在主机与固态存储设备或系统之间通过网络进行数据传输。这类传输可使用基于NVMe消息的命令,通过以太网、光纤通道(FC)或InfiniBand完成。hYcednc

Fabric的一个关键价值主张是,它可以连接分布式存储池(最有可能是NVMe SSD,但将来可能会使用其他永久内存)。此外,由于可使用TCP进行连接,因此这也可以远距离实现。这一规范的最新修订版NVMe-oF 1.1包含了对TCP传输绑定的支持,这样就能在标准的以太网网络上使用NVMe-oF,而无需进行配置更改或增加特殊设备。hYcednc

可能正是这个能力使今年成为了NVMe-oF真正腾飞的一年,同时其又扩展了NVMe核心价值——释放了NAND闪存的全部优势。最初为硬盘驱动器构建的采用iSCSI等协议的体系结构,则无法做到这一点。hYcednc

NVMe初始规范的发布已有将近十年,它利用计算机的快速外部设备互连(PCI Express,或PCIe)总线在本地传输数据。NVM Express组织负责监督这类协议;根据其说法,NVMe-oF与初始协议有90%相似(图1)。推出五年后,NVMe-oF率先获得美光科技(Micron Technology)的拥护,该公司选择使用自己的SolidScale架构来超越这个标准。这个架构是为低延迟、高性能访问计算和存储资源而创建的,专门用来解决数据中心中CPU使用不充分的问题。当时部署在应用服务器中的NVMe SSD所使用的IOPS和容量平均不到其50%。hYcednc

hYcednc

图1:NVM Express路线图不断通过添加NVMe-oF来扩展其初始规范——NVMe-oF提供TCP传输绑定支持,因此可实现远距离存储。(图片来源:NVM ExpresshYcednc

此后,该公司选择将SolidScale淘汰,因为最终其可能使该公司与自己的某些客户形成竞争,那么就不合理,美光公司存储系统架构师兼研究员Joe Steinmetz表示。取而代之,该公司将专注于其作为NVMe-oF生态系统中SSD和内存供应商的核心优势。与许多技术一样,其采用所花的时间比预期要长,但他表示,2020年似乎是NVMe-oF之年,并且业界有足够的一致性来达到这一点。hYcednc

但是,采用也存在障碍。Steinmetz认为,虽然将TCP和非RDMA传输包括在内有所裨益,但这也确实造成了一些混乱。“我认为这就是业界很多人预计NVMe-oF会很快采用,但是却推迟了一些的原因。”他表示。另一个重大障碍是软件生态系统——取决于客户计划如何使用NVMe-oF,这个生态系统仍处于起步阶段,Steinmetz补充说。hYcednc

虽然添加TCP确实解决了距离挑战,并且TCP无处不在,这点很有用,但它并没有否定RDMA RoCE的适用性——许多存储OEM厂商在这方面都具有丰富经验。“TCP很好、必要,最终会推动采用。但我看不到RoCE会消失。”Steinmetz表示。hYcednc

Steinmetz认为,在不久的将来,全闪存存储阵列供应商会成为使用NVMe-oF的先行者,因为他们希望为客户释放昂贵闪存的价值,而使他们完全获得高性能和低延迟。“我们在全闪存阵列方面看到了许多的应用和早期采用者。”hYcednc

西部数据(Western Digital)也将NVMe-oF视为一场生态系统活动,并于今年早些时候推出了一些相互关联的产品,包括双端口的第三代Ultrastar DC SN840 NVMe SSD及其最新的OpenFlex Data24 NVMe-oF存储平台,用于扩展其性能并共享分布式(disaggregated)闪存。OpenFlex平台还整合了该公司RapidFlex控制器,实现了NVMe/NVMe-oF连接,同时兼顾了能效——这是其收购Kazan Networks所获得的能力。hYcednc

西部数据产品管理与市场营销高级总监Scott Hamilton表示,该公司的NVMe-oF方法是故意无关的,但相信以太网会主导数据中心(图2)。“我们认为这最终会是成本最低、普及率最高的情况。”同时,西部数据已支持RoCE并计划支持TCP。该公司对NVMe-oF支持的一个重要里程碑,是其自己两年前推出的Open Composable架构。它具有多个层,可提供不同功能来支持可组合分布式基础架构,同时,它结合了多个行业标准来创建Open Composable API。hYcednc

hYcednc

图2:西部数据的NVMe-oF方法是故意无关的,它包括其两年前推出的Open Composable(开放组合式)架构,这种架构结合了多种行业标准来创建Open Composable API。(图片来源:西部数据hYcednc

Hamilton表示,其目标是在不同的解决方案、供应商、产品和用户之间提供一致的体验,从而有望减少供应商的锁定并进一步推动与供应商无关的解决方案。他表示,NVMe-oF的早期采用是靠高性能和低延迟推动的,那些早期采用者正在使用RoCE达到目的,而TCP具有降低复杂性的好处。hYcednc

西部数据数据中心系统合作伙伴联盟工程总监Mark Miquelon表示,如果延迟很重要,那么客户就会选择NVMe SSD,而如果没有NVMe-oF,那么可通过PCIe连接的数量就有限。“借助NVMe-oF,我们可以大大扩展这个范围。”他表示,虽然这会对延迟造成影响,但是却很小,因此可以将应用扩展到整个网络规模。hYcednc

但是在现实世界中,NVMe-oF并不能消除网络拥塞的可能性。Miquelon表示,同一Fabric上可能有很多应用试图从相同的SSD或共享同一Fabric的不同SSD获取数据。这就是西部数据设立了“兼容性实验室”的原因——该实验室向所有人开放,供了解这些真实情况并帮助客户将基于Fabric的产品推向市场。“我们正在研究Fabric拥塞时的数据行为。”hYcednc

另一个障碍是,即使交换机供应商都遵循标准,但每个供应商的标准都稍有不同,并且它们都使用自己的网络接口控制器(NIC)进行测试。因此,兼容性实验室还是个混合和匹配而创建配方的环境,这样就能使不同的交换机和NIC供应商之间实现良好的互操作性,并有助于减少供应商锁定,Miquelon表示。hYcednc

如今,SSD正在推动NVMe-oF的采用,NVM Express会员公司——英伟达(Nvidia)的网络业务部门存储技术副总裁Rob Davis表示。“更快的存储需要更快的网络。SSD变得越来越快,PCI总线也变得越来越快,两者之间的网络也就要越来越快。对于未来来说,这确实是个很好的组合,尤其是在有大量数据、饥饿的应用(例如机器学习和人工智能)时如此。”他表示,从长远来看,可以想象其他永久内存可能会使用NVMe规范,包括3D Xpoint。“现已生产多年的英特尔Optane SSD,就对该低延迟堆栈进行了充分利用。”hYcednc

带TCP的NVMe-oF还可以实现SAS的替代,从而帮助扩展企业存储阵列,Davis表示。“实际上,这是NVMe over Fabrics的主要目标用例之一。”他表示,另一种是去隔离式存储模型,包括超大规模数据中心——在此,大部分流量都是发生在数据中心内部。“他们只是在扩展闪存,而与CPU、DRAM和计算无关。他们可以使用标准网络设备在数据中心内的任何位置访问闪存。”hYcednc

市场研究机构Coughlin Associates总裁Thomas Coughlin表示,即使光纤通道解决方案获得了NVMe-oF的早期采用,但由于普遍性,后者使用TCP的情况也越来越多。“基于TCP的网络可能已经获得最大的成功。”总的来说,NVMe-oF在存储系统和管理以及计算存储中都有明显用例,因为高性能接口可实现对不同位置(无论是不同的设施还是不同的机架)的内存之间进行协调,他表示。加速器技术也可能会搭配使用。hYcednc

虽然NVMe本身已经相对成熟,但TCP支持也已经有两年了,而对NVMe-oF提供了帮助,Coughlin表示。他还没有预见到来自计算快速链接(Compute Express Link,CXL)或Gen-Z等新兴架构的直接竞争。“在未来几年中,这三者将在存储开发中发挥作用。同时涉足这三者的玩家很多,他们的目标可能是找到将它们一起使用的最佳方法。”hYcednc

英伟达的Davis认为Gen-Z已被纳入CXL,并得到了英特尔的支持。“如果有英特尔支持,那么情况就很好。”他表示,与NVMe一样,CXL利用了PCIe这种成熟的标准化技术——每个人都已经习惯使用这个技术,这也促进了NVMe-oF的采用。即使人们不准备立即使用它,也可以为它做准备,也不必担心受困于专有技术中。hYcednc

(原文刊登于EDN姐妹网站EETimes,参考链接:NVMe-oF Is Ready to Go the Distance,由赵明灿编译。)hYcednc

本文为《电子技术设计》2020年11月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里hYcednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Gary Hilson
EE Times特约编辑。Gary Hilson是一位自由撰稿人和编辑,曾为北美地区的印刷和电子出版物撰写过大量稿件。 他感兴趣的领域包括软件、企业级和网络技术、基础研究和教育市场,以及可持续交通系统和社会新闻。 他的文章发表于Network Computing,InformationWeek,Computing Canada,Computer Dealer News,Toronto Business Times,Strategy Magazine和Ottawa Citizen。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 菜鸟遭遇棘手问题,上司却用一个电阻就解决了! 这是一篇EDN的老文章,作者叙述了他第一份工作时的状况,当他用一个理论正确,但相对复杂的电路解决问题时,他的上司却轻松、简单地用了一个电阻就一切“大事化小,小事化无”。让作者深刻的体会到,作为一个开发工程师须时时牢记“KISS原则”,否则会傻傻地做了很多白工…
  • 热搜的国产“阿法狗”有蹊跷!1年出新产品,2年迭代,技术和 近日,#中国公司研发机器狗超越世界纪录#这个话题冲上了微博热搜,阅读飙升至1.4亿。从2019年成立以来,仅用1年就推出新产品,2年迭代出的机器狗产品,速度就超过了MIT。所以,这家公司的技术和资金,都是从哪来的?
  • uCPE:企业服务的新创收方向 在企业网络中,从传统的路由器和防火墙设置向安全的SD-WAN的转变正在迅速发生。 然而,嗡嗡声已经转移到网络发展的下一个重大方向:安全访问服务边缘(SASE)。
  • 神秘故障!系统为何每天凌晨2点崩溃? 装配线24小时三班不停地运作,白天一直正常,但是每到凌晨2点左右,在最困乏的午夜时分,都会意外停机。有经验的老同事说是模拟漂移引起的,但是用了恒温器,还是不行……
  • 论国产数字芯片设计EDA平台的重要性 据了解,全世界的信息量真的能够被有效利用的不足1%,这意味我们虽然能够捕捉获取很多信息,但真正能够将其互享、检索、保护、传播、处理的少之又少,海量的信息到目前为止还远远没有被充分的挖掘。要想把这些信息能够充分的利用起来,核心问题就是在于算力,算力有许多办法实现,但归根到底离不开半导体。
  • 远程办公刺激供应链调整,PC/智能手机性能升级显著 随着越来越多的人在家办公,IT部门最不希望出现的就是电脑性能不足。解决方案可以是在桌面电脑或笔记本电脑中使用更多的随机存取存储器(RAM),也可以是利用非工作时间在更休闲的工作环境下使用智能手机。那么,个人电脑能不能再次稳定地推动内存需求?5G智能手机会不会成为远程办公人士的首选设备?
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了