什么是数据处理单元,为什么要关心?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-10-10
英伟达分析师会议中做出了一个大胆的预测
即“每台运入数据中心的服务器”都将装有DPU。 尽管 我认为这种说法有点激进,但我确实认为DPU会获得很大的吸引力,基本的BlueField非常适合具有高密度虚拟机或容器的服务器。 BlueField-2X是更有趣的产品,因为它可以大大提高执行AI任务的服务器。 实时的安全分析是其中一项低落的水果用例,其中的AI用于识别可能表明违规的异常流量。 使用AI和DPU,可以以线速完成该任务,从而限制了安全事件的影响。
具有额外处理功能的NIC并不是真正的概念,但是Nvidia的时机很好
对于那些已经从事该行业一段时间的人来说,可能还记得带有嵌入式防火墙的3Com NIC或Chelsio和Intel TOE(TCP卸载引擎),它们改善了卡上的网络处理能力。 这些是DPU的早期版本,惨遭失败。 这次有什么不同?曾经认为TOE和类似的其他产品是个好主意,但在某种程度上却是解决问题的解决方案。 十年前,平均服务器利用率不到40%,因此,当服务器甚至没有接近极限时,没有太多理由从服务器上卸载处理。
如今,情况并非如此,因为虚拟化和容器已将服务器推向极限
实际上,与我交谈过的许多企业都在升级之前将服务器利用率推高到90%, 更换服务器可能会造成很大的破坏,并可能导致不必要的停机,因此公司会尽可能地将其淘汰。放下这些DPU之一可以将服务器的寿命延长数月甚至数年。
由AI驱动的另一个因素推动了对更快计算的需求
人工智能的并行度大大提高,而计算密集度则提高了数千到数百万倍,开发软件的方法不同,计算基础架构是不同的,工具不同,软件运行方式不同,甚至部署方法也不同。人工智能需要彻底改造计算堆栈,DPU通过将资源移出服务器来使计算堆栈发生变化,从而使服务器可以执行其设计要执行的更多工作。
使我相信DPU可以保留的因素是生态系统支持
VMware宣布将在其Cloud Foundation中使用DPU。除VMware外,Red Hat,Canonical和Check Point Software还宣布了对DPU的支持。另外,包括戴尔,华硕,联想和超微在内的许多服务器制造商将把Nvidia DPU集成到他们的系统中。
进入数据中心的任何技术都必须具有强大的生态系统
因为它需要与许多其他组件一起工作, 初的类似显卡浪潮实际上没有第三方支持,但Nvidia BlueField似乎有很多支持,大小公司的信息技术专业人士都担心要从已经花费的美元中挤出更多资金, 今天的服务器所执行的工作负载比几年前要处理得多, DPU可以为那些相同的服务器提供急需的性能提升,从而使企业进入AI时代。