登录
第三方登录
信息参考|CES 2026,英伟达Rubin架构首曝光,告别单芯片时代!
湖北日报客户端 2026-01-06 17:46:07

在2026年国际消费电子展(CES)上,人工智能无处不在,而英伟达GPU则是不断扩展的人工智能领域的核心。今日,在CES主题演讲中,英伟达首席执行官黄仁勋分享了公司将如何继续引领人工智能革命的计划。

NVIDIA Rubin,亮相

会上英伟达首席执行官黄仁勋介绍了新一代“Rubin”计算架构。Rubin是英伟达所谓的“极致协同设计”的成果,它由六种芯片组成:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4数据处理单元和Spectrum-6以太网交换机。这些组件共同构成了Vera Rubin NVL72机架。

对人工智能计算的需求永无止境,而每款Rubin GPU都承诺为这一代产品提供更强大的计算能力:NVFP4数据类型的推理性能高达50 PFLOPS,是Blackwell GB200的5倍;NVFP4训练性能高达35 PFLOPS,是Blackwell的3.5倍。为了满足如此庞大的计算资源需求,每款Rubin GPU都配备了8个HBM4显存堆栈,提供288GB的容量和22 TB/s的带宽。

每个GPU的计算能力只是人工智能数据中心的一个组成部分。随着领先的大型语言模型从激活所有参数以生成给定输出词元的密集架构,转向每个词元仅激活部分可用参数的专家混合(MoE)架构,这些模型的扩展效率得以相对提高。然而,模型内部专家之间的通信需要大量的节点间带宽。

Vera Rubin数据中心架构推出用于纵向扩展网络的NVLink 6,将每个GPU的交换矩阵带宽提升至3.6 TB/s(双向)。每个NVLink 6交换机拥有28 TB/s的带宽,每个Vera Rubin NVL72机架配备9个这样的交换机,总纵向扩展带宽可达260 TB/s。

Nvidia Vera CPU采用88个定制的Olympus Arm核心,并配备Nvidia所谓的“空间多线程”技术,可同时运行多达176个线程。用于将Vera CPU与Rubin GPU连接起来的NVLink C2C互连带宽翻倍,达到1.8 TB/s。每个Vera CPU可寻址高达1.5 TB的SOCAMM LPDDR5X内存,内存带宽高达1.2 TB/s。

为了将Vera Rubin NVL72机架扩展为每个包含八个机架的DGX SuperPod,Nvidia推出了两款采用Spectrum-6芯片的Spectrum-X以太网交换机,这两款交换机均集成了光模块。每颗Spectrum-6芯片可提供102.4 Tb/s的带宽,Nvidia将其应用于两款交换机中。

SN688拥有409.6 Tb/s的带宽,可配置512个800G以太网端口或2048个200G以太网端口。SN6810提供102.4 Tb/s的带宽,可配置128个800G以太网端口或512个200G以太网端口。这两款交换机均采用液冷散热,Nvidia声称它们具有更高的能效、更高的可靠性和更长的正常运行时间,这大概是指与缺乏硅光子技术的硬件相比而言。

随着上下文窗口增长到数百万个令牌,英伟达表示,对存储与AI模型交互历史记录的键值缓存的操作将成为推理性能的瓶颈。为了突破这一瓶颈,英伟达正在利用其下一代BlueField 4 DPU创建其所谓的新内存层:推理上下文内存存储平台。该公司表示,这一层存储旨在实现人工智能基础设施中键值缓存数据的高效共享和重用,从而提高响应速度和吞吐量,并实现智能体人工智能架构的可预测、节能扩展。

Vera Rubin还首次将英伟达的可信执行环境扩展到整个机架,通过保护芯片、架构和网络级别,英伟达表示,这对于确保人工智能前沿实验室珍贵的尖端模型的保密性和安全至关重要。

总而言之,每个Vera Rubin NVL72机架提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、连接到Vera CPU的54 TB LPDDR5X内存以及20.7 TB HBM4,提供1.6 PB/s的带宽。

为了保持这些机架的高效运行,Nvidia重点介绍了机架级别的几项可靠性、可用性和可维护性(RAS)改进,例如无电缆模块化托盘设计,与之前的NVL72机架相比,可以更快地更换组件;改进的NVLink弹性,可以实现零停机维护;以及第二代RAS引擎,可以实现零停机健康检查。

所有这些强大的计算能力和带宽乍看之下令人印象深刻,但对于英伟达的合作伙伴而言,在考虑未来大规模投资扩容时,总体拥有成本可能才是最重要的。英伟达表示,使用Vera Rubin训练MoE模型所需的GPU数量仅为Blackwell的四分之一,并且Rubin可以将各种模型的MoE推理的单令牌成本降低多达10倍。反过来,这意味着Rubin还可以提高训练吞吐量,并在相同的机架空间内提供更多的令牌。

Rubin生产,已准备就绪!

NVIDIA Rubin已全面投入生产,基于Rubin的产品将于2026年下半年通过合作伙伴推出。

2026年首批部署基于Vera Rubin的实例的云提供商包括AWS、Google Cloud、Microsoft和OCI,以及NVIDIA云合作伙伴CoreWeave、Lambda、Nebius和Nscale。

微软将在下一代人工智能数据中心(包括未来的Fairwater AI超级工厂)中部署NVIDIA Vera Rubin NVL72机架级系统。

此外,思科、戴尔、HPE、联想和超微预计也将推出基于Rubin产品的各种服务器。

包括Anthropic、Black Forest、Cohere、Cursor、Harvey、Meta、Mistral AI、OpenAI、OpenEvidence、Perplexity、Runway、Thinking Machines Lab和xAI在内的AI实验室正在寻求利用NVIDIA Rubin平台来训练更大、更强大的模型,并以比以往GPU更低的延迟和成本为长上下文、多模态系统提供服务。

基础设施软件和存储合作伙伴AIC、Canonical、Cloudian、DDN、Dell、HPE、Hitachi Vantara、IBM、NetApp、Nutanix、Pure Storage、Supermicro、SUSE、VAST Data和WEKA正在与NVIDIA合作,为Rubin基础设施设计下一代平台。

会上,英伟达还宣布NVIDIA DRIVE AV驾驶辅助软件将率先随全新梅赛德斯-奔驰CLA车型登陆美国,新车预计于今年年底前推出。

该软件将为奔驰CLA带来增强的L2级端到端驾驶辅助能力,标志着以AI定义驾驶体验的新阶段。全新梅赛德斯-奔驰CLA是该品牌首款搭载MB.OS平台的车型,引入了NVIDIA DRIVE AV、AI基础设施以及加速计算能力所支持的先进驾驶辅助功能。

在技术架构上,NVIDIA DRIVE AV采用双栈架构:一方面是用于核心驾驶的端到端AI驱动栈,另一方面是基于NVIDIA Halos安全系统构建的并行传统安全栈,为系统提供冗余和安全防护。通过这种方式,其车辆能够从大量真实与合成驾驶数据中学习,辅助驾驶员在复杂环境和场景中以接近人类的决策方式安全行驶。

英伟达表示,该统一架构支持功能更为丰富的L2级自动驾驶能力,包括在复杂城市环境中的端到端导航、具备主动碰撞规避能力的高级主动安全功能,以及在狭小空间内的自动泊车能力。此外,该系统还支持系统与驾驶员之间的协同转向。

如果说奔驰CLA的发布是英伟达“车载”技术的证明,那么Alpamayo就是英伟达试图将自动驾驶变成一个生态系统,并继续掌控决定谁能驾驶下一辆车的工具。

Alpamayo是一个全新的开源人工智能模型、仿真工具和数据集系列,用于训练物理机器人和车辆,旨在帮助自动驾驶车辆应对复杂的驾驶情况。

作为Alpamayo推广计划的一部分,英伟达还发布了一个开放数据集,其中包含超过1700小时的驾驶数据,这些数据涵盖了各种地理区域和路况,囊括了罕见且复杂的真实世界场景。此外,该公司还推出了AlpaSim,这是一个用于验证自动驾驶系统的开源仿真框架。AlpaSim已在GitHub上发布,旨在重现从传感器到交通状况的真实驾驶环境,以便开发人员能够安全地进行大规模系统测试。

Alpamayo 1是一个拥有100亿个参数的基于推理的思维链视觉语言动作(VLA)模型,它使自动驾驶汽车能够更像人类一样思考,从而在没有先前经验的情况下解决复杂的边缘情况,例如如何在繁忙的十字路口应对交通信号灯故障。

它通过将问题分解成多个步骤,推演每一种可能性,然后选择最安全的路径来实现这一点。它们还可以使用Cosmos生成合成数据,然后结合真实数据集和合成数据集,对基于Alpamayo的自动驾驶应用程序进行训练和测试。

此外,英伟达还发布了全新的开源模型Nvidia Cosmos和GR00T。该公司表示,这些模型旨在帮助开发者减少预训练所需的时间和资源,从而将更多精力投入到构建下一代机器人上。

英伟达表示,Nvidia Cosmos Reason 2是一种开放式推理视觉语言模型(VLM),它使智能机器能够“像人类一样观察、理解和行动于物理世界”。此外,借助Nvidia Cosmos Reason 2,物理人工智能可以像人类一样,运用推理、先验知识、物理理解等做出决策。

最后,Nvidia Isaac GR00T N1.6是一款专为类人机器人设计的开放式推理视觉语言动作(VLA)模型,它支持全身控制,并利用Nvidia Cosmos Reason实现上述额外优势。所有这些新模型均可在Hugging Face上获取。

信息来源:半导体产业纵横

责任编辑:徐雯
点赞 0
收藏
已输入0个字
全部评论
  • 回复
    • 查看全部{{ item.replyCount }}条回复> 查看更多回复>
    • 查看更多回复>
查看更多评论 没有更多评论了
电子报
  • 湖北日报
  • 楚天都市报
  • 农村新报
政情
精彩推荐
  • 湖北日报客户端
  • 湖北日报官方微信
  • 湖北日报官方微博