PG电子|英伟达加快AI芯片路线图：黄仁勋透露GPU将一年一更

发布时间：2024-09-11

浏览量：279次

文丨智驾网王欣

连续几个月霸屏科技圈头条，只是“皮衣老黄”黄仁勋的开胃菜。

正菜是这次他在中国台北国际电脑展前夕发表的演讲。

北京时间6月2日晚，英伟达创始人黄仁勋举办了一场名为“揭开新工业革命”的主题演讲。他花了两个小时详细阐述自己对“GPU加速AI计算革命”及“AI工厂”的理解。

而硬核信息是去年发布的Blackwell芯片开始投产，2025年将推出Blackwell Ultra，而下一代 AI 芯片架构平台名为Rubin，采用HBM4芯片，预计将于2026年推出。

同时，黄仁勋还宣布推出推理模型微服务NVIDIA NIM，以部署在云、数据中心或工作站上，并且开发者能够轻松地为Copilot、ChatGPT等构建生成式 AI 应用，所需时间从数周缩短至几分钟。

同时，英伟达面向GeForce RTX AI电脑平台推出AI助理，为数字人推出G-Assist和NVIDIA ACE（数字人技术） NIMs，以及为微软Windows Copilot Runtime推出用于RTX加速API的小语言模型（SLM）等等。

而在这一系列新产品与新预言中，最具看点的是其展示的GPU全新一代的Rubin架构。

在黄仁勋看来，生成式AI刚刚打开了软件编写软件的历史，而一步，或者说新一代的工业革命正是机器来生产机器。

01.

尽管英伟达才刚推出了新的Blackwell平台，却开始了预告下一代Rubin GPU架构路线图的野心计划。

黄仁勋表示，Blackwell的下一代架构将是Rubin架构，且Rubin GPU将采用8颗HBM4，而Rubin Ultra GPU将采用12颗HBM4。

这个新的架构以美国天文学家Vera Rubin命名，她被视为发现宇宙中的暗物质的第一人，并在研究银河系等星系自转速度方面做了开创性的工作。

黄仁勋透露了GPU的更迭计划：

“我们公司有一年的节奏。我们的基本理念很简单：建立整个数据中心规模，然后以一年的节奏拆解并出售给您，并将一切推向技术极限。”

这意味着英伟达新的GPU架构将从两年一次迭代，加速到以一年为周期推出。

2024 年：Blackwell 芯片现已开始生产

2025 年：推出 Blackwell Ultra 产品

2026 年：推出 Rubin 产品

2027 年：推出 Rubin Ultra 产品

根据外媒wccftech的消息，英伟达的Rubin GPU将采用4x光罩设计，并将使用台积电的CoWoS-L封装技术，并采用N3制程。此外，英伟达将使用下一代HBM4 DRAM来为其Rubin GPU提供动力，目前英伟达在其B100 GPU中使用最快的HBM3E存储器，并预计在2025年底当HBM4存储器解决方案大幅量产时，用HBM4版本来更新这些芯片。

02.

当前CPU面临的困境是什么？

在黄仁勋看来，当今 CPU 性能扩展的速度已经大大减缓，尽管我们需求的计算量仍然在以指数级的速度非常快速地翻倍。如果处理需求、我们需要处理的数据量呈指数级增长，但性能却没有相应增长，我们将经历计算的「通货膨胀」（computation inflation）。事实上，就在我们现在说话的时候，世界各地使用的数据中心电力数量正在大幅增长。计算机的成本正在不断增长。这当然不能再继续下去了，因为数据将继续呈指数级增长，但 CPU 性能扩展速度将永远不会恢复。

比如说对比英伟达2016年发布的Pascal GPU，Blackwell GPU的计算能力（对应人工智能浮点运算能力）增长了1000倍，几乎“超越了摩尔定律在最佳时期的增长”。

黄仁勋一贯坚持“买的越多，省得越多”的理念。

GPU和CPU组合在一起，实现了高达100倍的加速计算，同时功耗仅增加三倍，换算下来平均单位性能比单独使用CPU提高25倍，显著起到了节能、降成本的效果。

而100倍的速度意味着97%、98%的节省，所以当GPU+CPU的组合从100倍的速度到200倍的速度再到1000倍的速度，节省、计算的边际成本就会继续下降。

黄仁勋的设想是，随着人工智能模型继续扩大，对GPU性能的要求也将越来越高，传统数据中心将进化为“AI工厂”，而工厂的基石便是超级GPU。

演讲过程中，黄仁勋甚至还亲自搬上一台体型更大的DGX服务器。这台服务器上连接了8个Blackwell GPU，采用空气冷却技术散热。目前全球抢购的AI服务器都用到这款产品，也是各大数据中心的核心设备。

其中DGX的AI算力提升到上一代的45倍，达到1440PFLOPS，而能耗仅为上一代的10倍。

黄仁勋极力描绘着生成式AI时代的一幅蓝图，展示了英伟达如何从Blackwell芯片等一系列先进技术和产品的组合，垒起层层叠叠的机架、集群，最终形成由32000张GPU组成的AI工厂。

03.

一座AI工厂到底如何掀起新产业革命？

这次演讲，黄仁勋宣布推出推理模型微服务NIM，能将企业部署生成式AI应用的时间从几天压缩到几分钟，这个微服务可以用于研究、开发和测试。

该服务提供了一种简单、标准化的方式，通过经优化的容器形式提供AI模型，可部署在云、数据中心或工作站上。

现在，全球2800万开发者可下载NIM，从而轻松构建Copilot、聊天机器人等生成式AI应用。

04.

如果你有听黄仁勋在今年GTC上演讲内容，会发现具身智能占到居多篇幅。

黄仁勋坚信下一波AI浪潮是物理AI，机器人时代已经到来，所有移动的物体都将实现自动化。

英伟达这次发布了Isaac机器人平台。

黄仁勋表示，我们正在努力通过推进英伟达机器人堆栈来加速生成物理 AI，包括用于模拟应用的Omniverse、Project GR00T人形基础模型和 Jetson Thor机器人计算机。

目前，Isaac 生态系统迅速扩张，包括西门子、比亚迪、Gideon、idealworks和RGo Robotics等都在与英伟达展开合作。

其他一系列新产品服务的落地情况，还有为专为AI打造的新型以太网Spectrum-X等。

一年前，黄仁勋曾在台大毕业典礼上提出了一个这样的问题：

2023年毕业的同学们，你们即将进入一个经历巨大变革的世界，就像我毕业时遇到个人电脑和芯片革命时一样，你们正处于AI的起跑线上。每个行业都将被革命、重生，为新思想做好准备——你们的思想。在40年的时间里，我们创造了个人电脑、网路、移动设备、云端技术。现在的AI时代，你们将创造什么？

彼时英伟达的市值超过了1万亿美元，这一时刻与生成式AI爆发对GPU需求增长的节点吻合。

05.

一年过后的现在，英伟达市值超过2.7万亿美元，成为直逼苹果挑战全球第二大市值地位的公司。

根据Google财经的数据，截止目前，苹果的市值为2.95万亿美元，而英伟达的市值为2.7万亿美元。参考路透社的解释认为，英伟达仍受益于人工智能热潮，但苹果目前正苦于IPhone需求疲软和中国市场的激烈竞争。

今年，英伟达市值已从1万亿美元增长到2万亿美元，一举超越亚马逊、谷歌和沙特的石油公司。

这不禁让智驾网想到此前在社交平台上看到的一幕——

一位国外网友在社交平台评论称：“一百年后，人们会记得苹果还是英伟达？”

另一位网友模仿老黄的口吻回答：“the future is generative AI！”

-PG电子(中国)官方网站

返回列表