黄仁勋终于揭开了世界上最强人工智能(AI)芯片的神秘面纱。
北京时间3月19日周二凌晨,在一年一度的GTC大会上,英伟达CEO黄仁勋宣布推出AI超级芯片——Blackwell GB 200,将于今年晚些时候交付。
GB200采用新一代AI GPU Blackwell,是NVIDIA A100/H100系列AI GPU的继任者。在大语言模型推理的工作量上,Blackwell的性能比H100 GPU高30倍,但能耗低25倍。亚马逊、谷歌、微软、甲骨文将成为首批合作伙伴。
此外,黄仁勋还在GTC大会上推出了新的服务软件NIM、下一代AI超级计算机和英伟达项目GR00T人形机器人的基本模型,并宣布扩大与比亚迪等中国车企的合作。
“Hopper已经很优秀了,但是我们需要更强大的GPU。”黄仁勋在GTC会议上说。
演讲最后,黄仁勋坦言,“如果你问我心目中的GPU是什么样子,今天的发布就是我的答案。”
他说今天他展示了什么是英伟达的灵魂。我们站在计算科学、物理学和所有其他科学的交叉点上。这就是英伟达在他心中的地位。
每六个月更新一次AI芯片产品,英伟达为AI迎来了一个新的“摩尔定律”时代。
GTC大会五大亮点速览
英伟达GTC发布会有五大亮点:
新一代GPU Blackwell和芯片GB200英伟达CEO黄仁勋左手拿着Blackwell,右手拿着H100。
Blackwell GPU非常大,它是通过台积电的4NP工艺蚀刻的。它集成了两个独立制造的芯片,总共有2080亿个晶体管,比前身Hopper多1280亿个,并且用NVLink 5.0技术连接每个芯片,传输速度为每秒10 TB。
Blackwell GPU将作为一个完整的服务器提供给客户,命名为GB200 NVLink 2,它结合了72个Blackwell GPU和其他NVIDIA组件,用于训练AI模型。
基于Blackwell的GB200也有巨大的性能提升,AI性能为20 Petaflops(每秒千万亿次浮点运算),是H100的5倍。英伟达表示,额外的处理能力将允许人工智能公司训练更大、更复杂的模型。
GB200集成了两个B 200 GPUs和一个基于Arm的CPU。
根据英伟达的说法,亚马逊网络服务将建立一个拥有2万个GB200芯片的服务器集群。该系统可以部署一个具有27万亿个参数的模型。这甚至比目前最强大的大型号(如GPT-4)还要大。如果GPT-4有1.7万亿个参数,那么GB200芯片可以训练15个GPT-4。
DGX SuperPOD超级计算机系统
此外,英伟达还推出了DGX SuperPOD超级计算机系统。DGX SuperPOD由至少8个GB200芯片系统组成,包括36个Grace Blackwell 200超级芯片,它们被配对作为一台计算机运行。英伟达表示,客户可以根据自己的需求扩展SuperPOD,以支持数万个GB200超级芯片。
DGX SuperPOD采用了全新的液冷机架规模架构,这意味着系统通过一系列管道和散热器循环的流体进行冷却,而不是直接基于风扇的空风冷,效率变得更高、更经济。
黄仁勋坦言,英伟达DGX SuperPOD是一个AI数据中心基础设施平台,这使其能够为每一个用户和工作负载提供不妥协的性能。在DGX SuperPOD的帮助下,业界优秀的加速基础设施可以同时实现敏捷性和可扩展的性能,以应对具有挑战性的AI和高性能计算(HPC)工作负载,并获得业界认可的结果。
英伟达Project GR00T 人形机器人基础模型发布
NVIDIA今天发布了人形机器人通用基础模型Project GR00T,旨在进一步推动其在机器人技术和体现智能方面的突破。与此同时,英伟达还发布了基于英伟达Thor片上系统(SoC)的新型人形机器人计算机Jetson Thor,并对英伟达的Isaac机器人平台进行了重大升级,包括生成式人工智能基本模型和仿真工具,以及AI工作流基础设施。
据悉,英伟达GR00T驱动的机器人(代表通用机器人00技术)将能够通过观察人类行为来理解自然语言和模仿动作——快速学习协调性、灵活性和其他技能,以便导航、适应现实世界并与之互动。同时,Jetson Thor是一个全新的计算平台,可以执行复杂的任务,并安全自然地与人和机器进行交互,具有针对性能、功耗和尺寸进行优化的模块化架构。该SoC包括具有Transformer引擎的下一代GPU,采用Blackwell架构,每秒可提供800万亿次8位浮点运算AI性能,以运行GR00T等多模态生成式人工智能模型,从而集成功能安全处理器、高性能CPU集群和100GB以太网带宽,大大简化了设计和集成工作。
黄仁勋表示,Project GR00T平台支持的机器人将被设计成通过观察人类行为来理解自然语言和模仿动作,从而快速学习协调性、灵活性等技能,从而适应现实世界并与之互动,永远不会出现机器人起义。
英伟达表示,它正在为领先的人形机器人公司开发一个全面的人工智能平台,如1X Technologies,Agility Robotics,Apptronik,Boston Dynamics,Figure AI,Fourier Intelligent,Sanctuary AI,Yushu Technology和小鹏鹏航。
“开发通用人形机器人的基本模型是当今人工智能领域最令人兴奋的话题之一。世界各地的机器人领导者正在汇集各种使能技术,并致力于在人工通用机器人领域实现突破。”黄仁勋说。
据悉,英伟达新的Isaac平台功能将于下一季度推出。
英伟达新一代软件服务NIM
英伟达宣布在其企业软件订阅中增加一款名为NIM(英伟达影响力微服务)的新产品。NIM可以更容易地使用英伟达的老一代GPU进行推理或运行AI软件,并允许客户继续使用他们现有的数亿英伟达GPU。
英伟达希望吸引在英伟达购买服务器的客户在英伟达注册创业者。单个GPU的年使用费为4500美元。
英伟达将与微软合作,拥抱Face和其他公司,以确保他们的AI模型可以在所有兼容的英伟达芯片上运行。开发人员可以在自己的服务器或基于云的NVIDIA服务器上高效运行该模型,而无需冗长的配置过程。
英伟达还表示,NIM可以让AI在搭载GPU的笔记本电脑上运行,而不局限于云服务器。
在本次活动上,英伟达还宣布将与联想合作推出新的混合AI解决方案——ThinkSystem人工智能产品组合的扩展,包括两个新的强大的8通道英伟达GPU系统,专门针对生成式人工智能、自然语言处理(NLP)和大型模型开发,以加速AI的实施。帮助企业和云提供商获得AI时代成功所需的关键加速计算能力,将AI从概念变为现实,并为英伟达HGX AI计算平台进入市场提供支持。
此外,全新的联想ThinkSystem SR780a V3是采用联想海王液冷技术的5U系统,功率利用效率(PUE)高达1.1。通过回收温水来冷却数据中心系统,客户可以降低高达40%的功耗,并将散热性能提高3.5倍,比传统的风冷系统更高效,有助于节省宝贵的数据中心空。全新联想ThinkSystem SR680a V3为风冷双插槽系统,可为搭载英特尔处理器和英伟达GPU的复杂人工智能提供最大加速。
英伟达企业平台副总裁Bob Pette表示:“AI是一种强大的力量,可以帮助企业从数据中发现新的见解,提高生产力。联想全新的企业人工智能解决方案与英伟达技术的结合,标志着在增强人工智能计算性能方面的一个关键里程碑。它提供了一个企业可以信任的混合系统,几乎可以在任何地方支持生成式人工智能的运行。”
扩大与中国电动汽车制造商的合作
英伟达在GTC会议上宣布,它正在扩大与比亚迪等中国电动汽车制造商的合作。比亚迪将使用英伟达的下一代车载芯片Drive Thor来提高其自动驾驶和其他数字功能的水平。
与此同时,英伟达汽车业务副总裁丹尼·夏皮罗(Danny Shapiro)表示,比亚迪将利用英伟达的技术简化工厂和供应链,并开发虚拟展厅。“Drive Thor明年会进入比亚迪”,丹尼说。
英伟达还将扩大与广汽爱安旗下Xpeng Motors和Hyper品牌的合作。吉利的氪汽车和李此前表示,他们将使用英伟达的驱动雷神技术。
AI“卖铲王”还能狂飙多久?
新一代GPU Blackwell和芯片GB200能否延续英伟达高增长的“神话”?
众所周知,在过去的一年多时间里,英伟达的A100/H100系列AI GPU供不应求,占据了全球高端AI芯片市场80%的份额。
微软、Meta、谷歌母公司Alphabet、亚马逊、甲骨文都是英伟达的忠实客户。其中,微软和Meta 2023年在NVIDIA的H100芯片上至少花费了90亿美元。
这些科技巨头对AI芯片的需求推动英伟达的市值在过去14个月里增长了600%,最新价值超过2.5万亿美元,成为全球第三大科技巨头,仅次于微软和苹果。英伟达在基准标准普尔500指数中的权重也超过了5%。
英伟达飙升的业绩和股价使其成为全球最受关注的公司之一,但这种势头能持续多久?
跟踪半导体行业的Futurum Research的首席执行官丹尼尔·纽曼此前表示:“英特尔曾经是该行业的霸主。现在,许多公司正在联合起来,以确保英伟达不会变得太强大。”
事实上,越来越多的竞争对手试图从英伟达手中抢夺AI芯片市场份额。
今年2月,英特尔首席执行官帕特·基尔辛格明确表示,英特尔将制造尽可能多的人工智能芯片。盖尔·辛格上任以来,一直致力于推动公司进入芯片代工业务,并承诺投资200亿美元在俄亥俄州建设新工厂。
严重依赖英伟达芯片的OpenAI最近被披露将筹集近7万亿美元,以推动该公司在人工智能芯片等基础设施方面的计划。OpenAI首席执行官萨姆·奥特曼表示:“事实的核心是,我们认为世界将需要更多(芯片)用于人工智能计算。这将需要多方面的全球投入,超出我们的想象。”
占英伟达AI芯片销量40%的微软、Meta、亚马逊、Alphabet都在为自己的数据中心开发自己的AI芯片。这意味着,未来英伟达从这四大科技巨头那里获得的采购将会更少。
另一个让英伟达感到不安的因素是,美国监管机构一直在积极限制向中国这个世界第二大经济体出口高性能AI GPU。在第一轮限制之后,NVIDIA为中国市场开发了其强大的AI GPU A800和H800的简化版本。
然而,2023年10月,美国商务部下属的工业安全局(BIS)发布了一系列新的管制文件,扩大了对中国出口先进芯片的管制范围。涉及的型号包括英伟达、A100、A800、H100、H800和L40S五款GPU显卡。英伟达首席执行官黄仁勋公开表示,美国的新禁令将对英伟达在中国市场的销售产生重大影响,但公司仍将遵守美国的法规。
外患之下有内忧。
随着英伟达增加其最畅销GPU的产量,该公司的毛利率可能会被削弱。英伟达第四季度财报显示,数据中心销售额增速比营收成本增速快很多倍。这说明推动公司销售增长的是定价能力,而不是销量的增长。随着GPU的稀缺性逐渐减弱,NVIDIA强大的定价能力也会减弱。
然而,黄仁勋在GTC会议上似乎很自信:“生成式人工智能是我们这个时代的决定性技术。Blackwell GPU是推动这场新工业革命的引擎。与世界上最具活力的公司合作,我们将实现AI对每个行业的承诺。”
(本文为首个钛媒体App,任、林志佳撰写,林志佳编辑)
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。