最好看的新闻,最实用的信息
06月04日 16.6°C-18.3°C
澳元 : 人民币=4.83
珀斯
今日澳洲app下载
登录 注册

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图)

2026-03-17 来源: 华尔街见闻 原文链接 评论0条

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 1

2026年3月16日,英伟达GTC 2026大会正式开幕,英伟达创始人兼CEO黄仁勋发表了主题演讲。

在这场被视为“AI行业年度朝圣”的大会上,黄仁勋阐述了英伟达从一家“芯片公司”向“AI基础设施和工厂公司”的蜕变。面对市场最关心的业绩持续性与增长空间问题,黄仁勋详细拆解了驱动未来增长的底层商业逻辑——“Token工厂经济学”。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 2

AI图片

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 3

业绩指引极度乐观,“2027年至少1万亿美元的需求”

过去两年,全球AI计算需求呈指数级爆炸。随着大模型从“感知”、“生成”进化到“推理”与“行动(执行任务)”,算力的消耗量急剧攀升。针对市场高度关注的订单与营收天花板,黄仁勋给出了极为强劲的预期。

黄仁勋在演讲中直言:去年这个时候,我说过,我们看到了5000亿美元的高确信度需求,覆盖Blackwell和Rubin直到2026年。现在,就在此时此地,我看到到2027年至少有1万亿美元的需求(at least $1 trillion)。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 4

黄仁勋的万亿预期一度推动英伟达股价涨超4.3%。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 5

不仅如此,他更是对这一数字做出了补充:这合理吗?这就是我接下来要讲的。事实上,我们甚至会供不应求。我确定,实际的计算需求会比这高得多。

黄仁勋指出,如今的英伟达系统已经证明了自己是全球“成本最低的基础设施”。由于英伟达能运行几乎所有领域的AI模型,这种通用性使得客户投入的这1万亿美元能够被充分利用并保持长久的生命周期。

目前,英伟达60%的业务来自排名前五的超大型云服务商,而另外40%的业务则广泛分布于主权云、企业、工业、机器人和边缘计算等各个领域。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 6

Token工厂经济学,每瓦性能决定商业命脉

为了解释这1万亿需求的合理性,黄仁勋向全球企业CEO展示了一套全新的商业思维。他指出,未来的数据中心不再是存储文件的仓库,而是生产Token(AI生成的基本单位)的“工厂”。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 7

黄仁勋强调:每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座1GW(吉瓦)的工厂永远不会变成2GW,这是物理和原子的定律。在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低。

黄仁勋将未来的AI服务分为五个商业层级:免费层(高吞吐低速度)、中级层(约每百万token 3美元)、高级层(约每百万token 6美元)、高速层(约每百万token 45美元)以及超高速层(约每百万token 150美元)。

他指出,随着模型越来越大、上下文越来越长,AI会变得更聪明,但Token的生成速率会降低。黄仁勋表示:在这个Token工厂里,你的吞吐量和Token生成速度,将直接转化为你明年的精确收入。

黄仁勋强调英伟达的架构能够让客户在免费层实现极高的吞吐量。同时在最高价值的推理层级上,英伟达成功将性能提升了惊人的35倍。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 8

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 9

Vera Rubin两年实现350倍加速,Groq填补极速推理

在这个物理极限的约束下,英伟达介绍了其有史以来最复杂的AI计算系统Vera Rubin。黄仁勋表示:过去提到Hopper,我会举起一块芯片,那很可爱。但提到Vera Rubin,大家想到的是整个系统。

在这个100%液冷、完全消灭了传统线缆的系统中,过去需要两天安装的机架,现在只需两小时。通过极致的端到端软硬件协同设计,Vera Rubin在同一座1GW数据中心里创造了惊人的数据跨越。

在短短两年时间内,英伟达将Token的生成速率从2200万提升到了7亿,实现了350倍的增长。与此同时,摩尔定律在相同周期内仅能带来约1.5倍的提升。

为了解决极速推理条件下的带宽瓶颈,英伟达给出了整合被收购公司Groq的最终方案:非对称式的分离推理。黄仁勋解释道:这两款处理器的特点截然不同。Groq芯片拥有500MB的SRAM,而一颗Rubin芯片拥有288GB的内存。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 10

英伟达通过Dynamo软件系统,将需要海量计算和显存的“预填充”阶段交给Vera Rubin,将对延迟极度敏感的“解码”阶段交给Groq。

黄仁勋对企业算力配置给出建议:如果工作主要是高吞吐,应100%使用Vera Rubin;如果有大量高价值编程级别的Token生成需求,建议拿出25%的数据中心规模给Groq。

据透露,由三星代工的Groq LP30芯片已在量产,预计第三季度出货。目前首个Vera Rubin机架已在微软Azure云上运行。

此外,针对光互联技术,黄仁勋展示了全球首款量产的共封装光学(CPO)交换机Spectrum X。他平息了市场对于“铜退光进”的路线之争,表示需要更多的铜缆产能、光芯片产能以及CPO产能。

黄仁勋GTC演讲全文:推理时代到来,龙虾就是新操作系统(组图) - 11

Agent终结传统SaaS,“年薪+Token”成硅谷标配

除了硬件壁垒,黄仁勋把大量篇幅留给了AI软件和生态的革命,特别是Agent(智能体)的爆发。他将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了Linux在过去30年取得的成就。

黄仁勋断言:每一个SaaS(软件即服务)公司都将变成AaaS(智能体即服务)公司。为了让具备敏感数据访问能力的智能体安全落地,英伟达推出了企业级NeMo Claw参考设计,增加了策略引擎和隐私路由器。

对于普通职场人,这场变革同样近在咫尺。黄仁勋描绘了未来的职场新形态:在未来,我们公司的每一位工程师都需要一个年度Token预算。

他们的基础年薪可能是几十万美元,我会在此基础上再拿出约一半的金额作为Token额度,让他们实现10倍的效率提升。这已成为硅谷的新招聘筹码:你的offer里带多少Token?

演讲最后,黄仁勋还“剧透”了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展。更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”,将AI算力延伸至地球之外。

(以下为黄仁勋GTC 2026演讲全文翻译,经由AI工具辅助整理)

主持人:欢迎英伟达创始人兼首席执行官黄仁勋上台。

黄仁勋:欢迎来到GTC。我想提醒大家,这是一场技术大会。能看到这么多人一大早排队入场,我感到非常高兴。在GTC,我们将聚焦三大主题:技术、平台和生态系统。

英伟达目前拥有三大平台:CUDA-X平台、系统平台,以及我们最新推出的AI工厂平台。在正式开始之前,我要感谢我们的预热环节主持人——Conviction的Sarah Guo、红杉资本的Alfred Lin,以及英伟达第一位主要机构投资人Gavin Baker。

我同样要感谢今天到场的所有企业。英伟达是一家平台公司,今天到场的企业代表了价值100万亿美元行业中几乎全部的参与者,共有450家公司赞助了本次活动。本次大会共设有1,000场技术论坛、2,000位演讲嘉宾,覆盖了人工智能架构的每一个层级。

CUDA:二十年的技术积淀

一切的起点就在这里。今年是CUDA诞生二十周年。二十年来,我们始终致力于这一架构的研发。CUDA是一项革命性的发明,SIMT技术允许开发者以标量代码编写程序并扩展为多线程应用。

我们最近还新增了Tiles功能,帮助开发者更便捷地编程张量核心(Tensor Core)。目前,CUDA已拥有数千种工具和库,在开源社区中有数十万个公开项目,并已深度集成到每一个技术生态系统之中。

历经二十年,我们已在全球范围内积累了数亿块运行CUDA的GPU和计算系统。庞大的装机量吸引开发者,开发者创造新算法并取得突破,此飞轮正持续加速。

更重要的是,它赋予了基础设施极长的使用寿命。由于NVIDIA CUDA上运行的应用极为丰富,即便我们六年前发布的Ampere架构GPU,其云端价格反而在上涨。我们愿意为全球每一块GPU提供长期支持,因为它们在架构上完全兼容。

从GeForce到CUDA:二十五年的演进之路

我们与CUDA的旅程实际上早在二十五年前就开始了。GeForce是英伟达最成功的市场推广项目,在用户还是学生时就开始培养。二十五年前,我们发明了可编程着色器,五年后我们创造了CUDA,并将绝大部分利润押注于此。

正是像素着色器推动了GeForce的革命。大约八年前,我们推出了RTX,为现代计算机图形时代进行了架构革新。GeForce将CUDA带给了全世界,让学术界发现GPU可以加速深度学习,由此点燃了人工智能大爆炸。

今天,我要向大家展示未来。这是我们的下一代图形技术,我们称之为神经渲染(Neural Rendering)——3D图形与人工智能的深度融合。这就是DLSS 5,请看。

神经渲染:结构化数据与生成式AI的融合

计算机图形就此焕发生机。我们将可控的3D图形与其结构化数据相结合,再融入生成式AI和概率计算。最终的内容既美观惊艳,又完全可控。结构化信息与生成式AI融合这一理念,将在不同行业不断复现。

结构化数据与非结构化数据的加速平台

在AI时代,我们需要让AI来使用结构化数据,并实现极致加速。过去加速数据处理是为了提升效率,未来AI将以远超人类的速度使用这些数据,智能体也将大量调用结构化数据库。

非结构化数据约占每年生成数据的90%。过去这些数据极难利用,而现在AI可以借助多模态感知理解PDF、视频、音频的语境。为此英伟达创建了两个基础库:用于结构化数据的cuDF和用于非结构化数据的cuVS。

今天我们宣布与多家企业达成合作。IBM将使用cuDF加速WatsonX Data平台;Dell联手英伟达打造AI数据平台。同时Google Cloud不仅加速Vertex AI,还加速了BigQuery。

与云服务商的深度合作

英伟达与主要云服务商有着深度合作。在Google Cloud,我们与其JAX/XLA深度集成,是全球唯一在PyTorch和JAX上均表现卓越的加速器。

在AWS,我们正与其深度集成SageMaker和Bedrock,并将OpenAI引入AWS,推动其云计算业务增长。

至于Microsoft Azure,它是第一台部署英伟达100 PFLOPS超算的云平台,奠定了与OpenAI合作的基础。英伟达GPU还是全球首批支持保密计算的GPU,确保运营商也无法查看用户数据。

英伟达同时也是Oracle的第一个AI客户,并为其引入了多位合作伙伴。CoreWeave作为AI原生云,也展现出强劲的增长势头。

垂直整合,横向开放:英伟达的核心战略

英伟达是全球第一家垂直整合、横向开放的公司。加速计算不仅是芯片问题,更是应用加速。未来唯有通过领域特定的加速,才能持续带来性能飞跃和成本下降。

我们必须理解应用、领域和算法,并将其部署在从云端到机器人的任何场景。同时英伟达保持横向开放,愿意将技术整合进任何合作伙伴的平台。

本次GTC参会者中,金融服务行业的比例最高。我们的生态系统覆盖了上下游供应链,无论百年企业还是初创公司,去年都迎来了历史最佳年份。我们正处于一个重大事件的起点。

CUDA-X:各行业的加速计算引擎

英伟达在自动驾驶、金融、医疗、工业等多个领域均已深度布局。量产金融正迎来其“Transformer时刻”,医疗健康行业也在经历“ChatGPT时刻”。

工业界正开展最大规模的建设浪潮,AI工厂纷纷落地。在机器人领域,我们深耕十余年,三大计算机架构齐备,本次展会共有110款机器人亮相。

这一切的核心正是CUDA-X库,这是英伟达作为算法公司的根本。其中cuDNN库彻底革新了人工智能。刚才看到的仿真均为物理AI模型,没有任何手工动画,这正是英伟达的核心能力。

AI原生企业与新计算时代

过去两年,风险投资流入AI初创企业的资金规模达到1,500亿美元,创下历史之最。每一家此类公司都需要大量计算资源。这个行业正在创造、生成token,或者为token增值。

正如PC和互联网革命孕育了时代企业,这一代平台变革也将诞生一批极具影响力的公司,成为未来世界的重要力量。

推动这一切的三大历史性突破

过去两年发生了三件大事。首先是ChatGPT开启了生成式AI时代,计算从检索式转变为生成式。其次是以o1为代表的推理AI,让AI能够自我反思和规划。

第三是Claude Code等智能体模型的出现,彻底革新了软件工程。英伟达没有一位软件工程师不借助AI助力。过去两年,推理所需的计算量增长了约10,000倍。如果算力充足,收入就会提升,推理拐点已然到来。

万亿美元的AI基础设施时代

去年我表示2026年之前的需求约为5,000亿美元。今天我站在这里告诉大家:展望到2027年,我看到的数字至少是1万亿美元。由于英伟达能运行所有领域的AI模型,通用性使我们成为成本最低的平台。

2025:英伟达推理年

2025年是英伟达的推理年。我们希望确保在AI生命周期的每个阶段都保持卓越,使基础设施有效使用寿命更长。目前Anthropic和Meta已加入英伟达平台,代表了全球三分之一的AI算力需求。

目前英伟达60%的业务来自超大规模云服务商,剩余40%遍布主权云、企业及边缘计算。AI覆盖的广度正是其韧性所在。

Grace Blackwell与NVLink 72:大胆的架构革新

在Hopper鼎盛时期,我们就决定重构系统。Grace Blackwell NVLink 72是一次巨大的技术押注。我们推出的NVFP4可以在无精度损失的情况下实现推理,并带来巨大的性能提升。

英伟达的推理性能遥遥领先,每token成本全球最低。原本摩尔定律可能带来1.5倍提升,但英伟达做到了35倍。这就是极致协同设计的力量。

AI工厂:从数据中心到token工厂

数据中心未来是生产token的工厂,token工厂效率将成为核心经营指标。token是新的大宗商品,将根据吞吐量和速度分层定价。

与Hopper相比,Grace Blackwell在最高价值层提升了35倍吞吐量。以简化模型估算,Grace Blackwell可比Hopper多产生5倍的收入。

Vera Rubin:下一代AI计算系统

Vera Rubin是一个完整的端到端系统。它包含专为智能体设计的CPU和存储平台BlueField 4。CPO Spectrum X交换机已全面量产,支持144块GPU组成单一机架。

该系统已实现100%液冷,安装时间从两天缩短至两小时。Satya Nadella已确认,首台Vera Rubin机架已在微软Azure上线运行。

Groq整合:推理性能的极致延伸

我们通过Dynamo软件系统将推理管线解聚。前填充及注意力机制解码在Vera Rubin上完成,而token生成的解码部分则在Groq上完成。

两者通过以太网紧密耦合,将延迟减少约一半。Groq LP30目前已进入量产,预计Q3开始出货。

推理性能的历史性飞跃

在短短2年内,1吉瓦AI工厂的token生成速率将提升350倍。英伟达的技术路线图明确了Blackwell、Vera Rubin及下一代Feynman架构的演进。

我们需要合作伙伴在铜缆、光纤和CPO方面持续扩产。同时,英伟达创建了Omniverse DSX平台,供合作伙伴在虚拟世界中共同设计吉瓦级AI工厂。

此外,英伟达正进军太空。Thor芯片已在卫星中运行,我们正与合作伙伴开发太空数据中心Vera Rubin Space-1,攻克热管理挑战。

OpenClaw:智能体时代的操作系统

OpenClaw是智能体计算机的操作系统,其影响力堪比Window或Linux。每一家SaaS公司都将转变为智能体即服务(AaaS)公司。

为了解决安全挑战,英伟达推出了NeMo Claw参考框架和Open Shield安全层,提供策略引擎和隐私路由。未来,企业每一位工程师都将拥有Token预算,这已成为硅谷招聘的新筹码。

NVIDIA开放模型倡议及总结

英伟达在多个领域提供前沿模型,并成立Nemotron联盟,投资数十亿美元推进研发。在物理AI领域,本次GTC展示了110款机器人。

自动驾驶方面,比亚迪、现代等新伙伴加入RoboTaxi项目,与Uber也达成重大合作。演讲最后,Olaf机器人惊艳亮相,展示了在Omniverse中学习走路的物理仿真能力。

黄仁勋最后总结道:推理拐点已至,数据中心已演变为Token工厂。OpenClaw开启了智能体计算时代,而具身智能则是物理AI的下一个重大机遇。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]

友情链接: 华人找房 到家 今日支付Umall今日优选