黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图）

2026-03-17 来源：华尔街见闻原文链接评论0条

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 1

2026年3月16日，英伟达GTC 2026大会正式开幕，英伟达创始人兼CEO黄仁勋发表了主题演讲。

在这场被视为“AI行业年度朝圣”的大会上，黄仁勋阐述了英伟达从一家“芯片公司”向“AI基础设施和工厂公司”的蜕变。面对市场最关心的业绩持续性与增长空间问题，黄仁勋详细拆解了驱动未来增长的底层商业逻辑——“Token工厂经济学”。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 2

AI图片

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 3

业绩指引极度乐观，“2027年至少1万亿美元的需求”

过去两年，全球AI计算需求呈指数级爆炸。随着大模型从“感知”、“生成”进化到“推理”与“行动（执行任务）”，算力的消耗量急剧攀升。针对市场高度关注的订单与营收天花板，黄仁勋给出了极为强劲的预期。

黄仁勋在演讲中直言：去年这个时候，我说过，我们看到了5000亿美元的高确信度需求，覆盖Blackwell和Rubin直到2026年。现在，就在此时此地，我看到到2027年至少有1万亿美元的需求（at least $1 trillion）。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 4

黄仁勋的万亿预期一度推动英伟达股价涨超4.3%。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 5

不仅如此，他更是对这一数字做出了补充：这合理吗？这就是我接下来要讲的。事实上，我们甚至会供不应求。我确定，实际的计算需求会比这高得多。

黄仁勋指出，如今的英伟达系统已经证明了自己是全球“成本最低的基础设施”。由于英伟达能运行几乎所有领域的AI模型，这种通用性使得客户投入的这1万亿美元能够被充分利用并保持长久的生命周期。

目前，英伟达60%的业务来自排名前五的超大型云服务商，而另外40%的业务则广泛分布于主权云、企业、工业、机器人和边缘计算等各个领域。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 6

Token工厂经济学，每瓦性能决定商业命脉

为了解释这1万亿需求的合理性，黄仁勋向全球企业CEO展示了一套全新的商业思维。他指出，未来的数据中心不再是存储文件的仓库，而是生产Token（AI生成的基本单位）的“工厂”。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 7

黄仁勋强调：每一座数据中心、每一座工厂，从定义上来说都是受电力限制的。一座1GW（吉瓦）的工厂永远不会变成2GW，这是物理和原子的定律。在固定的功率下，谁的每瓦Token吞吐量最高，谁的生产成本就最低。

黄仁勋将未来的AI服务分为五个商业层级：免费层（高吞吐低速度）、中级层（约每百万token 3美元）、高级层（约每百万token 6美元）、高速层（约每百万token 45美元）以及超高速层（约每百万token 150美元）。

他指出，随着模型越来越大、上下文越来越长，AI会变得更聪明，但Token的生成速率会降低。黄仁勋表示：在这个Token工厂里，你的吞吐量和Token生成速度，将直接转化为你明年的精确收入。

黄仁勋强调英伟达的架构能够让客户在免费层实现极高的吞吐量。同时在最高价值的推理层级上，英伟达成功将性能提升了惊人的35倍。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 8

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 9

Vera Rubin两年实现350倍加速，Groq填补极速推理

在这个物理极限的约束下，英伟达介绍了其有史以来最复杂的AI计算系统Vera Rubin。黄仁勋表示：过去提到Hopper，我会举起一块芯片，那很可爱。但提到Vera Rubin，大家想到的是整个系统。

在这个100%液冷、完全消灭了传统线缆的系统中，过去需要两天安装的机架，现在只需两小时。通过极致的端到端软硬件协同设计，Vera Rubin在同一座1GW数据中心里创造了惊人的数据跨越。

在短短两年时间内，英伟达将Token的生成速率从2200万提升到了7亿，实现了350倍的增长。与此同时，摩尔定律在相同周期内仅能带来约1.5倍的提升。

为了解决极速推理条件下的带宽瓶颈，英伟达给出了整合被收购公司Groq的最终方案：非对称式的分离推理。黄仁勋解释道：这两款处理器的特点截然不同。Groq芯片拥有500MB的SRAM，而一颗Rubin芯片拥有288GB的内存。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 10

英伟达通过Dynamo软件系统，将需要海量计算和显存的“预填充”阶段交给Vera Rubin，将对延迟极度敏感的“解码”阶段交给Groq。

黄仁勋对企业算力配置给出建议：如果工作主要是高吞吐，应100%使用Vera Rubin；如果有大量高价值编程级别的Token生成需求，建议拿出25%的数据中心规模给Groq。

据透露，由三星代工的Groq LP30芯片已在量产，预计第三季度出货。目前首个Vera Rubin机架已在微软Azure云上运行。

此外，针对光互联技术，黄仁勋展示了全球首款量产的共封装光学（CPO）交换机Spectrum X。他平息了市场对于“铜退光进”的路线之争，表示需要更多的铜缆产能、光芯片产能以及CPO产能。

黄仁勋GTC演讲全文：推理时代到来，龙虾就是新操作系统（组图） - 11

Agent终结传统SaaS，“年薪+Token”成硅谷标配

除了硬件壁垒，黄仁勋把大量篇幅留给了AI软件和生态的革命，特别是Agent（智能体）的爆发。他将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”，称其仅用几周时间就超越了Linux在过去30年取得的成就。

黄仁勋断言：每一个SaaS（软件即服务）公司都将变成AaaS（智能体即服务）公司。为了让具备敏感数据访问能力的智能体安全落地，英伟达推出了企业级NeMo Claw参考设计，增加了策略引擎和隐私路由器。

对于普通职场人，这场变革同样近在咫尺。黄仁勋描绘了未来的职场新形态：在未来，我们公司的每一位工程师都需要一个年度Token预算。

他们的基础年薪可能是几十万美元，我会在此基础上再拿出约一半的金额作为Token额度，让他们实现10倍的效率提升。这已成为硅谷的新招聘筹码：你的offer里带多少Token？

演讲最后，黄仁勋还“剧透”了下一代计算架构Feynman，它将首次实现铜线与CPO的共同水平扩展。更引人遐想的是，英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”，将AI算力延伸至地球之外。

(以下为黄仁勋GTC 2026演讲全文翻译，经由AI工具辅助整理)

主持人：欢迎英伟达创始人兼首席执行官黄仁勋上台。

黄仁勋：欢迎来到GTC。我想提醒大家，这是一场技术大会。能看到这么多人一大早排队入场，我感到非常高兴。在GTC，我们将聚焦三大主题：技术、平台和生态系统。

英伟达目前拥有三大平台：CUDA-X平台、系统平台，以及我们最新推出的AI工厂平台。在正式开始之前，我要感谢我们的预热环节主持人——Conviction的Sarah Guo、红杉资本的Alfred Lin，以及英伟达第一位主要机构投资人Gavin Baker。

我同样要感谢今天到场的所有企业。英伟达是一家平台公司，今天到场的企业代表了价值100万亿美元行业中几乎全部的参与者，共有450家公司赞助了本次活动。本次大会共设有1,000场技术论坛、2,000位演讲嘉宾，覆盖了人工智能架构的每一个层级。

CUDA：二十年的技术积淀

一切的起点就在这里。今年是CUDA诞生二十周年。二十年来，我们始终致力于这一架构的研发。CUDA是一项革命性的发明，SIMT技术允许开发者以标量代码编写程序并扩展为多线程应用。

我们最近还新增了Tiles功能，帮助开发者更便捷地编程张量核心（Tensor Core）。目前，CUDA已拥有数千种工具和库，在开源社区中有数十万个公开项目，并已深度集成到每一个技术生态系统之中。

历经二十年，我们已在全球范围内积累了数亿块运行CUDA的GPU和计算系统。庞大的装机量吸引开发者，开发者创造新算法并取得突破，此飞轮正持续加速。

更重要的是，它赋予了基础设施极长的使用寿命。由于NVIDIA CUDA上运行的应用极为丰富，即便我们六年前发布的Ampere架构GPU，其云端价格反而在上涨。我们愿意为全球每一块GPU提供长期支持，因为它们在架构上完全兼容。

从GeForce到CUDA：二十五年的演进之路

我们与CUDA的旅程实际上早在二十五年前就开始了。GeForce是英伟达最成功的市场推广项目，在用户还是学生时就开始培养。二十五年前，我们发明了可编程着色器，五年后我们创造了CUDA，并将绝大部分利润押注于此。

正是像素着色器推动了GeForce的革命。大约八年前，我们推出了RTX，为现代计算机图形时代进行了架构革新。GeForce将CUDA带给了全世界，让学术界发现GPU可以加速深度学习，由此点燃了人工智能大爆炸。

今天，我要向大家展示未来。这是我们的下一代图形技术，我们称之为神经渲染（Neural Rendering）——3D图形与人工智能的深度融合。这就是DLSS 5，请看。

神经渲染：结构化数据与生成式AI的融合

计算机图形就此焕发生机。我们将可控的3D图形与其结构化数据相结合，再融入生成式AI和概率计算。最终的内容既美观惊艳，又完全可控。结构化信息与生成式AI融合这一理念，将在不同行业不断复现。

结构化数据与非结构化数据的加速平台

在AI时代，我们需要让AI来使用结构化数据，并实现极致加速。过去加速数据处理是为了提升效率，未来AI将以远超人类的速度使用这些数据，智能体也将大量调用结构化数据库。

非结构化数据约占每年生成数据的90%。过去这些数据极难利用，而现在AI可以借助多模态感知理解PDF、视频、音频的语境。为此英伟达创建了两个基础库：用于结构化数据的cuDF和用于非结构化数据的cuVS。

今天我们宣布与多家企业达成合作。IBM将使用cuDF加速WatsonX Data平台；Dell联手英伟达打造AI数据平台。同时Google Cloud不仅加速Vertex AI，还加速了BigQuery。

与云服务商的深度合作

英伟达与主要云服务商有着深度合作。在Google Cloud，我们与其JAX/XLA深度集成，是全球唯一在PyTorch和JAX上均表现卓越的加速器。

在AWS，我们正与其深度集成SageMaker和Bedrock，并将OpenAI引入AWS，推动其云计算业务增长。

至于Microsoft Azure，它是第一台部署英伟达100 PFLOPS超算的云平台，奠定了与OpenAI合作的基础。英伟达GPU还是全球首批支持保密计算的GPU，确保运营商也无法查看用户数据。

英伟达同时也是Oracle的第一个AI客户，并为其引入了多位合作伙伴。CoreWeave作为AI原生云，也展现出强劲的增长势头。

垂直整合，横向开放：英伟达的核心战略

英伟达是全球第一家垂直整合、横向开放的公司。加速计算不仅是芯片问题，更是应用加速。未来唯有通过领域特定的加速，才能持续带来性能飞跃和成本下降。

我们必须理解应用、领域和算法，并将其部署在从云端到机器人的任何场景。同时英伟达保持横向开放，愿意将技术整合进任何合作伙伴的平台。

本次GTC参会者中，金融服务行业的比例最高。我们的生态系统覆盖了上下游供应链，无论百年企业还是初创公司，去年都迎来了历史最佳年份。我们正处于一个重大事件的起点。

CUDA-X：各行业的加速计算引擎

英伟达在自动驾驶、金融、医疗、工业等多个领域均已深度布局。量产金融正迎来其“Transformer时刻”，医疗健康行业也在经历“ChatGPT时刻”。

工业界正开展最大规模的建设浪潮，AI工厂纷纷落地。在机器人领域，我们深耕十余年，三大计算机架构齐备，本次展会共有110款机器人亮相。

这一切的核心正是CUDA-X库，这是英伟达作为算法公司的根本。其中cuDNN库彻底革新了人工智能。刚才看到的仿真均为物理AI模型，没有任何手工动画，这正是英伟达的核心能力。

AI原生企业与新计算时代

过去两年，风险投资流入AI初创企业的资金规模达到1,500亿美元，创下历史之最。每一家此类公司都需要大量计算资源。这个行业正在创造、生成token，或者为token增值。

正如PC和互联网革命孕育了时代企业，这一代平台变革也将诞生一批极具影响力的公司，成为未来世界的重要力量。

推动这一切的三大历史性突破

过去两年发生了三件大事。首先是ChatGPT开启了生成式AI时代，计算从检索式转变为生成式。其次是以o1为代表的推理AI，让AI能够自我反思和规划。

第三是Claude Code等智能体模型的出现，彻底革新了软件工程。英伟达没有一位软件工程师不借助AI助力。过去两年，推理所需的计算量增长了约10,000倍。如果算力充足，收入就会提升，推理拐点已然到来。

万亿美元的AI基础设施时代

去年我表示2026年之前的需求约为5,000亿美元。今天我站在这里告诉大家：展望到2027年，我看到的数字至少是1万亿美元。由于英伟达能运行所有领域的AI模型，通用性使我们成为成本最低的平台。

2025：英伟达推理年

2025年是英伟达的推理年。我们希望确保在AI生命周期的每个阶段都保持卓越，使基础设施有效使用寿命更长。目前Anthropic和Meta已加入英伟达平台，代表了全球三分之一的AI算力需求。

目前英伟达60%的业务来自超大规模云服务商，剩余40%遍布主权云、企业及边缘计算。AI覆盖的广度正是其韧性所在。

Grace Blackwell与NVLink 72：大胆的架构革新

在Hopper鼎盛时期，我们就决定重构系统。Grace Blackwell NVLink 72是一次巨大的技术押注。我们推出的NVFP4可以在无精度损失的情况下实现推理，并带来巨大的性能提升。

英伟达的推理性能遥遥领先，每token成本全球最低。原本摩尔定律可能带来1.5倍提升，但英伟达做到了35倍。这就是极致协同设计的力量。

AI工厂：从数据中心到token工厂

数据中心未来是生产token的工厂，token工厂效率将成为核心经营指标。token是新的大宗商品，将根据吞吐量和速度分层定价。

与Hopper相比，Grace Blackwell在最高价值层提升了35倍吞吐量。以简化模型估算，Grace Blackwell可比Hopper多产生5倍的收入。

Vera Rubin：下一代AI计算系统

Vera Rubin是一个完整的端到端系统。它包含专为智能体设计的CPU和存储平台BlueField 4。CPO Spectrum X交换机已全面量产，支持144块GPU组成单一机架。

该系统已实现100%液冷，安装时间从两天缩短至两小时。Satya Nadella已确认，首台Vera Rubin机架已在微软Azure上线运行。

Groq整合：推理性能的极致延伸

我们通过Dynamo软件系统将推理管线解聚。前填充及注意力机制解码在Vera Rubin上完成，而token生成的解码部分则在Groq上完成。

两者通过以太网紧密耦合，将延迟减少约一半。Groq LP30目前已进入量产，预计Q3开始出货。

推理性能的历史性飞跃

在短短2年内，1吉瓦AI工厂的token生成速率将提升350倍。英伟达的技术路线图明确了Blackwell、Vera Rubin及下一代Feynman架构的演进。

我们需要合作伙伴在铜缆、光纤和CPO方面持续扩产。同时，英伟达创建了Omniverse DSX平台，供合作伙伴在虚拟世界中共同设计吉瓦级AI工厂。

此外，英伟达正进军太空。Thor芯片已在卫星中运行，我们正与合作伙伴开发太空数据中心Vera Rubin Space-1，攻克热管理挑战。

OpenClaw：智能体时代的操作系统

OpenClaw是智能体计算机的操作系统，其影响力堪比Window或Linux。每一家SaaS公司都将转变为智能体即服务（AaaS）公司。

为了解决安全挑战，英伟达推出了NeMo Claw参考框架和Open Shield安全层，提供策略引擎和隐私路由。未来，企业每一位工程师都将拥有Token预算，这已成为硅谷招聘的新筹码。

NVIDIA开放模型倡议及总结

英伟达在多个领域提供前沿模型，并成立Nemotron联盟，投资数十亿美元推进研发。在物理AI领域，本次GTC展示了110款机器人。

自动驾驶方面，比亚迪、现代等新伙伴加入RoboTaxi项目，与Uber也达成重大合作。演讲最后，Olaf机器人惊艳亮相，展示了在Omniverse中学习走路的物理仿真能力。

黄仁勋最后总结道：推理拐点已至，数据中心已演变为Token工厂。OpenClaw开启了智能体计算时代，而具身智能则是物理AI的下一个重大机遇。

关键词：黄仁勋英伟达 GTC大会推理算力人工智能

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络[email protected]。