跳出芯片内卷:英伟达GTC2026,藏着AI算力的全新胜负手

2026-03-18 16:07:23 - 佚名

3月17日,黄仁勋身着标志性皮夹克,在英伟达GTC2026大会上做了长达两小时的演讲。会后全网热议纷纷,不少人把焦点放在“英伟达要抢占Token话语权”上,可真正吃透这场演讲的人都清楚,黄仁勋反复强调的核心,从来不是Token本身,而是Tokens per Watt(每瓦Token数)这个关键指标。



展示推理性能数据时,黄仁勋直白点出这个核心概念,还说了一句戳破行业本质的话:所有AI数据中心、AI工厂,最终都逃不开电力限制,这是无法突破的物理定律。1吉瓦功率的算力工厂,永远不可能凭空变成2吉瓦,在固定能耗框架下,谁能让每一度电产出更多Token,谁就能把成本压到最低,谁的盈利增速就会遥遥领先。

这句话,才是本届GTC2026真正的核心精髓,也是AI行业即将迎来大变局的信号。

外界热衷于讨论新款Vera Rubin芯片比上代Blackwell强几倍、Groq LPX推理速度飙升35倍、英伟达畅想太空数据中心这些热点,这些技术突破固然亮眼,但归根结底都是同一个逻辑:在能源越来越紧缺的大背景下,想尽办法让每一分电力转化成最大化的智能价值。

当黄仁勋把每瓦Token数定为AI工厂的核心考核标准,意味着AI算力的评判体系正在彻底洗牌:不再只盯着单颗芯片的峰值参数,而是转向全系统端到端能效;不再比拼谁的芯片跑得更快,而是比拼谁的能源转化智能效率更高。哪怕是行业龙头英伟达,现阶段也没能攻克每瓦Token数的瓶颈,距离真正掌控Token话语权,还有很长的路要走。

这场评判标准的迁移,带来的产业思考远比一款新芯片更有价值。无独有偶,GTC大会开幕前一天,阿里巴巴官宣成立Alibaba Token Hub,由吴泳铭亲自牵头掌舵,直接把Token提升到AI战略核心位置,而非用传统AI概念命名核心业务。这也印证了,用系统化思维看待AI产业,已经成为全行业的新共识,这也是本文想传递的核心观点。

01 别只盯新芯片!GTC2026的变局藏在系统里

本届GTC2026,Vera Rubin、Rubin POD、LPX、DSX AI Factory等新品和新概念刷屏,大众目光依旧聚焦在硬件迭代上。可把这些发布串联起来看就能发现,英伟达已经把算力竞争的战场,从单颗芯片延伸到了整套算力基础设施,也就是集计算、网络、存储、电力、散热、管控软件于一体的AI工厂。

Rubin芯片被定义为机柜级平台,多台机架协同形成规模化连贯系统;DSX则是专为AI工厂打造的标杆设计,核心目标就是提升每瓦Token产出效率。这足以说明,AI行业的竞争逻辑变了:不再是单颗芯片算力高低的比拼,而是整个计算系统综合实力的较量,说白了就是能不能把有限的电力、散热、网络资源,高效整合为稳定的AI产出。

而衡量这份实力的核心标尺,就是每瓦Token数。本文就围绕这个全新标尺,拆解GTC2026的深层意义,以及给国内AI基础设施产业带来的发展机遇。

02 竞争升级到系统,评判标准不能还停留在芯片层

芯片主导的时代,行业评判标准大家都耳熟能详:峰值算力Flops、显存带宽、FLOPS/W、TOPS/W等指标,这些数据能清晰体现单个硬件的性能上限,但也带来了一个行业痛点:智算中心始终缺乏统一、客观、通用的考核标准。

日常衡量数据中心,常用兆瓦(MW)作为电力单位;国内建设智算中心,又习惯用PFlops(FP16精度)作为算力单位。可问题在于,即便算力、电力指标相同,芯片型号、网络架构、散热方案不同,整体运行效能也会天差地别。

究其原因,传统指标都只是单一维度的考核:峰值算力只是芯片理论计算上限,bit/J只是局部数据传输能效,带宽只是单个子系统的传输能力,都只能反映芯片局部性能。但一套完整的AI系统,最终要解决的问题是:在固定功率、散热、机房条件下,能产出多少实际可用的AI成果,这是单一芯片指标根本无法回答的。

从英伟达本届大会的表述中能明显感受到,行业开始聚焦Token成本、每瓦吞吐量、每瓦Token性能等全新指标,算力评判语言正在从“部件话术”转向“系统话术”。如果说芯片层看峰值算力、带宽,那系统层就该看每瓦Token数,前者考核局部性能,后者衡量整体价值,前者追求单点最优,后者实现全局共赢。

03 每瓦Token数:打通能源到智能的核心链条

英伟达在GTC2026演讲稿中,把Token定义为现代AI的“基础单元”,这个定位精准又贴切。不管是大语言模型、推理服务还是智能代理系统,用户真正付费的核心,就是系统生成、处理Token的能力。

从商业运营角度来看,Token有三大不可替代的优势:一是和模型推理流程深度绑定,二是直接对接盈利模式,三是适配推理时代各类新型负载。智能代理、多轮对话、长上下文、检索增强、工具调用等新场景,很难用单一FLOPS指标衡量,却能通过Token、延迟、有效吞吐量清晰体现价值。

更关键的是,当下AI产业的底层限制,已经越来越明显地指向能源约束。国际能源署《能源与AI》报告预测,2030年全球数据中心用电量将飙升至945太瓦时,AI是核心驱动力,美国更是占比极高。这意味着,AI产业很多看似是芯片的问题,本质都是电力、散热、基础设施统筹的问题。

每瓦Token数的价值,就在于打通了AI产业最核心的链路:电力输入后,经过计算、网络、存储、调度、散热等全环节流转,最终转化为Token产出。它不是简单替代FLOPS/W、bit/J等传统指标,而是补上了行业此前忽略的关键视角:AI系统到底能把多少能源,转化为实实在在的智能成果。

这也是本届GTC最值得深思的点:看待AI芯片,不能再孤立看参数,必须把芯片放到系统中,把系统放到产业约束里综合考量。当英伟达把战略重心转向AI工厂,意味着行业正在告别“芯片中心主义”,迈入“系统中心主义”新阶段。

很多产业初期都沉迷于部件参数,毕竟参数易测量、易宣传,但进入规模化落地阶段,系统整合能力才是决胜关键,如今AI基础设施恰好走到了这个转折点。

04 每瓦Token数成核心,光互连地位直线飙升

算力评判标准转向系统层,那些曾经被视为“配套”的技术,瞬间成为行业焦点,光互连就是最典型的代表。

以往谈及光互连,行业多从光模块、通信、器件角度出发,追求高带宽、远传输、低能耗、高密度,这些都是组件层面的考量。而在每瓦Token数的评判框架下,光互连的价值变得更直白:降低数据传输的能耗成本,提升大规模AI系统的电力转化Token效率。

英伟达发布的光子CPO技术,相比传统光模块能效提升5倍,还能降低延迟、支撑AI工厂规模化扩张。这项技术的核心优势,不只是传输链路更先进,而是让系统规模更大、整体能效更高。

从产业逻辑来看,随着模型体积增大、上下文拉长、集群规模扩张,AI系统的大部分能耗,并不在计算单元,而是消耗在数据传输上——跨芯片、跨板卡、跨机柜、跨集群的通信能耗占比越来越高。想提升每瓦Token数,单靠升级GPU远远不够,高效光互连成为必选项。

换句话说,发展光互连不是因为技术新潮,而是大规模AI系统节能增效的刚需。

05 光计算更前沿,产业化逻辑逐渐清晰

相比光互连,光计算技术还处于早期发展阶段,通用性、精度、编译器、量产一致性、系统集成等难题仍在攻克,但从系统能效角度来看,它的产业价值已经越来越清晰。

每瓦Token数追求的是端到端能效,光计算不需要替代整个GPU,也不用一步成为通用计算底座,只要能在高频、高密度、可重复的计算场景中,大幅降低能耗,就能提升系统Token产出效率。

以往光计算只看TOPS/W、MAC/J等器件指标,更像实验室技术;但转向每瓦Token数的系统评判后,光计算就能切入基础设施落地讨论,拥有了和客户、园区、电力、资本对接的通用语言,这对光计算产业化至关重要。

06 算力评判转向系统,光学技术站上产业C位

算力竞争停留在芯片层时,光互连只是辅助I/O技术,光计算只是前沿探索;但当竞争升级到AI系统基础设施,二者直接成为产业主线。AI系统效率取决于计算能耗、数据传输、上下文管理、节点协同、供电散热统筹,这些恰恰是光学技术的优势领域。

从每瓦Token数角度分析,光互连解决的是Token生成过程中的“传输电费”,光计算主攻“计算电费”,二者共同提升系统整体产出效率,这也是它们跻身产业核心的根本原因。

现实层面,AI工厂除了芯片产能,还面临电网接入、机房散热、园区能耗、机柜功率、投产速度等多重约束。国际能源署的能耗预判、英伟达的AI工厂战略,都指向同一个趋势:AI基础设施已经成为能源导向的系统工程。

传统电学方案难以优化的数据传输、高密度计算能耗,正是光互连和光计算的突破方向。这也是GTC2026重点提及光子、硅光技术的原因:当算力评判从芯片走向系统,光学技术就从前沿备选,变成了AI基础设施的核心建设方向,CPO、光计算系统的未来发展极具想象空间。

写在最后:AGI进阶的核心主轴

长期以来,我一直倡导建立客观统一的算力度量标准,也坚持用每瓦Token数评估各类算力芯片的实际性能。回顾科技发展史,内燃机的能效比不断突破,才催生了汽车、飞机、火箭;放到AI时代,只有AI系统的智能产出(Token)与能耗比值持续提升,智能水平才会不断进阶,AGI才有可能实现。

本届GTC2026真正值得铭记的,不是英伟达的技术秀,也不是黄仁勋的“Token之王”标签,而是AI产业确立了全新的度量衡。英伟达、阿里等行业巨头,已经纷纷转向系统化思维布局AI,这恰恰契合人类文明发展的核心逻辑:用更低的能耗,实现更多信息的采集、传输与处理。

朱可人:深耕EDA领域,以热忱解锁芯片设计新可能
« 上一篇 2026年03月18日
小米重磅上新!匿名爆款大模型揭晓真身,全面入局智能体时代
下一篇 » 2026年03月19日