告别唯Token论:AI定价正在经历一场价值重构
2026-04-20 15:06:37 - 佚名
2026年4月,AI行业的账本正在经历一场前所未有的“通货膨胀”。当OpenClaw(俗称“龙虾”)引爆全网,Token消耗量呈指数级飙升,开发者们还在热衷于比拼“谁的每千Token更便宜”。然而,当你真正试图计算一个Agent的月度账单时,会发现简单的乘法公式早已失效。

翻看Anthropic、OpenAI或Google的最新价目表,你会发现Token已不再是唯一的计量单位。会话运行时长(Session Runtime)、缓存写入(Cache Write)、联网搜索(Grounding)、甚至容器存储(Container Storage)都成为了独立的计费项。更有甚者,如Salesforce推出了Flex Credits,Intercom直接按“结果”(Outcome)收费。这标志着AI商业化的叙事逻辑已发生根本性逆转:我们不再仅仅是在购买“计算量”,而是在购买一段被组织起来的“智能劳动”。
这种变化并非简单的“涨价”,而是计费维度的裂变。过去,企业只需关注Token单价;现在,采购者必须面对一张复杂的“资源总账”。以Google Gemini为例,一次轻量级的检索任务,其搜索增强(Grounding)的费用可能是Token本身成本的40倍;而在Anthropic的架构中,缓存命中率的波动会直接改写成本结构。这意味着,AI成本的锚点已从单一的Token转向了任务形态——让AI查资料,钱花在搜索上;让AI写代码,钱花在推理上;让AI全天候待命,钱则花在运行时长上。
这种多维度的定价体系,正在倒逼企业重写预算语言。卖方的定价页先变了,买方的内部核算体系必须跟上。当官方账单将工具调用、会话时长和最终结果独立定价,企业内部如果还只盯着Token成本,就会出现严重的账实不符。Model Router(模型路由器)的角色因此变得至关重要,它不再只是挑选模型,更是在决定账单的结构。选错模型层级,预算重心就会整体偏移。
更深层的变化在于价值的沉淀。我们可以将AI经济看作一个五层结算栈:从底层的算力与Token(公用事业层),向上延伸至协议层、知识封装层、执行交付层,最终到达结果与责任层。越往底层,越像电力一样标准化、廉价化;越往顶层,越深地嵌入业务上下文与责任验收。
未来的商业模式将呈现明显的“哑铃型”分化:底层依赖规模和效率,买方按成本比价;上层依赖不可替代性,买方按结果付费。Intercom的“按结果定价”就是一个明确信号——企业开始尝试用“完成件”而非“过程量”来与供应商对账。
虽然目前Token依然是底层最大的利润池,但到了2026年,仅盯着Token已无法看清全貌。随着SLA(服务等级协议)、责任边界、可评估性(Eval)等条款逐渐进入合同,AI的价格正在走向分层。成本在下沉,价值在上移,这不仅是定价策略的调整,更是AI从“玩具”走向“工业化”的成年礼。