爱马仕Agent爆火背后一场关于“聪明”与“可靠”的路线之争
2026-04-11 15:24:29 - 佚名
2026年初,一个名为Hermes Agent的开源项目在技术圈迅速走红。因为它名字与奢侈品牌“爱马仕”撞车,被大家戏称为“爱马仕Agent”。它最吸引人的地方在于提出了一个“与你共同成长”的智能体概念:当你让它完成一个复杂任务后,它能自动把这次的经验打包成一个叫“Skill”的技能包。下次再遇到类似的事情,它就不再是白纸一张,而是能直接调用这个技能包,并且越用越顺手。

这种“自我进化”的叙事听起来非常性感,仿佛我们终于创造出了一个能像人类一样从经验中学习的数字员工。然而,在这个迷人的故事背后,可能隐藏着一个被过度美化的误区:我们真的把宝押对了吗?让Agent变得更“聪明”,真的是解决当前所有问题的关键吗?
被忽视的地基:CLI才是硬道理
为了看清真相,我们不妨看看目前公认最好用的编程助手Claude Code。它之所以能让程序员感到“丝滑”,核心并不是因为它有什么自动进化的超能力,而是因为它背后站着一群极其扎实、从不掉链子的命令行工具。
当Claude Code需要找文件、查代码、看细节时,它调用的都是那些确定性的、几乎不花一分钱计算成本的原子操作。这些工具就像忠诚的老兵,指哪打哪,从不废话。相比之下,Hermes所推崇的“Skill”虽然听起来高大上,但本质上是在解决“如何更聪明地干活”,而忽略了“手里的家伙事儿好不好用”这个更基础的问题。
这就好比,Skill是让一个骑手学会更精妙的骑术,但如果他胯下的是一匹瘸腿马,骑术再高超也跑不快。目前很多Agent系统卡顿、烧钱、不稳定的根源,恰恰是因为底层的“瘸腿马”太多——也就是那些高质量、确定性的命令行工具太少了。
“龙虾”的教训:聪明的头脑救不了脆弱的工具
这一点在另一个 popular 的项目OpenClaw(俗称“龙虾”)身上体现得淋漓尽致。用户们对它最大的抱怨主要有两个:一是账单太贵,二是干活不稳定,经常干一半就“失联”。
乍一看这是两个问题,其实是一个问题的两面。很多用户发现,OpenClaw之所以烧钱,是因为它经常被迫使用笨拙的浏览器自动化操作去完成任务。比如,它可能为了发个帖子,就要像人一样去加载网页、寻找按钮、点击发送。一旦网页稍微卡一下,或者按钮位置变了一点点,它就得重新观察、重新思考、重新尝试。
每一次“思考”和“重试”,都在疯狂燃烧用户的代币。这就像是一个被蒙住眼睛的机器人,只能通过不断摸索来完成任务,效率极低且代价高昂。这种情况下,就算你给它再多的“Skill”让它变得更聪明,只要它还得依赖这种脆弱的浏览器操作,它就永远无法摆脱“又贵又慢”的宿命。Skill解决的是“怎么想”,但现在的瓶颈在于“怎么做”。
为什么CLI比Skill更值得投资?
Hermes所做的Skill,本质上是让大模型把经验写成自然语言的操作指南。这听起来很美好,但它有一个致命的弱点:它是对模型能力的“借贷”。
这意味着,这个Skill只能在特定的模型上跑得好。如果你换了一个稍微笨一点的模型,或者模型版本更新了,这个Skill可能就失效了。而且,Skill很难调试,出了问题你很难知道是哪句话没写对。
反观命令行工具,它是代码世界的通用语言。无论背后的模型是强是弱,命令“复制文件A到文件夹B”永远只有一种结果。它不消耗昂贵的推理资源,执行速度快,而且一旦出错,报错信息清晰明确。
更有趣的是,当底层的工具足够强大、上下文管理足够好时,我们对“Skill”的依赖其实会自然降低。就像Anthropic的设计负责人所说,当系统已经通过文档和笔记完全理解了你的工作习惯,它就不再需要额外的“技能包”来教它怎么干活了。
一场静默的革命:把浏览器变成命令行
现在,一场针对命令行工具的“文艺复兴”正在悄悄发生。过去,命令行是给人用的,所以可以容忍模糊,可以有人工干预。但现在,使用者变成了不知疲倦、没有耐心的Agent,这就要求工具必须更加精准、结构化。
一个非常反直觉但极具潜力的趋势是:“所见即可命令行化”。有人已经通过技术手段,把ChatGPT的网页版变成了一个可以被代码直接调用的命令行工具。这意味着,任何你在浏览器里能看到、能操作的东西,理论上都可以被封装成一条简单的命令。
想象一下,以前Agent需要像盲人摸象一样在网页上点点点才能查个股价,现在只需要输入一行代码就能瞬间拿到结果。这不仅仅是效率的提升,更是成本的断崖式下降。原本需要消耗大量代币让模型去“看”网页、“点”按钮的过程,被压缩成了一次几乎零成本的原子操作。
终局展望:聪明的脑,强壮的手
未来的Agent架构,不应该是一场“谁取代谁”的游戏,而应该是一个完美的分工协作。
最底层应该是坚如磐石的命令行工具,它们负责所有确定性的、重复性的脏活累活,不消耗任何昂贵的智能资源;中间层是像Hermes这样的Skill系统,负责根据上下文编排任务,积累经验;最顶层才是大模型这个“大脑”,负责处理那些真正需要模糊判断和创造性思维的难题。
Hermes的爆火是一个积极的信号,它证明了人们渴望Agent能变得更聪明。但在这个喧嚣的表象之下,我们更应清醒地认识到:只有先把底层的“手”——也就是那些确定性的工具——打磨得足够锋利,上层的“大脑”才能真正发挥出它的价值。否则,再聪明的头脑,也指挥不了一双不听使唤的手。