腾讯混元新模型发布,为何被DeepSeek-V4抢了风头?
2026-04-27 14:50:20 - 佚名
2026年4月23日,腾讯正式发布了新一代大模型“混元Hy3 preview”。这本该是腾讯首席AI科学家姚顺雨入职后的首份重要答卷,备受外界瞩目。然而,由于前后脚有GPT-5.5、Kimi K2.6等一众强敌发布,尤其是次日DeepSeek-V4的强势登场,使得混元Hy3 preview的声量被完全淹没,甚至引来业内“不如关停混元,高价收购DeepSeek”的调侃。

这不禁让人发问:腾讯混元这次,难道真的“差了一口气”?
期待与现实的落差
市场对姚顺雨的期待值早已被拉满。这位清华姚班出身、前OpenAI核心研究员的顶尖专家,入职腾讯即获得向总裁刘炽平和技术工程事业群总裁卢山双线汇报的最高权限,并一手推动了混元大模型研发架构的全面重构,甚至将成立十年的AI Lab打散重组。
在此背景下,外界自然期盼腾讯能拿出一款颠覆性的产品。但现实是,Hy3 preview并未在参数规模上追求“炸场”,其295B的总参数量在动辄万亿参数的当下显得并不突出,各项能力虽已进入国内第一梯队,但并未实现对顶级模型的全面超越。这种与市场预期不符的表现,是声量平平的直接原因。
腾讯的“务实主义”牌
然而,如果将视角从“刷榜”和“参数竞赛”中移开,就会发现腾讯正在下一盘不同的棋。腾讯内部人士透露,Hy3 preview并非一次常规迭代,而是混元技术体系的“推倒重建”,其核心目标并非追求短期声量,而是验证一条更务实、更着眼于未来的技术路线。
姚顺雨上任后,对混元团队推行的第一项变革就是否定“唯榜单论”。他认为,过去模型过度追逐榜单成绩,甚至用打榜专用数据训练,导致数据污染,模型在真实场景中反而不稳定。因此,他为团队确立了三大核心原则:
能力体系化:不追求单项“偏科”,而是强调推理、代码、长文本等多种能力的协同。
评测真实性:主动跳出易被“刷榜”的公开数据集,通过自建50多个贴近真实业务的评测基准,来检验模型的“实战能力”。
性价比追求:通过模型与推理框架的深度优化,大幅降低成本,让智能“用得起、用得好”。
与暂不考虑商业化的DeepSeek-V4不同,混元从研发之初就以适配腾讯庞大的业务生态为核心。Hy3 preview发布时,已率先接入腾讯云、元宝、QQ、腾讯文档等十余款核心产品,并在多个场景中取得了可量化的业务提升。例如,腾讯文档AI PPT的生成成功率提升了20%,《和平精英》的AI NPC能提供更真实自然的对话体验。
被低估的实力
尽管市场声量不大,但Hy3 preview的实力不容小觑,它是混元历史上进步幅度最大、实用性最强的版本。
效率与成本:得益于架构优化,其整体推理效率提升了40%,成本大幅下降。API输入价格最低至1.2元/百万tokens,并推出了28元/月的个人套餐,极具竞争力。
核心能力:在复杂推理、代码生成和智能体(Agent)能力上实现了显著提升。在SWE-Bench Verified等权威代码测试中,其表现已逼近GLM-5与Kimi-K2.5,跻身行业第一梯队。
总而言之,姚顺雨的首秀虽然在市场声量上被DeepSeek-V4抢了风头,但这更像是一次战略选择上的“错位”。当行业还在为参数和榜单狂欢时,腾讯已经悄然将重心转向了模型与生态的深度绑定、成本控制和真实场景的落地能力。这或许正是AI行业进入下半场后,更为关键的竞争维度。Hy3 preview的成功发布,标志着混元已经“重回牌桌”,而腾讯庞大的生态体系,将是其未来最大的底牌。