作者:连然
过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。
这种转变,多少跟DeepSeek-R1在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了“大模型=高投入、高门槛”的行业共识,也撬动了模型产业的权力结构。
它不仅刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的“重资产”范式。一时间,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。
而在国内,这场“技术地震”最先震动的,其实正是那些原本被认为应该在AI战役中冲在最前的大厂们。一边是像 DeepSeek、Manus 这样的新玩家用“小而强”“快而灵”的策略不断迭代突破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。
新玩家冲击的,不只是模型性能或训练成本,更是许多建立在历史经验基础上的路径依赖——比如“只有闭环才有护城河”“只有高预算才能出好模型”“只有通用大一统才是正确方向”。
越来越多的事实正在指向同一个结论:在 AI 快速演进的浪潮中,任何僵化的范式认知,都可能成为创新的绊脚石。
今天的大厂,正在面临一次理念上的转向:不再追求“我的模型服务我的应用”的闭环逻辑,而是回到“用最合适的模型,构建最好的产品”这一产品主义原点。
一系列深层次的战略重构,正在中国互联网大厂里悄然发生。
回头看 2023 年,国产大模型赛道迅速升温,几乎所有有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到自己的突破口。
彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,“自研闭环”几乎成为主流打法(阿里则探索开源较早),强调的是“模型要自主可控,生态要自给自足”,从底层模型到应用产品都要打通。
在这样的背景下,百度主打“模型+搜索”路径,字节力推豆包,阿里对通义千问团队进行拆分以优化资源配置,腾讯则相对谨慎地投入“混元”大模型,整体更强调“应用场景驱动”,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的“AI 六小龙”,试图在技术路线或创新方向上突围。
图片来源:视觉中国
彼时大家的竞争逻辑还建立在几个假设之上:1)自研能力越强越有护城河;2)参数量和能力相关,性能靠堆大模型赢;3)需要构建一个“自我可控”的模型+应用闭环。
但这些共识在 DeepSeek-R1发布之后被彻底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行业视为一个“临界点”事件——一方面,它以极低的成本训练出了对标 GPT-4 的能力,公开技术细节并放出权重;另一方面,它代表着一种更彻底的“开源范式”:不是简单开放一个模型,而是直接让下游开发者“拿来即用”,训练思路、数据比例、推理效率都一目了然。
这直接打在了原来那种“闭环型自研”的路线要害上。很多大厂花大钱训练的模型,在DeepSeek-R1 面前变得毫无优势——不是能力不行,而是“性价比不行”:你没法再说“自研比别人更强”,因为别人把过程全开了,而且你追上也要几个月;你也没法说“闭环护城河更高”,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。
这种“开源即能力平权”的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的“小模型派”,原本还希望在训练效率和推理速度上做文章,现在发现DeepSeek直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让“闭源商业化”变得更加困难。
行业由此进入了一段显著的“战略迷茫期”:
大厂开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向“拼装模型能力+打造 AI 原生应用”的组合打法?
AI 小龙们则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中“拿货”,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找“差异化垂直场景”。
投资人也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。
总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次“范式洗牌”:用极致透明和开源方式打破旧有路径依赖,把“自研大模型闭环”从主流选项变成了一个“代价极高”的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。
DeepSeek带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。
但从2月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调“应用先行”“超级App”的落地路线,重新回到了“AGI优先”的轨道上。
这轮转向有几个关键的变化。
第一个变化是目标清晰了。过去讲AI应用的时候,很多公司都停留在“做一个超级 App”的层面,比如搞一个AI助手、一个AI搜索或者AI办公工具。
但现在,在字节与阿里最新的对外表达中,都明确把“冲刺AGI”作为最核心的目标。
在2月的全员会上,字节CEO梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的DAU。」
3 月 ,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。
“Seed Edge”是字节豆包大模型团队在年初组建的AGI长期研究团队,鼓励探索更长周期的AGI研究课题,如推理能力、感知能力、软硬一体化等。
这个项目强调“宽松的研究环境”和“长周期考核”,为入选课题提供独立算力支持,体现了字节对AGI的长期布局。
Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。
可以看出,字节正在为通向AGI的下一阶段做技术储备。
2025财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出AGI是阿里AI战略的核心目标,甚至用了“AI将影响全球50% GDP结构”这样激进的表述。
这也意味着,阿里正在从强调“云+模型”服务能力,逐步走向更高层次的通用智能探索。
第二个变化,是对“开源”和“模型选择”的态度发生了实质变化。过去讲模型、做应用时,往往强调“全链路自主可控”,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。
这背后,其实是每家公司在重新厘清自己的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。
阿里的反应看起来“稳”一些,或者可以说是延续之前的节奏。
因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max一度号称性能超越DeepSeek-V3,而4月底刚开源的Qwen3,不仅成本显著降低,性能更是反超DeepSeek-R1和OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态“引进来”。
不过,阿里的路径也并非一帆风顺。过去一段时间,由于组织架构频繁调整,大模型和AI业务一度陷入“各自为战”的割裂状态。但随着2024年阿里云重新整合、AI团队在马云回归后重新聚拢,阿里开始回到“集中力量办大事”的主模式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。
可以说,相比强调C端产品或Agent体验的打法,阿里正在重新确认自己在AI时代的角色——不是冲在最前的应用先锋,而是一个全球级的模型平台和技术基础设施提供者。
百度的选择,是比较务实的。一方面它有自己的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的具体应用能不能变得更智能。所以在实际落地中,百度强调“谁好用就用谁”,哪怕不是自家的模型也没关系,只要能让文库变得更好用,就可以接入。
这种态度其实是经历过一次反思的。之前极客公园就曾经了解到,2024年百度内部其实是为了推动模型在各应用场景落地,分散了大量精力,导致文心团队反而没能集中精力把模型本身推上一个更高的台阶。新的调整,就是不再强求“模型服务所有应用”,而是让每个业务线根据场景灵活选择,把用户体验拉起来才是第一位。
而关于开源闭源之争,此前作为大模型闭源路线的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业模式,开源其实是一种智商税"。
李彦宏在Create2025百度AI开发者大会|图片来源:百度
直到今年2月,百度选择了顺应开源的大趋势,宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
腾讯的路径更清晰,也更符合它一贯的产品哲学。无论是微信、QQ还是游戏体系,腾讯最核心的资源就是这些连接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把AI能力快速嵌入到这些产品里,提升效率和体验。
所以,当DeepSeek-R1新模型出现之后,腾讯是第一时间接入的公司之一,没有太多顾虑。毕竟据晚点报道,腾讯董事局主席兼 CEO 马化腾跟一些 AI 团队说过,“要好好与外部合作,不要想着什么都自己做”,以及“要清醒地认识到实际情况,不要过高估计自己的能力。”
2月13日,腾讯率先官宣接入“满血版”DeepSeek-R1,并迅速在全平台展开推广攻势。从微信、小红书到B站、知乎,元宝产品的广告铺天盖地,引发了用户对腾讯AI助手的集中关注。与此同时,腾讯内部也紧急协调,加速推动微信与DeepSeek的融合。
「元宝」入驻微信|图片来源:极客公园
相应地,腾讯也在组织架构上进行了一系列调整。继腾讯元宝从 TEG(技术工程事业群)并入 CSIG(腾讯云与产业事业群)之后,QQ 浏览器、搜狗输入法、ima 等更多产品也陆续划归 CSIG,组成腾讯在大模型时代面向 C 端的新产品阵列。同时,这些产品原本隶属的团队和组织也将从 PCG(平台与内容事业群)整体调整至 CSIG,以更集中地推进 AI 战略下的产品布局与升级。
这一系列快速动作,其实体现了腾讯对“AI是能力,不是目的”的判断。更强的模型、更开放的生态,只要能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快适应变局的一家公司——甚至可以说,这次AI开放生态的发展节奏,刚好踩中了腾讯最擅长的能力嵌套逻辑。
字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、今日头条、番茄小说等超大规模应用场景。既想做AGI技术的引领者,又不愿放弃在应用层面的优势闭环。
但这就带来了两头要抓的压力——模型要领先,产品也要突出,生态既要自洽又要开放。在DeepSeek-R1爆火之后,字节一方面开始重申“AGI是核心目标”,加强对豆包的投入,也在开源方面更多动作;另一方面在应用层也出现了新的挑战:到底是坚持“豆包+字节应用”的闭环路线,还是打破内外壁垒,接入更强的外部模型去赛马?
据晚点报道,字节跳动最初对是否将DeepSeek接入旗下产品持观望态度,内部普遍认为“随时可以接入,不急”。然而,时机稍纵即逝,春节过后,字节开始紧急调动团队加班开发,加速整合DeepSeek。
目前看,字节的策略还在过渡期。一方面,它在对外表达中强调开源、强调开放生态价值;另一方面,在内部系统上,豆包仍然是很多应用场景的默认选择,只在少许应用上开放对DeepSeek模型的接入。但未来会不会像腾讯一样,开始在更广泛的层面接入第三方模型,或者在某些应用上放开“自家模型优先”的原则,现在还没有完全看清楚。
过去几个月是AI大厂们重新定位自己的生态角色、重新判断技术路径的关键窗口期。经历了DeepSeek-R1带来的“能力维度重构”之后,各家公司几乎都开始重新聚焦AGI这个长期目标,同时也在技术和生态层面更加现实与开放。
不过,即便目标一致,路径选择依然千差万别。这背后,是每家公司对自身优势的认知差异,也是它们对“AI时代应该怎么跑”的不同下注。
AI 行业不会因为某一个产品突然“杀出重围”而终结对抗,它注定是一场持续上演的生态重构游戏——生态位置、能力分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思考“我是谁、我该怎么做”。
在 DeepSeek-R1 的冲击下,大厂开始重新审视自己与 AI 的关系。这场变化不会停止:在AI这个快速演进的技术浪潮中,任何人其实都没有资格背负历史包袱。
历史包袱,不只是落后的产线、沉重的组织、冗余的团队,更是一种路径依赖式的认知惯性。
过去几年,整个AI行业积累了太多“默认共识”:比如做大模型一定要砸上亿美金、做AI应用一定要追求闭环、只有To B业务才能形成收入闭环、AI不是消费品只能是工具型软件……这些“理性判断”在过去的技术范式下看似正确,但在新路径被打通之后,很多“理性”就变成了限制想象力的牢笼。
技术革命的残酷性就在于,它并不会给巨头太多“吃老本”的机会。AI 的快速迭代,正不断吞噬那些依赖过往成功经验的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对现实的一种「觉醒」:在 AI 的无限游戏中,唯一的生存法则,是保持战略弹性——既要摒弃对历史经验的盲目依赖,也要以开放姿态,拥抱技术普惠的新趋势。
旧范式困住了谁?
回顾国内过去两三年内大厂与头部创业公司的发展路径,几乎都踩在一套“经典剧本”上:
先围绕一个目标设定OKR;
再从模型能力、数据体系、应用矩阵做完整闭环;
最终希望通过模型降本、产品增长、生态协同走通商业路径。
这个逻辑没错,但问题是它太像过去互联网时代的打法了——它默认“资源越多,路径越清晰”;但AI的突变恰恰是在路径模糊中爆发的。
比如,之前很多团队一边追求“闭环场景”,一边困于“能力不足”;一边想讲“自主模型”的故事,一边又拿不到基础设施层的调优能力。很多战略决策是“既定假设+组织惯性”的结果——看起来合理,但没人停下来问:如果这些假设本身就错了呢?
反观这轮跑出来的新玩家,无论是DeepSeek、Manus,他们有个共同点:思维轻盈,没有历史负担,也没有路线执念,这反而让他们成了这轮范式跃迁的开拓者。
如果回过头去看,DeepSeek和Manus做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?因为它们过于理性、过于系统化,也就过于保守。
比如大厂可能会问:做MoE到底能不能规模化?极限调优是不是浪费时间?——这些问题本身没错,但当还没验证过路径,就先否定它,那可能永远不会发现新大陆。
这也是为什么,越来越多投资人、开发者、行业观察者开始重新审视AI创业的价值判断:不是谁能讲出最全的闭环,不是谁能招来最多的模型科学家,而是——谁能打破“历史正确性”,走出一条技术与产品都能快速验证的新路线。
在AI这条超高速前进的技术公路上,最危险的不是落后一步,而是还相信旧的红绿灯规则。真正的变化总是发生在“不合理”与“不被看好”之间。