2026-05-01      大模型      来源:另镜 |作者:谢涵      311461

摘要:新模型、新技术能力接连亮相,一条清晰的战略主线正浮出水面——

【另镜网】国产AI正步入一个关键的结构性转折期。

4月24日,万众期待的DeepSeek V4终于正式发布,凭三项数据,迅速让科技圈沸腾起来——

1.6万亿参数、100万Token上下文、价格仅为0.025元/百万Tokens,定价为美国同类竞品的1/10。

发布仅数小时,V4便冲上了海外讨论热榜。而就在2天前,美国众议院在4月22日通过了MATCH法案,进一步加强对关键半导体制造设备的出口管制。

出口禁令覆盖深紫外光刻等关键设备,对中芯国际、长江存储、华为等企业施加实体清单式封锁,设备维护和技术支持一并切断。

值得玩味的是,法案推进的同时,英伟达迅速推出了针对V4的Blackwell平台适配方案。美国芯片巨头反在积极维护中国客户。

V4发布的前后一周,国产AI集中爆发,比如kimi K2.6和美团LongCat-2.0-Preview,而且后者的推理和训练全程基于国产算力。新模型、新技术能力接连亮相,一条清晰的战略主线正浮出水面——

中国AI正在以万亿参数模型群为先导,构建起体系化的竞争模式。这种多维度、高密度的创新,体现为四个趋势。

万亿参数模型涌现

DeepSeek V4发布后,海外媒体纷纷报道跟进,其中的一个核心观点是,“中国科技企业正在迅速缩小与美国巨头的差距”。

英国路透社指出,DeepSeek-V4在世界知识测评中大幅领先于其他开源模型,仅次于谷歌的顶尖闭源模型,反映出中国企业在AI领域突飞猛进的技术实力。

半岛电视台评论称,AI已成为中美“科技竞赛”的关键领域,尽管美国依然在开发最先进模型方面略占优势,中国科技公司正在努力缩小与美国AI巨头之间的技术差距。

外媒的关注,反应出国际社会正在重新审视中国AI的创新能力。长期以来,万亿参数模型被视为只有拥有英伟达顶级GPU集群的美国巨头才能触及的高地,现在,固有格局正被中国企业体系化的突破所改写。

DeepSeek V4,则是一个缩影。

就在V4发布的同一天,美团LongCat-2.0-Preview也正式开放测试,且参数规模同样突破万亿,支持百万级的超长上下文,处理量级与新发布的GPT-5.5齐平。这意味着,“万亿俱乐部”出现了多个中国面孔,更在核心推理能力上实现与世界顶尖水平并跑。

再往前,4月21日,月之暗面发布了编程模型Kimi K2.6。总参数量达1万亿,支持256K Token上下文窗口及原生多模态输入。

这波万亿级爆发的背后有个新趋势,中国AI企业进入了技术交叉验证、协同向上的周期。例如,V4采用了Muon优化器,正是月之暗面去年验证开源的技术。

模型厂商通过技术开源和路径验证,形成一个高效的创新共同体,推高了国产AI的智力上限。

算力自主提速 国产芯片通过首场大考

DeepSeek V4之所以让业界震动,在于它完成了一次极具挑战的底层技术栈调整——从训练到推理,V4 不再只依赖海外算力,开始与华为昇腾等国产芯片深度适配。这一跨越,被《华尔街日报》评价为中国芯片行业的“关键里程碑”。

要知道,随着美国出口管制持续收紧,英伟达在中国高端芯片市场份额已从95%降至0%。DeepSeek进行了一场艰难的技术路线重构,V4团队需要在算力受限下,用新的软件框架重写代码、实现性能突破。

但这一转向,是出于长远的考量。若长期依赖英伟达的CUDA生态,国产大模型始终面临供应链不确定的风险,且只能在性能受限的版本上做减法。

V4和美团LongCat的转向,标志着国产芯片的角色不再只是“替代方案”。

然而,DeepSeek V4的突破证明了国产芯片可以支撑头部模型的“关键环节”,那么美团LongCat-2.0-Preview的横空出世,则进一步宣告国产算力全具备了支撑万亿参数模型全流程训练与推理的硬实力。

可以说,这是一次国产算力工程化能力的系统性检验。

据悉,美团新一代大模型的训练推理,全程依托一个规模达5万至6万张国产算力卡的超大规模集群,是目前国产算力完成的规模最大的训练任务,标志着国产自主算力迈出了关键的一步。

LongCat-2.0-Preview的问世,技术团队也进行了一场适配攻坚。

国产芯片显存容量和带宽的差异,尚在成长中的国产芯片环境,训练中可能出现的故障……这些问题,都是不小的工程挑战。团队付出更多精力在并行策略、显存优化上,并大规模重写核心算子,构建可以感知故障、弹性修复的容错体系。针对国产硬件的特性,团队还对训练框架和模型结构做了亲和设计,有效提升了计算性能。

国产大模型+国产芯片的适配潮背后,是国产芯片在市场占有率上的增长。

IDC报告显示,2025年中国AI加速卡总出货量约400万张。英伟达出货约220万颗,市场份额降至约55%;而中国本土芯片厂商合计出货约165万张,市场份额已攀升至41%。其中,华为出货约81.2万颗,占比20%。

国际投行伯恩斯坦(Bernstein Research)甚至预测,2026年,华为将占据中国AI芯片市场50%的份额,而英伟达的份额将大幅萎缩至8%。

为了确保算力安全,国产大模型企业也开始深度介入上游的“造芯”环节。

美团投资了摩尔线程、沐曦股份、紫光展锐等21家头部半导体/智能硬件和大模型公司,覆盖GPU、边缘算力、端侧芯片及半导体新材料等多个关键赛道。

国产芯片正从保障产业安全的底线,转向更为主动的竞争动作。

大模型的终局:解决真实需求

从产业链看,大模型的终局是应用,是解决真实世界的需求。没有真实场景的磨炼,光靠参数堆砌,也无法形成闭环。

DeepSeek V4发布后,市场研究公司Counterpoint首席AI分析师孙伟就指出,DeepSeek在国产芯片上原生运行,强化了中国的“AI主权”。

这不仅体现在产业韧性,也体现在场景深度。

所谓产业韧性,是在外部技术限制的环境下,DeepSeek、美团等众多国内玩家,正通过加强国产芯片、框架与算法的深度协同,推动大模型产业链的自主进程。

而所谓场景深度,则是国产AI的差异化特点。

4月13日,斯坦福发布的《AI指数报告》显示,中美模型差距已缩窄至2.7个百分点,但AI对生产力的实际贡献却呈现出截然不同的图景。

根据宾夕法尼亚大学沃顿预算模型测算,2025年美国生产率增长率为2.7%,但AI对全要素生产率的实际贡献仅为0.01个百分点,几乎接近于零。但在中国,AI展现出不同的颗粒度——

我们拥有全球第一的工业机器人安装量(29.5万台,是美国的8.6倍),建成了全球最多的公共AI超算(85台),职场AI使用率超80%,远超全球平均水平。此外,中国还有世界上最丰富的民生需求商业业态。

以美团为例,其覆盖全国2800多个市县的即时配送网络,应对着中国最复杂的地理环境。此外,美团无人车累计已完成550万单配送任务、无人机目前累计完成商业订单超78万笔,已在国内外开通70条航线。

这些高频、真实的环境,可以提供长期连续的运营数据和稳定性的验证空间。这也是为什么王兴强调,美团要打造物理世界的AI底座。

开源生态 反哺国产芯片突围

此外,国产AI还拥有蓬勃的开源生态。

早在V4发布前,黄仁勋就发出警告,如果像DeepSeek这样的突破性成果首先在华为这样的国产平台上运行,对美国将是“非常糟糕的结果”。

他的担忧,指向的英伟达CUDA生态的护城河。如果国产芯片与国产大模型形成完整的闭环,CUDA生态的排他性,势必受到影响。

一方面,以DeepSeek为代表的国产大模型,正在加速国产芯片生态的成熟。

DeepSeek V4、Kimi K2.6以及美团LongCat等万亿级模型的发布,会带来广泛的应用需求,驱动进一步的芯片研发和适配,同时真实的场景数据推动芯片性能迭代。

以美团LongCat-2.0-Preview 为例,国产算力支撑了其万亿参数级模型的全流程训练和推理,验证了国产芯片在计算正确性、数值精度和训练稳定性上,足以追平国际水平。团队在其中沉淀下的工程能力,也在为国产芯片生态积累经验。

另一方面,开源模型正重塑全球智力分布。美国对冲基金Interconnected Capital创始人Kevin Xu曾指出,中国开源开发者的浪潮是2025年后最重要的技术事件。他认为,“开源是未来的软实力”。

本周,主流第三方榜单Arena更新了数据。开源榜上前五名,已全部由中国模型占据,前十名除了第六名的Gemma 4 31B,已经都是国产模型。

其次,开源也加速了国产算力“软件栈”的完善。英伟达强在CUDA,而国产芯片弱在生态。但随着DeepSeek V4、LongCat-2.0-Preview等万亿级模型在国产算力上逐渐跑起来,很多实践中的适配经验也将带来产业协同效应。

从万亿参数模型的接连出现,到国产算力的持续追赶,再到模型与芯片的协同进化,一个更具韧性的产业格局有了雏形。


另镜 | 作者:谢涵|责编:陈秋 | 审核:张小蕾 | 监审:小婷



评论区
登录    注册   

Copy Right © 2025 www.demirror.cn All Rights Reserved