2026-03-06      大模型      来源:另镜 作者:晨曦      4

摘要:技术理想与商业现实激烈碰撞的缩影

【另镜网】3月4日凌晨,阿里千问核心负责人林俊旸在X发文:me stepping down.bye my beloved qwen.(我卸任了。再见了,我亲爱的千问),并在微信朋友圈分享歌曲《敬自己一杯-日落微醺》。此举引发业界广泛关注。

随后,林俊旸在微信朋友圈发文称:“抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen的兄弟们,按照原来安排继续干,没问题的。”

值得注意的是,Qwen的后训练负责人郁博文、Qwen Code负责人惠彬原、Qwen3.5 & VL & Coder核心贡献者李凯鑫等也提出离职。

3月4日下午,通义实验室紧急召开了All Hands会议,与会者包括阿里数位高管、Qwen团队以及通义实验室其他团队成员。围绕团队调整、战略方向等关键议题,包括阿里巴巴董事长兼CEO吴泳铭,阿里巴巴首席人才官蒋芳、阿里云CTO周靖人做出多个回应。

对于此次调整,阿里高层给出的核心定性是:Qwen没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。


对于多位Qwen核心人员离职,有观点分析称由于开源模型商业化效率的困惑,Qwen虽声名显赫,但究竟能转化为多少云上API的调用收入,阿里内部或许已有分歧。

也有分析指出,林俊旸选择离开,很可能与Qwen团队组织调整有关。林俊旸直接负责的Qwen团队隶属于阿里云CTO周靖人负责的通义实验室。

近期,通义实验室计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室,林俊旸的管理范围被缩小。把模型团队拆开、打散的变化,并不符合林俊旸对技术趋势的判断。

而从更高视角分析来看,林俊旸的离职并不是简单的个人选择,而是阿里AI战略、组织进入深水区后,技术理想与商业现实激烈碰撞的缩影。

核心人员集体出走

林俊旸今年32岁,是阿里巴巴最年轻的P10级技术负责人。在阿里内部,P10已经属于资深总监级别,通常需要十几年甚至更长时间的积累才能达到这个位置,而林俊旸只用了六年时间。

从林俊旸的履历来看,林俊旸2019年从北京大学语言学与应用语言学硕士毕业后加入阿里达摩院,担任高级算法工程师,参与超大规模预训练模型M6及通用统一多模态预训练模型OFA开发。

2022年,他被正式任命为通义千问系列大模型的技术负责人,主导完成Chinese CLIP中文预训练模型。2023年,推动通义千问大模型发布。2024年,主导Qwen系列模型开源工作,涉及7B、14B、72B等不同参数规模版本,其中72B模型曾获LMSYS chatbot Arena人工评测开源榜首。

2025年推出旗舰模型Qwen3-Max,参数规模超万亿并采用36T预训练数据,在GPQA等评测中超越同期国际主流模型,同年,组建机器人与具身智能研究团队,推动多模态智能体向现实世界应用延伸。2026年3月2日,主导开源Qwen3.5小尺寸模型系列,包括0.8B、2B、4B、9B版本。

郁博文2022年于中国科学院信息工程研究所获博士学位后加入阿里达摩院,入选“阿里星”。郁博文参与了Qwen模型的早期训练,主导研发了Qwen系列Chat模型。

惠彬原于2022年获得天津大学硕士学位后正式加入阿里达摩院。惠彬原的研究领域为自然语言处理,具体方向包括语义解析、智能对话、大规模预训练模型等。其在语义解析方向的研究包括上下文相关的文本到SQL解析的预训练。惠彬原在智能对话方向的研究涉及多轮对话的实现方法以及预训练模型的数据处理方法。在大规模预训练模型方向,其工作涉及基础模型训练与对话模型对齐。

在阿里云通义实验室期间,惠彬原参与了通义千问基础模型训练、对话模型对齐、Agent能力增强及多模态扩展等技术方向的工作。

可以说,林俊旸、郁博文、惠彬原三人都参与了Qwen模型的早期训练。

回溯过往,2022年底,ChatGPT的发布引发业界哗然,国内各大科技公司开始紧急调整自己的AI战略,阿里也不例外。OpenAI选择闭源,不过,在林俊旸带领下,阿里团队开始了一条与OpenAI不同的道路——开源。

这个决策在当时看来有些冒险的,但事后证明是明智的。开源让千问在全球范围内获得了大量的开发者和用户,也倒逼团队不断提升模型质量。到2025年,千问系列模型在Hugging Face社区的下载量已经突破6亿次,衍生模型超过17万个,位居全球第一。

值得注意的是,林俊旸宣布离开千问前不久,3月2日,阿里千问正式开源了4款Qwen3.5小尺寸模型系列,分别是Qwen3.5-0.8B/2B/4B/9B,这一系列模型继承了Qwen3.5家族的基因,采用原生多模态训练、最新的模型架构,以满足从极端资源受限到高性能轻量级应用的不同需求。

该模型系列还获得了特斯拉CEO埃隆·马斯克的高度评价,马斯克称其具备“令人印象深刻的智能密度”。

多位AI从业者称,林俊旸离开的消息“非常突然”,替他感到惋惜。林俊旸的阿里千问前同事转发推文表示:“我的心碎了。我知道你的离开并非本意,就在昨晚,我们还并肩发布了Qwen3.5小模型。说实话,我无法想象没有你的Qwen会是什么样子。”

谁将有可能接任?

对于团队核心人物的离开,有观点认为与阿里内部业务整合有关。近年来,阿里AI应用名称逐渐从“通义千问”演变为“千问”。

早在2024年12月,当时有消息称,阿里旗下的AI应用“通义”正式从阿里云分拆,并入阿里智能信息事业群。

2025年12月,阿里成立千问C端事业群,由阿里巴巴集团副总裁吴嘉负责。该事业群由原智能信息与智能互联两个事业群合并重组而来,包含千问APP、夸克、AI硬件、UC、书旗等业务。

林俊旸直接负责的Qwen团队隶属于阿里云CTO周靖人负责的通义实验室。有消息称,通义实验室计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。林俊旸的管理范围被缩小。

把模型团队拆开、打散的变化,并不符合林俊旸对技术趋势的判断。此前,林俊旸曾多次提及,他认为预训练、后训练,乃至Infra和训练团队应该更紧密地结合和沟通。

2026年3月2日,阿里巴巴集团内部将AI(人工智能)的总称和核心品牌统一为“千问”。据悉,此举是为了避免之前千问、通义千问、Qwen等多个名称导致的混淆问题,统一名称之后,阿里巴巴大模型品牌中文为“千问大模型”,英文为“Qwen”,“通义实验室”为阿里巴巴集团旗下AI机构的组织名称。

对于谁将接任千问技术负责人,目前官方并未透露,不过坊间猜测,可能人选为周浩。

周浩是近期阿里通义千问团队人事地震中备受瞩目的“空降”高管。他于2026年初正式加入阿里通义实验室,接任Qwen的后训练(Post-training)负责人,直接向阿里云CTO、通义实验室负责人周靖人汇报。

周浩是前Google DeepMind的高级资深研究员(Senior Staff Researcher)。专注大语言模型(LLM)、多模态、长上下文、强化学习(RL)、推理与智能体(Agentic AI)、后训练优化等领域。其研究风格偏向结构化、工程化与产品化(metric-driven),与阿里当前“商业规模化落地”方向契合。

模型让位于生态

对阿里来说,AI已成为其发展的核心业务之一。在to B领域取得一定成绩后的阿里,将重点转向了to C领域。千问项目的启动,意味着阿里在AI to B与AI to C两个方向齐发力。在AI to B领域,阿里希望做世界领先的全栈AI服务商,服务千行百业不断增长的AI需求;在AI to C领域,基于性能领先的模型和阿里生态优势,打造面向C端用户的AI超级原生应用。阿里是中国唯一拥有领先模型+丰富的生活和消费场景的公司,未来千问将陆续接入电商、地图、本地生活等业务生态场景,希望率先打造未来的AI生活入口。

从阿里近期的动作来看,他们正在加强千问的C端布局。2025年11月,阿里宣布千问项目全力进军AI to C市场。随后到了2026年,阿里又将AI的总称和核心品牌统一为千问,并且加入agent功能,比如可以下单、查位置等等。

2026年1月,千问APP宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等集团生态业务。之后,随着春节的临近,百度AI、豆包、腾讯元宝都启动了“红包”大战。2月2日,阿里宣布旗下千问App将启动“春节请客计划”,提供优惠券,覆盖外卖、即时购物、电影票、机票、酒店等多元场景。

这些动作表明,阿里对千问的预期,已经不仅仅是一个技术项目,而是要成为公司在AI时代的核心入口。在这样的背景下,千问技术负责人的角色变得更加关键。这个人不仅要有技术实力,还要有产品思维,能够协调内部资源,推动千问在C端市场的落地。

业内普遍认为,在林俊旸的主导下,阿里推出了覆盖各类参数规模的Qwen开源模型家族,将Qwen打造成了最强开源大模型。

过去三年中,阿里持续高节奏推进模型迭代,从Qwen到Qwen1.5、Qwen2、Qwen2.5,再到最新的Qwen3,参数规模覆盖齐全,多次在性能上超越美国同期最强开源模型。尤其是Qwen3已达到GPT5、Gemini2.5-Pro同级水平,支持119种语言;其全球下载量更反超Llama,成为全球开发者最依赖的开源模型。

但当Qwen开始从模型层走向应用层,从B端转向C端时,不得不经历阵痛。阿里AI的重心,已经非常明确,C端超级AI入口,已经被抬到集团最高战略。

而从数据来看,目前千问在月活上大幅追赶,但日活与留存,与头部仍有明显差距。根据QuestMobile数据,AI“春节大战”活动期间,豆包、千问、元宝三大AI应用均创各自的日活新高,峰值分别为1.45亿、7352万、4054万。在留存方面,截至2月23日,豆包App日活仍然超过1亿,较2月初增长40%;千问App日活则回落在3200万左右。

这意味着,无论Qwen在开源模型中再强、性能再顶,但在产品层面,留不住日常用户,就不算是真正的胜利。

此背景下,模型层的角色,不可避免地要从引领者变成“配合者”,技术派的主要任务,不再是表达自身的技术理想,而是要落地服务于产品,服务于生态的搭建。模型能力不再是目的,而是超级APP的基础设施,任何个体需求都要让位于组织需求。

短期内,核心团队的离开无疑给千问项目带来了巨大的人才和技术生态缺口。这标志着阿里AI战略进入了一个从“技术驱动”到“商业与体系驱动”的深刻换挡期。这既是告别一个以开源和技术理想主义为特色的“英雄时代”,也是阿里决心打一场以应用和商业化为核心的“体系之战”的必然阵痛。




另镜 | 作者:晨曦 | 责编:陈秋 | 审核:张小蕾 | 监审:小婷



评论区
登录    注册   

Copy Right © 2025 www.demirror.cn All Rights Reserved