©商业与生活 文|朱晓培
校对|大道格
2026年春节,AI战场的硝烟,比除夕的烟花来得更早、更猛烈。
一方面,以阿里千问30亿免单、腾讯元宝10亿红包为代表,大厂们早早就通过红包营销开启了AIagent(智能体)的用户破圈运动。
另一方面,从腊月二十开始,字节、智谱、MiniMax、Kimi、DeepSeek纷纷亮出技术底牌,完成了关键技术迭代。
然而,在这场热闹的AI“军备竞赛”中,阿里在最后时刻亮出杀手锏——2月16日,除夕当天,阿里巴巴正式发布开源大模型Qwen3.5-Plus版本。
根据官方资料,全新一代大模型Qwen3.5-Plus性能媲美Gemini-3-pro、GPT-5.2等顶级闭源模型,稳居全球开源模型榜首。Qwen3.5-Plus总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。
卓越的性能,让这款模型一经发布,就被业界称为“最强开源源神”。它以“以小胜大”的技术突破,这不仅是技术的迭代,更标志着阿里AI战略的完整成型:一边以底层创新追求技术的星辰大海,一边以场景应用服务人间烟火。
AI技术与AI应用双线进攻,同频共振,重构着AI时代的竞争格局与价值边界。
01
以小胜大:
3970亿参数如何跑赢万亿模型
过去两年,大模型行业普遍信奉“大力出奇迹”,执着于堆参数、叠模态的粗放式发展。参数从千亿堆向万亿,性能确实在攀升,但投入也增加,部署要专用集群,推理要烧算力,结果就是,中小企业用不起,端侧设备跑不动。
而Qwen3.5-Plus换了一种思路:不比谁更大,而是比谁更聪明;用更小的激活参数,实现更强的智能。它用一次底层架构的代际跃迁,诠释了“聪明比庞大更重要”的技术哲学。
Qwen3.5-Plus的“杀手锏”实力,首先体现在“以小胜大”的极致效率突破上。这种效率的提升,并非单点技术的灵光一现,而是阿里在大模型底层技术上多年积累的集中兑现。
四大核心技术突破共同构筑了其性能壁垒:
混合注意力机制让模型学会“有详有略地读”,破解了长文本处理算力消耗过大的行业瓶颈,实现效率与精度的双重提升。
混合专家模型(MoE)架构将“按需激活”推向极致,仅需不到5%的算力,就能调动全部3970亿参数的知识储备,彻底改变了传统稠密模型“全参数激活”的高成本困境,实现了性能与成本的惊人平衡。
原生多Token预测让模型从“一字一蹦”升级为“一次想好几步”,推理速度接近翻倍,让用户在长文本生成、代码补全时感受到“秒回”般的流畅。
而千问团队斩获NeurIPS 2025最佳论文的注意力门控机制,如同给模型加装了“智能开关”,精准调控信息流转,避免有效信息被淹没、无效信息被放大,让超大规模训练真正“稳得住、算得准”。
这种“总参数大、激活参数小”的设计,按需分配”的智能调度,让千问3.5在保持高性能的同时,大幅降低了推理成本,为大规模商业化落地铺平了道路。对企业而言,这意味着高性能模型不再是“高门槛资产”。对开发者而言,则意味着更低的实验与创新成本。
02
原生多模态:
模型真正“看懂”现实世界
与此前以文本为主的基模版本不同,Qwen3.5-Plus实现了从纯语言模型向原生多模态模型的代际跃迁。
它采用了原生多模态架构(Native Multimodal),彻底告别了传统“文本+视觉双塔”拼接的模式。这意味着模型在训练阶段就将图像token与文本token统一编码,共享同一套注意力机制。
这种文本与视觉,“第一天就融合”的设计,带来的能力边界远超想象:
它能对图像进行像素级空间定位与代码级精细处理;能理解长达2小时视频的时序演变与因果关系;能将手绘草图直接转化为可运行的前端代码;或基于截图定位并修复UI问题,实现视觉与代码能力的深度融合。甚至能作为视觉智能体,自主操控手机与电脑,跨应用完成多步骤复杂任务。
这类能力意味着,模型不再只是“聊天工具”,而是具备了理解现实世界复杂信息结构的基础能力,为后续智能体大规模落地提供技术基座。
从纯文本模型到原生多模态模型的代际跃迁,Qwen3.5-Plus升级为“看懂现实世界的基座”,更为后续全模态探索、AGI落地奠定了坚实基础。
而这,正是阿里AI技术线的终极追求——不满足于现有技术的迭代,而是以前瞻性研究打破性能天花板,用架构创新开辟新赛道,一步步向“让AI具备看懂、听懂、会说、会动手能力”的目标迈进。
03
应用狂飙:
从聊天框到真实世界
技术能力的突破,最终要服务于真实场景。如果说技术线是阿里AI的“星辰大海”,那么应用线就是“人间烟火”。
目前,各家大模型定位各有不同,但更多的都偏向于社交、娱乐工具。而千问选择了一条最难但最深远的一条路——它不满足于做“聊天搭子”,而是要做“生活帮手”。
2025年11月,阿里开始将千问模型的能力集成到C端应用,推出千问APP。仅仅三个月,千问APP日活快速提升至7352万,连续多天霸榜App Store免费榜第一名。
2026年1月15日,千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等集团生态业务,上线超400项AI办事功能,成为全球首个能完成真实生活复杂任务的AI助手。也引领AI行业突破聊天对话功能,迈入“办事时代”。
临近春节,千问更是拿出30亿元,通过“免单请客”的方式,推动AI融入真实的生活场景。数据显示,春节免单活动上线6天,用户通过AI完成下单超1.2亿笔。
千问C端事业群总裁吴嘉接受采访时透露,2月6日免单的效果远超预期,第一天的实际订单达到1500万单,是原来预计的15倍。他表示,千问做这件事的初衷,并不是为了和谁卷,真正想的是让AI融进老百姓的日常生活场景中,“这是未来一定会发生的事情”。
千问3.5的发布,将进一步打开这一想象空间。基于顶级视觉能力,千问3.5可自主操作手机与电脑,高效完成日常任务。在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作。
AI的价值不在于能聊多少天,而在于能帮人办多少事。千问APP将模型能力和阿里成熟生态链接,让用户真正体验到AI的办事能力。千问走的,也是AI应用落地中,最重要的路线——依托阿里庞大的本地生活与数字商业生态,AI将成为用户日常决策与行动的延伸。
04
“Powered by 阿里云”
推倒AI使用门槛
AI模型和AI应用双线突破的背后,是阿里云AI基础设施的强力支撑。
通过阿里云和平头哥自研芯片的加持,千问的推理效率可以得到进一步提升。这种模型、芯片和云的软硬件紧密耦合,最终实现了1+1+1>3的效果。
例如,真武芯片针对以Qwen3为代表的主流MoE架构模型做了大量优化,可满足千问大模型对大规模计算的需求。
得益于模型、芯片以及云的协同创新,千问3.5的价格进一步探底,API每百万Token输入低至0.8元,是同等性能Gemini3pro的1/18。
这一突破的直接结果,就是给AI带来了一个前所未有的效率拐点。Qwen3.5-Plus,让“最强”和“最便宜”同时出现在同一个大模型身上。也意味着,技术红利不再只属于金字塔尖,而是开始真正向下渗透。顶级AI能力跳出了高算力、高成本的闭环,变成个人开发者、创业团队、中小企业也能够接触、能够使用。
据了解,千问3.5只是阿里多模态布局的冰山一角,未来还将探索All in one的全模态,发力AGI。目前,千问模型的开源数量超400个,衍生模型数量突破20万个,下载量突破10亿次,包括英伟达、亚马逊、爱彼迎等全球公司和机构都在使用千问模型。
阿里一方面在不断推出SOTA级模型,另一方面,通过开源策略,让人人都能免费用。这样的策略不仅让千问在企业端备受欢迎,让“powered by阿里云”也成为AI时代的最强印记,也让阿里云再次进入高速增长期。
沙利文数据显示,千问在中国企业级大模型调用市场中位居第一,并成为阿里云新增需求的主要驱动力。根据Omdia数据,2025年,阿里云在中国云市场的份额从33%提升至36%,超过第二到第四名总和。
05
结语:
星辰大海是方向,人间烟火是归宿
商业史上,真正定义时代的从来不是最贵的产品,而是被最多人使用的基础设施。Linux定义了服务器时代,Android定义了移动时代,它们的共同点是:开源、免费、无处不在,最终成为整个产业默认的底层。
阿里做千问的逻辑与此相同。千问系列大模型覆盖从轻量到旗舰,坚持Apache 2.0协议完全开放,把整条产品线推向全球开发者。
当开源模型在核心能力上追平甚至超越闭源,“免费且最强”就变成不可拒绝的选项。竞争的性质随之改变:不再是模型与模型的比拼,而是生态范式的替代。
技术的星辰大海,最终要落地为服务人间烟火的温暖力量。阿里AI的技术与应用双线进攻,一边深耕底层创新,一边发力场景应用。这不是“技术孤芳自赏”,而是“技术普惠落地”。
当最顶尖的AI能力,走进千行百业、融入日常生活,技术的价值就会真正得以实现。这正是Qwen3.5作为春节档“杀手锏”的核心底气:它不仅是技术标杆,更是能解决实际问题、创造真实价值的“实用工具”。