Qwen3发布!阿里靠多模态和性价比能在大模型市场突出重围?

瑞奇·孟菲斯 2025-04-29 情感 10 次浏览 0个评论

Qwen3再一次拉高了世界开源标准

阿里云开源的Qwen3在多方面有创新提升。采用MoE架构,旗舰模型Qwen3-235B-A22B参数量约2350亿,每次推理激活约220亿参数,性能出色。Qwen3-4B模型也表现亮眼。其创新特点是混合思考模式,还支持119种语言和方言。此外,Qwen3针对“AI智能体”概念优化,强化编码和代理能力等。在预训练方面,数据集大幅增加。此次开源采用Apache 2.0协议,构建了“Qwen宇宙”,在技术性能、成本价格等方面全面提升。

DeepSeek光环下的大厂百态

在2025百度AI开发者大会上,李彦宏批评DeepSeek只能处理单一文本,存在慢和贵的问题。中国大厂正用性价比抗衡,如阿里的Qwen3引入MoE架构和双模式推理设计,降低成本,性能超越DeepSeek R1。腾讯采用双轨策略,百度从闭源到开源,字节跳动将产品重心放多模态上。价格、响应、多模态成了大厂竞争的有力武器。

开源生态的长短期利益结合

开源已成为主流路线,大厂在开源生态构建上投入增多。国内大模型进入比拼综合实力和效率的时代,大家追求更高性价比。我们正进入AI下半场,大模型落地方向将更贴近实际应用,这也为开源大模型的参数效率、推理成本提供了更激烈的竞争区域。

转载请注明来自文化资讯网,本文标题:《Qwen3发布!阿里靠多模态和性价比能在大模型市场突出重围?》

每一天,每一秒,你所做的决定都会改变你的人生!
评论列表 (暂无评论,3人围观)参与讨论

还没有评论,来说两句吧...