阿里巴巴新Qwen推理AI模型创开源纪录

阿里巴巴AI再创奇迹？Qwen3推理模型震撼开源界，92.3分逻辑推理能力直逼人类专家！

阿里巴巴Qwen团队近日发布新一代开源推理AI模型，其性能指标令人瞩目！【重磅】全新升级的Qwen3-235B-A22B-Thinking-2507模型经过三个月专项优化，在”思维深度”与推理质量上实现突破性进展。

该模型在需要人类专家级能力的领域树立了开源模型新标杆：
• 逻辑推理：AIME25基准测试得分92.3
• 复杂编程：LiveCodeBench v6得分74.1
• 综合表现：人类偏好对齐测试Arena-Hard v2达79.7分

技术亮点：
▸ 2350亿参数混合专家架构（MoE），实际激活参数约220亿
▸ 支持26.2万token的超长上下文记忆（业界领先！）
▸ 类似128人专家团队按需调用机制，单任务仅激活8名最优专家

开发者可通过Hugging Face平台快速部署，团队推荐使用Qwen-Agent框架充分发挥其工具调用能力。性能优化建议包括：常规任务输出长度设为32,768 token，复杂问题需扩展至81,920 token以预留充足”思考空间”。

延伸思考：
1. 开源模型在专业领域逼近商用闭源产品，会如何改变AI产业格局？
2. 超长上下文处理能力将催生哪些新型应用场景？

（题图：Tung Lam）

[相关阅读]《美国AI行动计划：必须保持”无可争议”的领导地位》
[活动预告]阿姆斯特丹/加州/伦敦三地联动的AI与大数据博览会即将举行，同期举办智能自动化大会、区块链峰会等前沿科技活动。

注：本文精简了技术部署细节及商业活动信息，保留核心技术创新点与关键性能数据。

阅读 ArtificialIntelligence News 的原文，点击链接。

您错过了