中国AI初创企业能否突破算力封锁?云栖大会震撼发布通义千问2.5,参数飙至720亿,下载量破4000万次,”AI四小龙”引领行业变革!

【杭州云栖大会聚焦AI大模型竞赛】在阿里云主办的云栖大会上,中国AI初创企业集体展示了大型语言模型(LLM)研发的最新进展。此举被视为对OpenAI最新发布的o1生成式预训练模型的直接回应——这款由微软支持的模型旨在攻克复杂任务,为科学、编程和数学领域带来突破。
关键亮点
– 行业颠覆潜力:月之暗面(Moonshot AI)创始人周林(Kunal Zhilin)强调,o1模型将重塑多行业格局!他指出,强化学习与可扩展性正成为AI发展的核心,而”规模法则”(模型越大、训练数据越多性能越强)正在推高AI能力天花板。
– 算力卡脖子:阶跃星辰CEO蒋大鑫坦言,美国贸易限制导致的高端芯片短缺,使算力成为多数初创企业的最大瓶颈。目前仅有月之暗面、百川智能、智谱AI、MiniMax等”AI四小龙”能持续投入强化学习研发。
– 阿里云重磅发布:
– 通义千问2.5系列模型参数规模覆盖5亿至720亿,支持中英法等29种语言
– 专业模型Qwen2.5-Coder/Math在Hugging Face等平台下载量破4000万次
– 通义万相新增文生视频功能,可生成写实/动画风格视频
– 视觉语言模型Qwen2-VL支持20分钟以上长视频处理及移动端优化
延伸思考
1. 在算力受限的背景下,中国AI企业如何通过算法创新实现”弯道超车”?
2. 通用大模型与垂直领域专用模型(如编程/数学),哪种路径更适合初创公司突围?
(配图来源:@Guy_AI_Wise via X)
*想获取更多AI前沿动态?敬请关注在阿姆斯特丹、加州和伦敦举办的【AI与大数据博览会】,同期还有智能自动化峰会、区块链大会等重磅活动。*
*点击查看TechForge主办的更多科技峰会信息*
阅读AI News的原文,点击链接。