AI谈判竟成”数字鸿沟”新推手?研究震撼揭示:性能弱势AI让你多付20%费用,科技巨头垄断危机隐现!

When AIs bargain, a less advanced agent could cost you

最新研究显示,在AI代理间的价格谈判中,性能较弱的模型往往处于劣势——这不仅导致用户蒙受实际经济损失,更引发对数字鸿沟加剧的担忧。当前AI行业正从追求大模型规模转向开发自主决策的智能代理系统。

【实验揭示惊人差距】
当买卖双方都使用AI代理时会发生什么?arXiv预印本网站发布的研究表明:具备更强推理能力、更优质训练数据和更多参数的高级AI模型,能持续达成更有利的交易条件。这就像聘请资深律师与新手律师对簿公堂——游戏规则相同,但胜负早已倾斜。

斯坦福大学博士后、该研究合著者裴嘉欣指出:”长期来看,这将形成新型数字鸿沟:你的财务结果不再取决于谈判技巧,而是由AI代理的性能决定。”

■ 核心发现:
1. 在电子产品、机动车和房地产三类模拟谈判中,OpenAI的ChatGPT-o3表现最优,GPT-4.1和o4-mini次之
2. 两年前发布的GPT-3.5作为卖家收益最低,作为买家支出最高,显著落后于新型号
3. DeepSeek R1/V3在卖方角色表现突出,Qwen2.5则更适合买方场景
4. 部分AI会陷入无限谈判循环或过早放弃交易,即使顶级模型也存在15%的异常情况

■ 风险预警:
研究者发现,当前AI评估体系过度关注峰值性能,却忽视失败安全性。在真实金融场景中,即便1%的失误率也可能引发系统性风险。埃默里大学助理教授曹汉成指出,现有实验尚未完全模拟现实谈判的复杂性。

【行业动态】
• 亚马逊4月推出的”代购”AI仅限商品推荐
• 阿里巴巴国际站的Acco采购助手基于Qwen模型开发,明确表示暂不涉足自动议价
• 研究者正尝试通过优化提示词、接入外部工具、多模型交叉验证等方案提升可靠性

裴嘉欣建议消费者:”现阶段应将AI购物助手视为信息工具,而非决策替代者。”

延伸思考:
1. 当AI代理成为商业谈判标配,如何防止技术优势转化为垄断性议价能力?
2. 在自动驾驶、医疗诊断等高风险领域,是否应该立法规定AI代理的最低性能门槛?

(更正说明:删除了关于代理部署的某条陈述)

阅读 Technology Review 的原文,点击链接

Simon