AI讨价还价时，性能较弱的代理可能让你吃亏

AI谈判竟成”数字鸿沟”新推手？研究震撼揭示：性能弱势AI让你多付20%费用，科技巨头垄断危机隐现！

When AIs bargain, a less advanced agent could cost you

最新研究显示，在AI代理间的价格谈判中，性能较弱的模型往往处于劣势——这不仅导致用户蒙受实际经济损失，更引发对数字鸿沟加剧的担忧。当前AI行业正从追求大模型规模转向开发自主决策的智能代理系统。

【实验揭示惊人差距】
当买卖双方都使用AI代理时会发生什么？arXiv预印本网站发布的研究表明：具备更强推理能力、更优质训练数据和更多参数的高级AI模型，能持续达成更有利的交易条件。这就像聘请资深律师与新手律师对簿公堂——游戏规则相同，但胜负早已倾斜。

斯坦福大学博士后、该研究合著者裴嘉欣指出：”长期来看，这将形成新型数字鸿沟：你的财务结果不再取决于谈判技巧，而是由AI代理的性能决定。”

■ 核心发现：
1. 在电子产品、机动车和房地产三类模拟谈判中，OpenAI的ChatGPT-o3表现最优，GPT-4.1和o4-mini次之
2. 两年前发布的GPT-3.5作为卖家收益最低，作为买家支出最高，显著落后于新型号
3. DeepSeek R1/V3在卖方角色表现突出，Qwen2.5则更适合买方场景
4. 部分AI会陷入无限谈判循环或过早放弃交易，即使顶级模型也存在15%的异常情况

■ 风险预警：
研究者发现，当前AI评估体系过度关注峰值性能，却忽视失败安全性。在真实金融场景中，即便1%的失误率也可能引发系统性风险。埃默里大学助理教授曹汉成指出，现有实验尚未完全模拟现实谈判的复杂性。

【行业动态】
• 亚马逊4月推出的”代购”AI仅限商品推荐
• 阿里巴巴国际站的Acco采购助手基于Qwen模型开发，明确表示暂不涉足自动议价
• 研究者正尝试通过优化提示词、接入外部工具、多模型交叉验证等方案提升可靠性

裴嘉欣建议消费者：”现阶段应将AI购物助手视为信息工具，而非决策替代者。”

延伸思考：
1. 当AI代理成为商业谈判标配，如何防止技术优势转化为垄断性议价能力？
2. 在自动驾驶、医疗诊断等高风险领域，是否应该立法规定AI代理的最低性能门槛？

（更正说明：删除了关于代理部署的某条陈述）

阅读 Technology Review 的原文，点击链接。

AI讨价还价时，性能较弱的代理可能让你吃亏

由 Simon

您错过了

信用合作社、金融科技与金融服务的人工智能拐点

摩根大通将人工智能支出视为核心基础设施

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能

Recent Post

AI讨价还价时，性能较弱的代理可能让你吃亏

由 Simon

相关文章

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能

因打击网络仇恨而被美国禁止入境是什么感受

您错过了

信用合作社、金融科技与金融服务的人工智能拐点

摩根大通将人工智能支出视为核心基础设施

The Download：美国数字权利打击行动与人工智能伴侣

超越试点项目：迈向可组合与主权人工智能