AI

美国奥数题成AI数学噩梦:顶级模型集体翻车,DeepSeek如何逆袭成功?

作为一名AI观察者,他深入分析了近期美国奥数题引发的AI数学推理危机。顶级模型如GPT-4.5、Claude 3.7 Sonnet等在ARC-AGI-2测试中表现惨淡,得分普遍低于5%。然而,DeepSeek的R1模型却凭借独特算法实现了逆袭。文章详细探讨了AI失败的原因及未来发展方向,呼吁行业重视基础理论突破。