03:58
AI基准测试组织因延迟披露OpenAI资助而受到批评
Epoch AI 因未及时披露 OpenAI 对其数学基准测试 FrontierMath 的资助而引发争议。FrontierMath 旨在评估 AI 的数学能力,被 OpenAI 用于展示其新模型 o3。尽管 Epoch AI 强调 FrontierMath 的完整性未受影响,并设有独立验证机制,但透明度问题引发了对其客观性的质疑。事件凸显了 AI 基准测试开发中的资源获取与利益冲突挑战,同时反映了 AI 模型评估透明度和独立验证的重要性。