本页由 AI 翻译,可能有错误或不自然的地方。 不清楚时,请参阅英文原文
时间跨度 1.1(当前)
方法沿用初始论文,但任务集更大。参见发布说明。
时间跨度 1.0(2025 年 3 月)
初版时间跨度计算,使用原论文方法,覆盖 2019 年至 2025 年 11 月发布的模型。

风险评估

我们研究前沿 AI 系统可能带来的风险。相关工作包括发布《前沿 AI 风险报告》、独立审查 AI 开发者的风险评估,以及评估前沿模型能力。

查看全部评估报告

METR 不为此项工作收取报酬。

OpenAI、Anthropic、xAI 等公司向 METR 提供过模型 API 调用权限和免费调用额度,用于支持评估研究。除这类合作评估外,METR 有时也会在模型发布后独立开展评估;这类评估不由模型开发者参与。上方列出的是 METR 近期发布的公开报告;更多细节可参见相应模型的系统卡。

前沿 AI 安全政策

METR 为 AI 开发者和政府提供咨询,帮助他们采用 AI 风险评估方法。例如,我们曾就前沿 AI 安全政策向开发者提供建议。

相关资源

最新动态