Nota: esta página es una traducción automática y puede contener errores o frases poco naturales. Si algo no queda claro, consulta el original en inglés.
Evaluación de modelos e investigación de amenazas
Las empresas de IA y la sociedad necesitan entender qué pueden hacer los sistemas de IA de frontera y qué riesgos plantean.
Horizonte temporal 1.1 (actual)
Sigue la misma metodología del artículo inicial, pero con un conjunto de tareas más grande. Véase el anuncio de publicación.
Horizonte temporal 1.0 (marzo de 2025)
Cálculos originales del horizonte temporal. Calculados para modelos de 2019 a noviembre de 2025, siguiendo los métodos descritos en el artículo original.

Evaluación de riesgos

Evaluamos los riesgos que pueden plantear los sistemas de IA de frontera. Este trabajo incluye el Informe de riesgos de frontera, revisiones independientes de las evaluaciones de riesgos de los desarrolladores de IA y evaluaciones de capacidades de modelos de frontera.

Ver todas las evaluaciones

METR no recibe remuneración por este trabajo.

Empresas como OpenAI, Anthropic y xAI han facilitado acceso a sus modelos y créditos de cómputo para apoyar la investigación en evaluación. También evaluamos modelos por nuestra cuenta tras su publicación, sin participación de sus desarrolladores. Los informes públicos recientes derivados de este trabajo figuran arriba, y se comentan con mayor detalle en las respectivas system cards.

Políticas de seguridad de IA de frontera

Asesoramos a desarrolladores de IA y gobiernos en la implementación de metodologías para evaluar riesgos de IA. Por ejemplo, hemos asesorado a desarrolladores sobre políticas de seguridad de IA de frontera.

Recursos sobre FSP

Recientes