
¡Increíble! La Nueva Prueba de Inteligencia Artificial: ¿Puede Jugar a Pokémon?
2025-04-20
Autor: Carmen
La Definición de Inteligencia Según Piaget
El célebre psicólogo suizo Jean Piaget definió la inteligencia de una manera fascinante: "La inteligencia es lo que usas cuando no sabes qué hacer". Esta visión ha inspirado una innovadora tendencia para evaluar la inteligencia artificial (IA): ponerla a jugar a Pokémon.
¿Qué Tan Inteligente es Realmente la IA?
Los métodos convencionales ya analizan el rendimiento de la IA en problemas científicos, matemáticos y de programación. Sin embargo, la idea de usar Pokémon como parámetro para medir la inteligencia de una IA es realmente única y emocionante.
El Inicio de la Tendencia con Claude
Todo comenzó cuando Anthropic decidió analizar cómo su modelo de IA, Claude 3.7, se desenvolvía en el clásico Pokémon Red. Utilizando su herramienta de navegación automática, crearon un canal en Twitch y documentaron el progreso en Reddit, atrayendo la atención de muchos.
¡Gemini Pro Entra en la Competencia!
No se hizo esperar la respuesta: un desarrollador independiente lanzó la misma prueba con Gemini Pro 2.5 Experimental jugando a Pokémon Blue, en un emulador de Game Boy Advance. Las apuestas se disparan.
¿Quién es el Verdadero Campeón?
A día de hoy, Gemini Pro parece superar a Claude, que se quedó atascado en varias ocasiones. Por otro lado, Gemini avanza con más fluidez, aunque juega de manera diferente y usa un minimapa, algo que equilibra sus limitaciones al no contar con navegación automática como Claude.
¿Por qué Elegir Pokémon?
La elección de Pokémon para estos experimentos es astuta: es un juego por turnos que permite a la IA "pensar" su próximo movimiento, además de ser gráficamente sencillo, facilitando su análisis sin tener que consumir muchos recursos.
Un Benchmark Revelador
Evaluar la inteligencia de una IA jugando a Pokémon puede resultar tan esclarecedor como las pruebas de programación y matemáticas. Para ponerlo en perspectiva, un niño de diez años podría aprender a jugar en minutos, mientras que la IA a menudo termina realizando movimientos erróneos.
Adiós a la Memorización
La mayoría de las pruebas de IA se basan en la memorización, donde resuelven problemas utilizando datos de entrenamiento. Pero aquí, la habilidad de adaptación se convierte en un factor crucial.
Nuevos Desafíos con ARC-AGI
Recientemente, la ARC Prize Foundation realizó pruebas con un juego clásico: una versión del famoso Snake. Los modelos de razonamiento dominaron, mostrando nuevamente el potencial de los videojuegos simples para mejorar la IA.
¿La IA se Está Adaptando?
Estos nuevos benchmarks son fundamentales porque demuestran si la IA puede adaptarse a desafíos novedosos. Empresas como DeepMind ya han implementado este enfoque en sus innovaciones, señalando un camino excitante para futuros desarrollos.