Tecnología

Una IA invierte 10.000 compras en Magikarp: ¿qué revela esto sobre nuestra naturaleza?

2024-10-02

Las inteligencias artificiales se han convertido en el punto culminante de la tecnología moderna, y su capacidad de aprendizaje un tema de fascinación y suspenso. Un caso curioso se ha presentado a través de la experiencia de un usuario llamado Peter Whidden, quien utilizó avanzados sistemas de aprendizaje automático para probar los límites de una IA jugando Pokémon Rojo, un clásico que ha fascinado a generaciones.

Whidden dedicó nada menos que 50.000 horas de simulaciones y experimentación durante cinco años y generó un costo cercano a los 1.000 dólares para conseguir que dicha IA lograra avanzar, pero solo hasta el Mt. Moon. A través del aprendizaje automático, el programa pudo interpretar imágenes y tomar decisiones basadas en ellas.

El concepto de este proyecto era hacer que la IA no solo avanzara en el juego, sino que lo hiciera con una estrategia efectiva. Con un sistema de puntajes que recompensaba acciones como capturar Pokémon o ganar batallas, la IA se incentivó a mejorar su desempeño. Lo curioso viene cuando, a pesar de su progreso, la IA comenzó a comprar un Magikarp repetidamente, a un precio de 500 PokéDólares, más de 10.000 veces. Aunque Magikarp es conocido por ser uno de los Pokémon más débiles, la IA lo veía como un buen recurso debido a su nivel y eso refleja una analogía sorprendente sobre cómo los humanos también a veces toman decisiones no óptimas.

La IA, al igual que muchas personas, se enfrenta a distracciones y a veces persiste en comportamientos que no son beneficiosos, a pesar de conocer las consecuencias. Esto se puede comparar con la elección de comidas poco saludables que, aunque sabemos que son perjudiciales, continuamos consumiendo. Esta es la primera gran reflexión que nos deja esta historia: cómo nuestras decisiones pueden estar influenciadas por patrones de comportamiento poco racionales.

La travesía de la IA comenzó en Pueblo Paleta, donde se encontró con interferencias inesperadas por parte de los NPCs del juego. Aunque esta curiosidad inicial podía parecer útil, llevó a la IA a enredarse y avanzar muy poco al principio. Sin embargo, tras varias adaptaciones, pudo identificar qué Pokémon debía evolucionar y cómo cambiar de ataque eficazmente, pero aún persistían obstáculos en sus combates. A pesar de sus avances, no entendía cuándo debía evitar el combate y cuándo participar, lo que generaba que se estancara en el juego.

Después de múltiples ajustes y mucho tiempo, la IA finalmente pudo derrotar al primer Gimnasio utilizando estrategias más adecuadas, como ataques de tipo agua contra Pokémon de tipo roca. Sin embargo, su mayor tropiezo llegó cuando intentó acceder a un Centro Pokémon y accidentalmente depositó a sus Pokémon, lo que terminó condicionando su comportamiento posterior.

Un aspecto fascinante es que en el transcurso del juego, la IA logró desarrollar un patrón en su comportamiento: replicaba la misma serie de pulsaciones para capturar Pokémon con facilidad, generando así una especie de "abuso del RNG", un concepto usado en la comunidad gaming para obtener resultados óptimos a través de repetir condiciones específicas. Esto demuestra cómo la IA logró adaptarse y aprender de forma efectiva, un rasgo que se asemeja a la forma en que los humanos también buscamos optimizar procesos con el conocimiento acumulado.

Whidden reflexionó que el futuro de las IA podría beneficiarse del aprendizaje transferido, que permitiría a los modelos aprender de experiencias anteriores y aplicarlas a nuevos desafíos, destacando la importancia de la adaptabilidad y el aprendizaje en cualquier forma de inteligencia, ya sea artificial o humana.

Este proyecto es más que solo una curiosidad tecnológica; pone de relieve los paralelismos entre la inteligencia artificial y la naturaleza humana, recordándonos que, aunque creemos ser seres racionales, a veces somos guiados por instintos y decisiones que no siempre son las más sabias. Al final, el viaje de la IA nos invita a cuestionar nuestra propia forma de tomar decisiones en un mundo lleno de distracciones y oportunidades.