Cuando te digan que la IA nos va a quitar el trabajo recuerda esto: todavía no es capaz de pasarse Pokémon, literalmente

Pokémon nos ha demostrado lo lejos que está todavía la IA de alcanzar verdaderas capacidades generales y autónomas comparables o superiores a las humanas

Esh Ketchum Pikachu Pokemon Art
Sin comentarios Facebook Twitter Flipboard E-mail

Es posible que algún día la inteligencia artificial entre de lleno en todos los ámbitos laborales de forma que transformará la forma en que realizamos la mayoría de los oficios y profesiones en el planeta. Sin embargo, esa fecha todavía parece lejana. Para empezar, el algoritmo avanzado sigue sin poder terminarse un juego de críos: Pokémon Red.

Un hito modesto. En pleno auge de las promesas sobre la inminente llegada de la inteligencia artificial general (AGI), Anthropic ha presentado con entusiasmo su experimento Claude Plays Pokémon como una señal temprana de progreso. Claude 3.7 Sonnet, su modelo más reciente, logró superar algunas barreras que habían frenado a sus predecesores, como abandonar la zona inicial del juego y obtener varias medallas.

Según Anthropic, este avance fue posible gracias a mejoras en la planificación, la memoria contextual y la capacidad de adaptación de Claude, cualidades que, en teoría, serían esenciales tanto para vencer a líderes de gimnasio como para resolver problemas del mundo real. Sin embargo, el resultado práctico es mucho más matizado: durante semanas, miles de usuarios en Twitch observaron cómo Claude se perdía repetidamente, hablaba con los mismos personajes sin utilidad, o se quedaba atrapado en esquinas del mapa, mostrando una ejecución (todavía) claramente inferior a la humana.

Lo que puede y lo que no hacer. El proyecto utilizó un modelo general sin entrenamiento específico para videojuegos. Claude no tiene conocimiento de las reglas internas del título, sino que infiere el funcionamiento del mundo Pokémon a partir de su comprensión textual previa, imágenes de baja resolución y un seguimiento limitado del estado interno del juego. En las batallas, donde predominan los elementos de texto, el modelo brilla: reconoce tipos, efectividades y elabora estrategias progresivamente más complejas.

Sin embargo, cuando toca interpretar mapas pixelados o navegar entornos en 2D, sus limitaciones se hacen evidentes. Su razonamiento visual es todavía rudimentario: confunde caminos, anda contra paredes o interpreta mal los gráficos del juego, lo cual lo ralentiza considerablemente. Su desempeño mejora en escenarios donde puede acumular datos textuales, pero se ve comprometido por la incapacidad de recordar de forma coherente y sostenida lo que ha aprendido (especialmente cuando su ventana de contexto se satura), lo que lo obliga a comprimir y resumir información, a veces perdiendo detalles cruciales.

Claudepokechart Durante el último año, los modelos de Claude han mostrado un enorme progreso al alcanzar nuevos hitos de Pokémon

Entre el ensayo y el error. Contaban en ArsTechnica que una de las lecciones más interesantes del experimento es cómo Claude, incluso cuando comete errores repetitivos o mantiene creencias incorrectas (como una ubicación equivocada del final de un bosque), en ocasiones puede cuestionar sus propias premisas y cambiar de estrategia. Esa capacidad de “darse cuenta de que no sabe” y actuar en consecuencia sí que marca un hito significativo en el camino hacia la AGI, aunque todavía distante de una competencia plena.

David Hershey, desarrollador del proyecto, destacaba que Claude muchas veces no es consciente de cuál de sus estrategias es mejor, y repite acciones ineficaces por horas antes de reajustarse. Con todo, en algunos intentos, logra armar un plan coherente, hacer un seguimiento organizado de rutas posibles y evitar errores pasados, lo que sugiere que el sistema está comenzando a adquirir una forma incipiente de autorreflexión.

Limitaciones técnicas y promesas. La arquitectura actual de Claude impone barreras: su ventana de contexto de 200.000 tokens, aunque extensa, es insuficiente para mantener un historial profundo y detallado de sus decisiones a lo largo de una partida prolongada. Además, su sistema de memoria se basa en resúmenes de lo aprendido, lo que puede inducir pérdidas de información o errores acumulativos.

El problema no es solo olvidar: también puede incluir información incorrecta que Claude luego asume como cierta, afectando el resto de su juego como si se tratara de una teoría conspirativa mal fundamentada. Aun así, Hershey cree que con algunas mejoras puntuales (como una mejor comprensión visual de las pantallas de la Game Boy o un mayor contexto de memoria) podría permitirles a futuras versiones del modelo completar el juego con una habilidad cercana a la humana.

Cerca de ser “útil”. La gran paradoja del experimento es que su éxito radica en mostrar lo lejos que está Claude de la AGI y, sin embargo, también en lo cerca que podría estar. Su torpeza en Pokémon Red evidencia fallos profundos en la integración de múltiples tipos de razonamiento (visual, espacial, estratégico), pero su capacidad para aprender de errores, reajustar objetivos, y manejar conocimiento en evolución apunta a un potencial significativo.

Para Hershey, el salto entre “no puede hacerlo en absoluto” y “lo hace más o menos” es el más importante en inteligencia artificial. Claude aún no se ha pasado Pokémon, pero ya ha demostrado que puede empezar a jugar, fallar, corregirse y mejorar. Y en el mundo de la IA, eso es posiblemente mucho más que un juego infantil: es una señal de que, a pesar de los tropiezos, el camino hacia una inteligencia verdaderamente general está más cerca. 

La gran pregunta sigue siendo la misma: cuánto.

Imagen | Goodfon, Anthropic

En Xataka Móvil | La insólita demanda contra OpenAI de un padre algún día será película: ChatGPT está convencido de que ha matado a sus hijos

En Xataka Móvil | Un jugador de Pokémon TCG Pocket ha calculado el tiempo que se tardaría en conseguir todas las cartas sin pasar por caja

Inicio