¡La nueva IA de Google puede "razonar" y te dejará boquiabierto! Descubre cómo lo hace con un padre, un hijo, un mono y algo de comida
2024-12-20
Autor: Marta
Google está desafiando a OpenAI de manera contundente. Con el lanzamiento de los modelos de IA Gemini 2.0, que resaltaron el impresionante Project Mariner, ahora se suma una característica aún más asombrosa: la versión preliminar de Gemini 2.0 Flash Thinking. Este modelo de IA promueve un tipo de razonamiento que, si bien es motivo de debate, se asemeja al que ofrecen otras IAs como la de OpenAI.
La nueva herramienta ya está disponible para los usuarios en AI Studio, donde pueden elegir este modelo y hacer pruebas que no solo son interesantes, sino que también resaltan su capacidad de resolver problemas a través de un proceso de retroalimentación.
Para demostrar la habilidad de Gemini 2.0 Flash Thinking, propongo un pequeño desafío. ¿Puedes encontrar una combinación de bolas de billar que sume 30? A simple vista, parece que no hay solución, pero aquí viene el truco: la bola con el número 9 puede “invertirse” al 6. Así, una combinación de (6+11+13) resuelve el enigma.
Logan Kilpatrick, de AI Studio, mostró este ejemplo y, al revisar el video, puedes evidenciar cómo Gemini 2.0 identifica este “truco”. ¡Es realmente impresionante!
El desafío del río
El siguiente reto representa otro ejemplo fascinante: imagina un padre, un hijo, un mono y comida que necesitan cruzar un río bajo ciertas condiciones complicadas. Aquí están las reglas:
- El cruce debe hacerse en un bote pequeño. - El bote solo puede llevar dos elementos a la vez. - No puede cruzar el río por sí solo. - Solo el padre o el hijo pueden manejar el bote, y pueden ir juntos si es necesario. - La comida no puede quedar sola con el hijo ni con el mono, porque se la comerían.
Entonces, ¿cuál es la estrategia del padre para llevar a todos al otro lado? Al introducir el problema, Gemini analiza las instrucciones, desglosando cada parte, y en menos de un minuto encuentra la solución correcta, que incluye pasos estratégicos muy ingeniosos: primero lleva la comida al otro lado, luego regresa solo, lleva al hijo, vuelve con la comida, transporta al mono y, finalmente, regresa a por la comida. ¡Problema resuelto!
Este tipo de ejercicios son un verdadero reto para IAs como estas, y ahora podemos saber que Gemini supera con éxito donde Claude 3.5 Sonnet titubea, destacando su capacidad para resolver problemas complejos que un humano consideraría simple.
Además, Jeff Dean, científico jefe en DeepMind, subraya que este modelo está diseñado para utilizar un razonamiento más profundo, aunque la comparación entre las capacidades de estos chatbots y el verdadero pensamiento humano puede ser discutible. Las respuestas podrían ser más lentas, pero resulta fascinante observar cómo descompone problemas complejos en busca de soluciones.
Finalmente, hicimos una prueba adicional pidiéndole que contara las erres en la frase: "el perro de San Roque no tiene rabo porque Ramón Ramírez se lo ha robado". Aunque no es un ejercicio puramente lógico, el modelo cometió un error al contar 10 erres en lugar de 9, reafirmando que, a pesar de su impresionante rendimiento, los modelos como este pueden fallar en cuestiones que nosotros consideramos simples.
En definitiva, Gemini 2.0 Flash Thinking de Google está abriendo nuevas fronteras en el campo de la inteligencia artificial. Su capacidad para “razonar” de manera efectiva podría cambiar las reglas del juego en el desarrollo de nuevas tecnologías y aplicaciones. ¿Estamos viendo el futuro de las IAs en acción? ¡El tiempo lo dirá!