Tecnología

¡Revelaciones Impactantes! ¿Cuánto podría obtener ChatGPT en la PAES?

2025-01-10

Autor: Lucas

¿Puedes imaginar cuánto avance puede lograr la inteligencia artificial en solo un año? Cada vez es más complicado medir estos avances, dado que los algoritmos que sustentan estas tecnologías, como ChatGPT, son secretos bien guardados por sus desarrolladores en OpenAI. Pero, ¿qué tal si te digo que hay una manera sorprendente de calcular su progreso?

La empresa EvoAcademy, experta en capacitación tecnológica, decidió poner a ChatGPT a prueba en la Prueba de Acceso a la Educación Superior (PAES). Este año, los resultados fueron asombrosos, ¡por primera vez la inteligencia artificial alcanzó un puntaje perfecto en una de las secciones! ¿Sería suficiente para ingresar a las carreras más solicitadas del país? ¡Sigue leyendo!

El responsable de este fascinante estudio fue Jonathan Vásquez, profesor adjunto en la Universidad de Valparaíso y Ph.D. en Ciencias de la Computación en George Mason University. Él, junto con el equipo de EvoAcademy, sometió a ChatGPT a la PAES para la admisión regular de 2025, utilizando todas las versiones disponibles del chatbot: desde gpt-4o, la versión estándar, hasta las más nuevas, como o1 y o1-mini.

Los resultados fueron sorprendentes. La versión gratuita de ChatGPT alcanzó un promedio de 907,38 puntos en la PAES 2025. Por su parte, la versión mini logró 843,75 puntos. En contraste, los modelos o1 y o1-mini, enfocados en razonamiento profundo, obtuvieron 865,5 y 857,38 puntos, respectivamente. OpenAI ha declarado que estos nuevos modelos son considerados entre los mejores en lenguaje, alcanzando "niveles similares a un doctorado". Sin embargo, curiosamente, la versión estándar se desempeñó igual o mejor que las variantes más avanzadas en algunas pruebas.

Un dato chocante es que la inteligencia artificial logró 100% de precisión en Historia y Ciencias Sociales con tres de los cuatro modelos. Esta es una primicia en la historia de esos experimentos. Además, el rendimiento en Ciencia mejoró significativamente en un 18% respecto al año anterior, alcanzando un impresionante 909,25 puntos con gpt-4o.

Sin embargo, en Matemáticas, gpt-4o no mostró mejoras, obteniendo 90% y 92% en las pruebas M1 y M2, mientras que en 2024 había alcanzado 90% y 96%. Esto genera inquietudes sobre la real efectividad del avance en este área, a pesar de que OpenAI asegura que sus modelos más nuevos están en línea con las evaluaciones de GPT-4 turbo.

La controversia se multiplica cuando se analiza el rendimiento de los nuevos modelos de razonamiento o1, que a pesar de su sofisticación, no resultaron ser consistentemente mejores que las versiones anteriores de GPT. Por ejemplo, en la prueba de Competencia Lectora, gpt-4o logró un 93,33% de precisión, mientras que los modelos o1 se movieron entre 86,67% y 93,33%.

La evaluación se basó en los desempeños máximos de cada prueba, lo que permitió a los investigadores observar el potencial de cada modelo. Por ejemplo, gpt-4 brilló en Ciencias y su peor resultado fue en Matemáticas (M2), donde obtuvo solo 836 puntos. Sorprendentemente, todos los formatos evaluados alcanzaron puntaje perfecto en Historia y Ciencias Sociales.

¿Qué significa esto? Los modelos de lenguaje operan bajo un sistema de predicción que en ocasiones puede llevar a “alucinar” respuestas incorrectas. Sebastián Cisterna, experto de EvoAcademy, explica que esto puede ocurrir cuando el modelo no puede diferenciar lo más probable de la realidad. Con el tiempo y mejoras en sus algoritmos y bases de datos, estas alucinations tienden a disminuir, lo que podría explicar el desempeño perfecto en Historia.

Comparando con 2024, hubo un notable aumento en el rendimiento en Ciencias, donde el promedio pasó de 769,25 a 909,25. No obstante, en Matemáticas, el avance reportado no se vio reflejado en los resultados. Pero, ¿qué carrera podría acceder la IA si decidiera inscribirse en alguna universidad?

Si el puntaje ponderado de ChatGPT supera el mínimo de las carreras más demandadas, como Medicina en la Universidad de Chile y Ingeniería en la PUC, podría ser un contendiente fuerte. De hecho, esta sería la primera vez que un modelo de IA podría acceder a Medicina en universidades con exigencias de puntaje tan altas.

“Medicina es un caso único porque las universidades tienen diferentes métodos de ponderación. Esto puede complicar el acceso de la IA, dado que no posee un ranking convencional”, aclara Cisterna. La evolución de ChatGPT sigue sorprendiendo y la pregunta persiste: ¿qué deparará el futuro para la inteligencia artificial en el ámbito educativo? ¡La batalla entre humanos y máquinas apenas comienza!