Historia del ChatGPT
Desarrollado por OpenAI en 2018, ChatGPT, basado en la arquitectura “Generative Pre-trained Transformer “, ha experimentado una evolución impresionante. Comenzó como un modelo de lenguaje y ha evolucionado en una herramienta revolucionaria en términos de funcionalidad, precisión y versatilidad.
La verdadera revolución llegó en 2020 con Chat GPT3, que con sus 175 mil millones de parámetros ofreció una asombrosa capacidad para generar texto indistinguible de los humanos. Además, expandió sus aplicaciones en el mundo de la imagen y el video convirtiéndose en una herramienta multifuncional de interacción conversacional adaptada a diversas necesidades.
En 2024, la llegada de Chat GPT4.0 establece nuevos estándares en el campo de la inteligencia artificial.
Diferencias entre ChatGPT-3.5 y ChatGPT-4.0: Un Salto Cualitativo en Inteligencia Artificial
Gráfico creado por Chat GPT comparando el rendimiento de GPT 4 vs GPT3
El siguiente gráfico, creado por ChatGPT, compara el rendimiento de GPT-4 frente a GPT-3.5 en una serie de exámenes estandarizados utilizados en la educación y certificación profesional.
Los ingenieros e investigadores de OpenAI han documentado estos resultados en su informe técnico.
Mejoras en Exámenes Estandarizados
ChatGPT-4.0 ha demostrado un rendimiento superior en varios exámenes en comparación con ChatGPT-3.5. A continuación, se detallan los resultados más destacados:
- Verbal GRE: La mejora más notable se observa en el Graduate Record Exam (GRE) verbal, donde ChatGPT-3.5 se situó en el percentil 63, mientras que ChatGPT-4.0 alcanzó el percentil 99. Esto demuestra un avance drástico en la comprensión y generación de lenguaje natural, acercando a ChatGPT-4.0 a niveles de rendimiento humano en contextos académicos.
- Uniform Bar Exam (Derecho): En el examen de certificación de abogados en EE.UU., ChatGPT-4.0 mejora significativamente con un salto del percentil 40 al 63 en comparación con su predecesor. Esta mejora indica una mayor capacidad para manejar conceptos complejos y especializados en el campo del derecho.
- LSAT (Derecho): El rendimiento en el Law School Admission Test (LSAT) se mantuvo constante en ambas versiones, con ChatGPT-3.5 y 4.0 en el percentil 40. Este resultado sugiere que, aunque hay avances en otras áreas, el razonamiento lógico y analítico requerido por el LSAT sigue siendo un desafío constante para el modelo.
- Biología (Nivel Avanzado): En este examen, solo evaluado en la versión 4.0, ChatGPT logró un respetable percentil 62, mostrando que el modelo puede manejar temas científicos complejos con un rendimiento superior al promedio.
- Estadística (Nivel Avanzado): En estadística avanzada, ChatGPT-4.0 mostró una mejora significativa respecto a la versión 3.5, saltando del percentil 40 al 85. Esto resalta la mejora en la capacidad del modelo para procesar y analizar datos numéricos y estadísticos.
Según esta evaluación ChatGPT-4.0 supera a su predecesor.
La mejora más significativa es en Verbal GRE, donde el salto al percentil 99 sugiere que el modelo puede comprender y generar texto con un nivel de sofisticación casi humano.
El mayor desafío, por otro lado, en el LSAT, es en tareas que requieren un alto nivel de razonamiento lógico y crítico.
En resumen, ChatGPT-4.0 ha demostrado un progreso notable en su capacidad para manejar una variedad de tareas complejas. Esto abre nuevas posibilidades, y cuando combinemos la computación cuántica con el Chat GPT viviremos en un mundo que no podemos ni imaginar.