Deportes

Cómo se desempeña el GPT-5 de OpenAI contra otros modelos de IA fronteriza

Cómo se desempeña el GPT-5 de OpenAI contra otros modelos de IA fronteriza
GPT-5 alcanzó una tasa de éxito del 74.9% en SWE-Bench Verificado

¿Cuál es la historia?

Opadai ha presentado oficialmente su último modelo de IA, GPT-5. Se llama un modelo «unificado» que combina las capacidades de razonamiento de la serie O de la compañía con las respuestas rápidas de su serie GPT. Este modelo de próxima generación marca un cambio importante para Chatgpt y OpenAi, mientras buscan crear sistemas de IA que actúen más como agentes que los chatbots tradicionales.

Puede desarrollar aplicaciones de software, administrar calendarios

A diferencia de su predecesor, GPT-4, que proporcionó respuestas inteligentes a una amplia gama de preguntas, el nuevo modelo puede realizar una variedad de tareas para los usuarios. Estas tareas incluyen el desarrollo de aplicaciones de software, la gestión de calendarios y la creación breve de investigación. Para mejorar aún más la experiencia del usuario, GPT-5 viene con un enrutador en tiempo real que ajusta su velocidad de respuesta en función de la complejidad de la consulta.

‘El mejor modelo del mundo’

CEO de Operai Sam Altman ha llamado a GPT-5 «el mejor modelo del mundo» y un «paso significativo» hacia la inteligencia general artificial (AGI). Él dijo: «Tener algo como GPT-5 sería prácticamente inimaginable en cualquier momento anterior de la historia». La compañía está haciendo que GPT-5 esté disponible como el modelo predeterminado para todos los usuarios gratuitos de ChatGPT, marcando un cambio importante en su estrategia para democratizar el acceso a la IA avanzada.

Superar modelos líderes en puntos de referencia clave

Operai afirma que GPT-5 supera o está en par con los principales modelos de IA de Antrópico, Profundoy Xai en puntos de referencia clave. Se destaca en las tareas de codificación, especialmente la «codificación de ambientes», donde se pueden crear aplicaciones de software completas a pedido. Sin embargo, se destaca por su fuerte rendimiento en diseño creativo y escritura, exhibiendo un «mejor sabor» que otros modelos.

Echa un vistazo a los puntajes

En la verificación de SWE-Bench, GPT-5 logró una tasa de éxito del 74.9%en su primer intento, superando por estrecho la Opus 4.1 de Anthrope 4.1 al 74.5%, y superando significativamente a Gemini 2.5 Pro de DeepMind de DeepMind en 59.6%. En el último examen de la Humanidad, GPT-5 Pro (la versión con razonamiento extendido y uso de herramientas) obtuvo un 42%, ligeramente por debajo de Xai’s Grok 4 Heavy, que alcanzó el 44.4%. En GPQA Diamond, GPT-5 Pro obtuvo un 89.4% en su primer intento, superando el 80.9% de Claude Opus 4.1 y superando por poco el 88.9% de Grok 4 Heavy.

Más preciso que su predecesor

Si bien los chatbots de IA no son expertos médicos, cada vez se utilizan cada vez más para asesoramiento de salud. Operai afirma que GPT-5 ofrece un mejor rendimiento sobre las preguntas relacionadas con la salud. En la prueba de alucinaciones duras de Healthbench, GPT-5 (con razonamiento habilitado) mostró una tasa de alucinación de solo 1.6%, una fuerte caída de GPT-4O y O3, que obtuvo un puntaje de 12.9%y 15.8%, respectivamente. En las respuestas a las indicaciones de ChatGPT, GPT-5 (con razonamiento) alucina el 4.8%del tiempo, significativamente más bajo que O3 (22%) y GPT-4O (20.6%).

GPT-5 viene en 3 tamaños

Operai dice que GPT-5 es más seguro que sus modelos anteriores, lo que muestra menos tendencia a engañar o esquiar contra los humanos. La compañía también dice que puede diferenciarse mejor entre los malos actores y los usuarios inofensivos, lo que le permite rechazar preguntas más inseguras mientras rechaza menos inofensivas. Para los desarrolladores, GPT-5 estará disponible en tres tamaños: GPT-5, GPT-5 Mini y GPT-5 Nano, cada uno con diferentes tiempos de razonamiento a través de tareas.

Estará disponible para todos los usuarios

GPT-5 se está implementando a todos los usuarios de ChatGPT. Los suscriptores de ChatGPT Plus ($ 20/mes) obtienen límites de uso más altos para GPT-5 en comparación con los usuarios gratuitos. Aquellos en el Plan Pro de $ 200/mes reciben acceso ilimitado a GPT-5, junto con GPT-5 Pro, una variante más poderosa que aprovecha los recursos computacionales adicionales para respuestas mejoradas. A partir de la próxima semana, GPT-5 también se convertirá en el modelo predeterminado para los usuarios en los planes de equipo, EDU y Enterprise de Operai.

Enlace de origen

Publicaciones relacionadas

Botón volver arriba