Por qué los últimos modelos de IA de OpenAI son menos confiables que los predecesores

Adolph D. Ggarcia abril 19, 2025

0 Menos de un minuto

En su informe técnico para O3 y O4-Mini, Openai descubrió que el modelo O3 alucinó en respuesta al 33% de las preguntas sobre Personqa, el punto de referencia interno de la compañía para medir el conocimiento de un modelo sobre las personas.

Eso es casi el doble de los modelos de razonamiento anteriores de OpenAI, O1 y O3-Mini, que obtuvieron un puntaje de 16% y 14.8%, respectivamente.

El modelo más nuevo, O4-Mini se desempeñó aún peor en Personqa, alucinando el 48% del tiempo.

Enlace de origen

Adolph D. Ggarcia abril 19, 2025

0 Menos de un minuto

Por qué los últimos modelos de IA de OpenAI son menos confiables que los predecesores

Adolph D. Ggarcia

Lady Gaga uniéndose a la temporada 2 del ‘Miércoles’ cuando Netflix cae los primeros 6 minutos

La ciudad de Mississippi detrás de la taquilla golpeó a los pecadores

George Wendt, norma de ‘Cheers’, una vez acusó a John Boehner por error en la televisión

Eng vs WI, 2nd ODI: los anfitriones anuncian jugando xi

Toronto FC cierra lamentablemente mayo con pérdida ante Charlotte

Lady Gaga uniéndose a la temporada 2 del ‘Miércoles’ cuando Netflix cae los primeros 6 minutos

Finalmente conocemos la identidad del villano principal ‘Bridgerton 4’

Avril Lavigne actuará en Warped Tour 2025

SpaceX lanza 23 satélites Starlink en el cohete Falcon 9 de California – SpaceBlight ahora

Equipo de EE. UU. Inspirándose de Gaudreaus por delante del enfrentamiento de 4 naciones

Sitio web de Kanye West Swastika Shirt eliminado después de una reacción violenta

Subscribe to our mailing list to get the new updates!

El senador Chris Van Hollen, D-Md., Niega la opción de foto de 'Margarita-Gate' después de El Salvador

Ponga primero a su gente con la propiedad de los empleados

Publicaciones relacionadas

Lady Gaga uniéndose a la temporada 2 del ‘Miércoles’ cuando Netflix cae los primeros 6 minutos

Finalmente conocemos la identidad del villano principal ‘Bridgerton 4’

Avril Lavigne actuará en Warped Tour 2025

SpaceX lanza 23 satélites Starlink en el cohete Falcon 9 de California – SpaceBlight ahora

Equipo de EE. UU. Inspirándose de Gaudreaus por delante del enfrentamiento de 4 naciones

Sitio web de Kanye West Swastika Shirt eliminado después de una reacción violenta