Deportes

Por qué los últimos modelos de IA de OpenAI son menos confiables que los predecesores

En su informe técnico para O3 y O4-Mini, Openai descubrió que el modelo O3 alucinó en respuesta al 33% de las preguntas sobre Personqa, el punto de referencia interno de la compañía para medir el conocimiento de un modelo sobre las personas.

Eso es casi el doble de los modelos de razonamiento anteriores de OpenAI, O1 y O3-Mini, que obtuvieron un puntaje de 16% y 14.8%, respectivamente.

El modelo más nuevo, O4-Mini se desempeñó aún peor en Personqa, alucinando el 48% del tiempo.

Enlace de origen

Publicaciones relacionadas

Botón volver arriba