• Radio Red de Medios 89.3 en VIVO
  • Radio Rivadavia 89.7 MHZ San Juan
  • San Juan
  • Nacionales
  • Mundo
  • Opinión
Diario Plural San Juan
Diario Plural San JuanDiario Plural San Juan
Redimensionador de fuentesAa
Search
¿Ya tiene una cuenta? Iniciar sesión
Síguenos
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Diario Plural San Juan > Uncategorized > Los flamantes modelos o3 y o4-mini de ChatGPT alucinan más que sus predecesores
Uncategorized

Los flamantes modelos o3 y o4-mini de ChatGPT alucinan más que sus predecesores

Última actualización: 22 de abril de 2025 3:27 am
Compartir
4 Lectura mínima
COMPARTIR

Los nuevos modelos de razonamiento o3 y o4-mini de OpenAI ofrecen más resultados con alucinaciones que los modelos de razonamiento anteriores de la compañía, con prácticamente el doble de la tasa de alucinaciones registradas en el modelo o1, según pruebas internas de la evaluación PersonQA.

La tecnológica presentó su nueva familia de modelos de la serie o, centrada en el razonamiento, la semana pasada, concretamente, con los modelos o3 y o4-mini, que están diseñados para programar, navegar por la web y generar imágenes de manera autónoma, incluso, con capacidad para “pensar con imágenes”.

OpenAI o3 y o4 mini, lo nuevo de ChatGPT

A pesar de las novedades que integran los últimos modelos de OpenAI, se han encontrado problemas relacionados con alucinaciones en sus resultados, esto es, una cuestión que sufren algunos modelos de Inteligencia Artificial (IA) y que se basa en ofrecer resultados que, a pesar de presentarse de manera coherente, incluyen información incorrecta, sesgada, errónea o, incluso, inventada.

En concreto, los nuevos modelos de razonamiento o3 y o4-mini, alucinan con más frecuencia que los modelos de razonamiento presentados anteriormente por OpenAI, como es el caso de los modelos o1, o1-mini y o3-mini, incluidos otros modelos anteriores como GPT-4o.

Así lo ha señalado OpenAI, en base a los resultados obtenidos en sus pruebas internas sobre alucinaciones, con la evaluación PersonQA, un sistema que pone a prueba los modelos midiendo la precisión de los intentos de respuesta. Tal y como lo ha explicado en el informe técnico, PersonQA valora la precisión, es decir, si el modelo responde correctamente a la pregunta, y la tasa de alucinaciones, la frecuencia con la que el modelo alucina en sus respuestas.

En este sentido, el modelo o4-mini obtuvo peores resultados que los modelos o1 y o3 en las alucinaciones, aunque OpenAI ha señalado que “era de esperar” porque los modelos más pequeños “tienen más conocimientos del mundo y tienden a alucinar más”.

Asimismo, los resultados de PersonQA también han reflejado algunas “diferencias de rendimiento” al comparar o1 y o3, subrayando que o3 tiende a hacer más afirmaciones en general, lo que lleva a afirmaciones más precisas, así como afirmaciones “más inexactas o alucinadas”.

Según los resultados mostrados, o3 alucinó al responder el 33 por ciento de las preguntas realizadas por la evaluación PersonQA. Esto equivale a prácticamente el doble de la tasa de alucinaciones del modelo o1 de OpenAI. Por su parte, o4-mini, obtuvo un resultado del 48 por ciento en la tasa de alucinaciones.

A pesar de estas conclusiones en las pruebas, OpenAI ha afirmado que, por el momento, continuarán investigando para “comprender la causa de este resultado”, y porqué las alucinaciones han aumentado con concretamente con los modelos de razonamiento.

Igualmente, según ha detallado el portavoz de OpenAI, Niko Felix, en declaraciones a TechCrunch, abordar las alucinaciones en todos los modelos de OpenAI “es un área de investigación continua”, en la que trabajan para mejorar la precisión y confiabilidad.

Futuria

LA NACION

Conforme a los criterios de
Comparte este artículo
Facebook Whatsapp Whatsapp Correo electrónico Copiar enlace
No hay comentarios

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


El periodo de verificación de reCAPTCHA ha caducado. Por favor, recarga la página.

Sigue leyendo...

Uncategorized

El Senado no acciona en el rechazo a los pliegos de Lijo y Mansilla y hay bibliotecas divididas

El decreto 137/2025 por el que Javier Milei designó "en comisión" a los jueces federales Ariel Lijo y Manuel García…

5 Lectura mínima
Uncategorized

Los 10 consejos fundamentales para proteger las redes sociales de los ciberdelincuentes

Las redes sociales forman parte esencial de la vida cotidiana, pero también representan riesgos significativos para la seguridad digital. Los…

4 Lectura mínima
Uncategorized

Así le tenes que pedir un aumento de sueldo a tu jefe

Hablar de cuánto dinero se gana resulta incómodo para muchas personas. Pero hay momentos en que es un tema de…

6 Lectura mínima
Uncategorized

Detuvieron a un acusado de múltiples robos de ganado en el norte bonaerense

SANTA FE.- Importante golpe al abigeato en la región centro del país. Esta vez, personal de la Guardia Rural “Los…

5 Lectura mínima
Diario Plural San Juan
© Pagina desarrollada por Estracom Top Up Saldo PayPal Kanopi Kain Malang Harga Lift Rumah
Welcome Back!

Sign in to your account

Username or Email Address
Password

¿Ha perdido su contraseña?