El miércoles, Openai anunció el lanzamiento de dos nuevos modelos, O3 y O4-Mini, que combinan capacidades de razonamiento simuladas con acceso a funciones como navegación web y codificación. Estos modelos marcan la primera vez que los modelos centrados en el razonamiento de OpenAI pueden usar cada herramienta CHATGPT simultáneamente, incluido el análisis visual y la generación de imágenes.
Operai anunció O3 en diciembre, y hasta ahora, solo han estado disponibles modelos derivados menos capaces llamados “O3-Mini” y “03-Mini-High”. Sin embargo, los nuevos modelos reemplazan a sus predecesores: O1 y O3-Mini.
Operai está implementando acceso hoy para los usuarios de ChatGPT Plus, Pro y del equipo, con los clientes de Enterprise y EDU que obtienen acceso la próxima semana. Los usuarios gratuitos pueden probar O4-Mini seleccionando la opción “pensar” antes de enviar consultas. El CEO de Operai, Sam Altman, tuiteó que “esperamos lanzar O3-Pro al nivel profesional en unas pocas semanas”.
Para los desarrolladores, ambos modelos están disponibles a partir de hoy a través de la API de finalización de chat y la API de respuestas, aunque algunas organizaciones necesitarán verificación para el acceso.
“Estos son los modelos más inteligentes que hemos lanzado hasta la fecha, que representan un cambio de paso en las capacidades de ChatGPT para todos, desde usuarios curiosos hasta investigadores avanzados”, afirmó Openii en su sitio web. Operai dice que los modelos ofrecen una mejor eficiencia de costo que sus predecesores, y cada uno viene con un caso de uso previsto diferente: O3 apunta a un análisis complejo, mientras que O4-Mini, es una versión más pequeña de su modelo SR de próxima generación “O4” (aún no lanzado), optimiza para la velocidad y la costumbre.

Operai dice que O3 y O4-Mini son multimodales, que presentan la capacidad de “pensar con imágenes”.
Crédito: OpenAI
Lo que distingue a estos nuevos modelos de los otros modelos de Openai (como GPT-4O y GPT-4.5) es su capacidad de razonamiento simulado, que utiliza un proceso de “pensamiento” paso a paso simulado para resolver problemas. Además, los nuevos modelos determinan dinámicamente cuándo y cómo implementar ayudas para resolver problemas de varios pasos. Por ejemplo, cuando se les preguntó sobre el uso futuro de energía en California, los modelos pueden buscar de forma autónoma los datos de servicios públicos, escribir código de Python para crear pronósticos, generar visualización de gráficos y explicar los factores clave detrás de las predicciones, todo dentro de una sola consulta.