Neuronautas
Posts
🔥Cogieron la presión! OpenAI lanza o3-mini

🔥Cogieron la presión! OpenAI lanza o3-mini

Otra semana cargadita de avances, esto no para!

Jose E. Fajardo
February 01, 2025

Semana del 27 al 31 de Enero

¿Qué lo que ta’ pasando aquí?

Otra semana cargadita de avances, esto no para. La mas importante: la salida de o3-mini en ChatGPT, en directa respuesta de Deepseek. No es mucho mejor, pero lo puedes usar ya mismo gratis y “ver” como piensa.

Ayer, OpenAI cogió la presión y liberó o3-mini, el último modelo de razonamiento enfocado en la eficiencia, y con metricas ligeramente superiores a Deepseek-R1. Pruébalo activando la funcion Reason!
Sam Altman y David Sacks (jefe de IA y crypto de Trump) se quejaron de que Deepseek entrenó injustamente R1 con su modelo o1. Esto es irónico porque llevan entrenando sus modelos con datos de todo el mundo sin pedirles permiso.
Perfiles profesionales falsos que son IAs están surgiendo en LinkedIn. "No necesito pausas para el café, no incumplo los plazos y superaré a cualquier equipo de redes sociales con el que haya trabajado: garantizado."
OpenAI sacó ChatGPT Gov, un ChatGPT para las agencias del estado. También firmó contratos con laboratorios nacionales para usar o1 en proyectos de armas nucleares.
Alibaba, Deepseek y Google sacaron nuevos modelos también. Es bueno saber que Google sigue vivo.

Ahora, ¿que yo debería saber de todo esto?

El último modelo de razonamiento más avanzado y eficiente de OpenAI, o3-mini, fue liberado a los usuarios gratis a través de ChatGPT.

Es la primera vez que todo el mundo podrá acceder a un modelo de razonamiento de OpenAI. Me imagino que están desesperados.

Además puedes ir viendo el proceso de razonamiento, que fue una idea que copiaron del chat de Deepseek, donde se puede ir viendo todas las cadenas de razonamiento que realiza el modelo para llegar a la respuesta final.

Un punto importante es que este modelo incluye las funcionalidades de desarrollo (function calling, structured outputs, developer messages), que permitirá que sea utilizado por programadores para desarrollar nuevas aplicaciones.

Finalmente podremos ver los primeros productos impulsados por modelos de razonamiento.

Por otro lado, el o3-mini no permite capacidades de visión, y solo está disponbile a traves de la API para porgramadores en los niveles 3-5 de la API de OpenAI.

El o1 se queda como el modelo por default para razonamiento más profundo, y consultas multimodales (de texto, imagen y video).

La idea del o3-mini es mayor eficiencia a una inteligencia ligeramente superior al o1. Tiene un apromedio de tiempo de respuesta de 7.7 segundos, comparado a los 10.16 segundos del o1-mini.

En esta tabla se pueden ver las diferencias en distintas métricas entre Deepseek-R1, o1 y o3-mini

Benchmarks	Deepseek-R1	o1	o3-mini (high)
GPQA Diamond (Preguntas de Ciencia a Nivel de PhD)	71.5	75.7	79.7
Nivel en Codeforces (Plataforma de Desafios de Programacion)	2029	2061	2130
AIME 2024 (Matemáticas de Olimpiadas)	79.8	79.2	87.3

Otro punto importante de este lanzamiento es el costo: o3-mini tiene es 14 veces más barato que o1 en tokens de salida y entrada. Sin embargo, sigue siendo 4 veces más caro que Deepseek-R1

Ladrón que roba a ladrón…

Básicamente, OpenAI dice que tienen evidencia de que Deepseek fue entrenado usando destilación de los modelos de OpenAI.

Esto es como que Deepseek haya utilizado miles de millones de respuestas de ChatGPT para entrenar sus propios modelos e imitar el razonamiento y respuestas del modelo de OpenAI.

Pero también OpenAI utilizó injustamente millones de datos de empresas en el mundo completico y no ha tomado responsabilidad. Entonce no tamo en na’.

Entonces, Deepseek hizo trampa?

Incluso si esto es cierto, no desmeritaría de ninguna manera los avances realizados por los ingenieros de Deepseek, pues utilizaron técnicas innovadoras de aprendizaje por refuerzo, y aplicaron eficiencias que rompieron con la idea de "más datos = mejores modelos".

Ademas, las prácticas de destilación de modelos grandes en modelos mas pequeños son un estándar en el mundo de los LLMs, y una herramienta poderosísima para democratizar el acceso a las IAs más avanzadas, pues permite a modelos de fuente abierta aprender las capacidades de los modelos privados y más grandes.

ChatGPT y el gobierno

OpenAI sacó ChatGPT Gov, un plan para agencias de Estados Unidos que permite utilizar modelos de OpenAI de manera segura en nubes independientes de Azure.

Dicen hacerlo con el objetivo de que en el futuro cercano se pueda autorizar que modelos de OpenAI manejen y analicen datos sensibles no accesibles al público.

A través de productos como ChatGPT Gov y acuerdos comerciales con empresas militares y OpenAI, comenzamos a ver en la práctica como el liderazgo en Inteligencia Artificial de un país se traduce en avances en otros sectores, como en aplicaciones militares y gubernamentales.

También, OpenAI firmó un acuerdo con los laboratorios nacionales de Estados Unidos para potenciar la investigación científica. Uno de los principales programas de investigación es uno que se trata de defensa ante armas nucleares.

Dicen que es una colaboración crucial para que cumplir con la mision de que la AGI (Inteligencia Artificial General) sea desarrollada de manera segura y que beneficie a la humanidad. Cualquiera que lo ve lo compra.

¿Quieres promocionar tu empresa, producto, servicio o evento a una comunidad de empresarios e ingenieros de IA? Trabajemos juntos.