DeepSeek: nuestro de modelo de razonamiento supera al de OpenAI

El laboratorio chino de inteligencia artificial, DeepSeek, ha lanzado una versión abierta de su modelo de razonamiento, el DeepSeek-R1, que según la compañía, iguala el rendimiento del modelo o1 de OpenAI en ciertos benchmarks de IA. Este modelo está disponible en la plataforma de desarrollo de IA Hugging Face bajo una licencia MIT, lo que permite su uso comercial sin restricciones.

El modelo R1 de DeepSeek ha superado a o1 en varias pruebas clave, incluyendo AIME, MATH-500 y SWE-bench Verified. AIME utiliza otros modelos para evaluar el desempeño, mientras que MATH-500 consiste en una serie de problemas matemáticos. Por su parte, SWE-bench Verified se enfoca en tareas de programación. Esta capacidad de superar a OpenAI en estos benchmarks resalta el potencial del modelo como una alternativa viable para aplicaciones comerciales.

Una de las características más destacadas del modelo R1 es su capacidad de razonamiento. A diferencia de los modelos tradicionales, que suelen producir respuestas rápidas pero menos precisas, R1 toma más tiempo (segundos a minutos) para llegar a soluciones, lo que le permite ser más confiable en dominios complejos como la física, las ciencias y las matemáticas. Este enfoque de razonamiento autónomo permite que el modelo se «verifique a sí mismo», evitando errores comunes que afectan a otros modelos de IA.

DeepSeek Lanza una Versión Abierta de su Modelo R1 de Razonamiento, Competidor de OpenAI

DeepSeek también reveló que R1 contiene 671 mil millones de parámetros, lo que lo coloca en una de las categorías más avanzadas en términos de capacidad de procesamiento. Los parámetros, que se refieren a la habilidad de un modelo para resolver problemas, son cruciales para determinar el rendimiento de los modelos de IA. En general, los modelos con más parámetros tienden a ser más efectivos.

Aunque el modelo R1 de 671 mil millones de parámetros es impresionante, DeepSeek también ha lanzado versiones «destiladas» de menor tamaño, que van desde 1.5 mil millones hasta 70 mil millones de parámetros. La versión más pequeña puede ejecutarse incluso en un ordenador portátil, lo que hace que el modelo sea accesible para una amplia gama de usuarios. El modelo completo, por otro lado, requiere hardware más potente, pero está disponible a través de la API de DeepSeek a precios entre un 90% y un 95% más bajos que los de OpenAI.

Sin embargo, hay un aspecto que limita la expansión de R1 fuera de China. Al ser un modelo desarrollado en China, está sujeto a la regulación del gobierno chino, que supervisa los modelos de IA para asegurarse de que sus respuestas reflejen «los valores socialistas centrales». Por ejemplo, R1 no responderá a preguntas relacionadas con la Plaza de Tiananmén o la autonomía de Taiwán, lo que ha generado preocupaciones sobre la censura y el control de la información.

El lanzamiento de R1 ocurre justo después de que la administración saliente de Biden propusiera nuevas reglas más estrictas sobre la exportación de tecnologías de IA hacia empresas chinas. Aunque las empresas de China ya se enfrentan a restricciones en la compra de chips de IA avanzados, las nuevas regulaciones, si se implementan, impondrán límites más estrictos en las tecnologías de semiconductores y en los modelos necesarios para crear sistemas de IA sofisticados.

A pesar de estas barreras, la competencia en el campo de la IA continúa intensificándose. Al menos tres laboratorios chinos, incluidos DeepSeek, Alibaba y Kimi (de Moonshot AI), han presentado modelos que aseguran rivalizan con el o1 de OpenAI. Expertos como Dean Ball, investigador en la Universidad de George Mason, han señalado que los laboratorios chinos seguirán siendo «seguidores rápidos» en el desarrollo de modelos de razonamiento avanzados, lo que podría llevar a la proliferación de modelos capaces de ejecutarse en hardware local y fuera del control centralizado de gobiernos.

Con su enfoque de acceso abierto y precios accesibles, DeepSeek podría cambiar las reglas del juego en la IA global, ofreciendo una alternativa competitiva a los modelos de OpenAI y desafiando el dominio de las grandes corporaciones tecnológicas en el campo de la inteligencia artificial.

DeepSeek: nuestro de modelo de razonamiento supera al de OpenAI

Jose Miguel Gonzalez

Comunidad Arepa

Comentarios

Relacionados

Chats de usuarios de Claude aparecen indexados en Google sin que lo sepan

OpenAI tardó una semana en detectar que sus agentes de IA hackearon Hugging Face

15 consejos para crear imágenes con ChatGPT y Gemini que transforman tus resultados (sin ser experto)