Expertos y usuarios destacaron la precisión del modelo en la resolución de problemas matemáticos y su habilidad para generar código funcional a gran escala
28.03.2025 • 14:45hs • Guerra IA
Guerra IA
IA: DeepSeek sacude la competencia global con su nuevo modelo de codificación y matemáticas
DeepSeek, la empresa china de IA, presentó una versión mejorada de su modelo de inteligencia artificial (IA), el DeepSeek-V3-0324.
Esta nueva iteración incorpora importantes avances en áreas como la generación de código y el razonamiento matemático.
DeepSeek lanza un nuevo modelo con mejoras clave
Con 685.000 millones de parámetros, el modelo se basa en el sistema de razonamiento R1 y se diseñó como una herramienta multifuncional, aplicable tanto a asistentes virtuales como a tareas de desarrollo web.
Esta actualización se ofrece bajo la licencia MIT, a diferencia de versiones anteriores, una licencia de código abierto ampliamente utilizada que permite su uso, modificación y distribución sin restricciones comerciales.
La nueva versión tiene una puntuación de 59,4 en la American Invitational Mathematics Examination (AIME), una de las pruebas de matemáticas más reconocidas en los Estados Unidos, y supera ampliamente la marca de 39,6 que obtuvo su versión anterior. Además, en pruebas de programación como LiveCodeBench, el modelo mejoró en 10 puntos, alcanzando una puntuación de 49,2.
El DeepSeek-V3-0324 es capaz de generar más de 800 líneas de código sin errores y procesar más de 20 tókens por segundo, características que destacan su eficiencia en tareas de programación.
Su arquitectura se basa en un sistema conocido como Mixture-of-Experts, que distribuye las tareas entre módulos especializados para optimizar el rendimiento sin un aumento significativo en los costos computacionales.
Tanto expertos y usuarios destacaron la precisión del modelo en la resolución de problemas matemáticos y su habilidad para generar código funcional a gran escala. Además, el modelo tiene el potencial de competir con los principales actores del sector de la inteligencia artificial.
Este modelo está disponible en plataformas como Hugging Face y en los repositorios oficiales de DeepSeek, y fue integrado en servicios en la nube de startups como Hyperbolic.
En ese sentido, Li Bangzhu, fundador de AIcpb.com, señaló que las capacidades de codificación del modelo son mucho más robustas y que esta versión podría allanar el camino para futuros desarrollos como el R2.
El lanzamiento del DeepSeek agita la competencia con EE.UU
Este lanzamiento se da en un contexto de intensa competencia tecnológica entre China y Estados Unidos, con ambos países tomando medidas restrictivas sobre el acceso a tecnologías clave, como los semiconductores avanzados necesarios para entrenar modelos de IA.
Además, los gobiernos de ambos países implementaron bloqueos y restricciones a servicios de Internet, generando un entorno de tensión en el ámbito tecnológico.
A pesar de su crecimiento, DeepSeek enfrentó críticas internacionales, especialmente en países como Australia, donde se limitó el uso de sus tecnologías por motivos de seguridad.
Además, sus modelos de IA fueron señalados por eludir temas sensibles para el Gobierno chino, como la masacre de Tiananmen de 1989 o la situación de Taiwán, lo que generó preocupación sobre su imparcialidad.