DeepSeek-V3 utiliza solo 37.000 millones de parámetros activos para cada tarea, lo que reduce los costos de hardware y hace que el modelo sea más accesible
06.01.2025 • 16:30hs • Inteligencia artificial
Inteligencia artificial
Esta firma china lanza un prototipo de inteligencia artificial que promete superar a ChatGPT y Llama
La startup china DeepSeek lanzó recientemente un nuevo modelo de inteligencia artificial llamado DeepSeek-V3, que promete competir con los modelos más avanzados de OpenAI y Meta, como ChatGPT y Llama.
Este modelo, que cuenta con una arquitectura de 'Mixture of Experts' (MoE), utiliza múltiples redes neuronales especializadas para manejar diferentes tareas, lo que le permite ser más eficiente y precisa que sus competidores.
China lanza DeepSeek, una IA que promete superar a ChatGPT y Llama
DeepSeek-V3 fue entrenado con una alta cantidad de datos, alcanzando 14.8 trillones de tokens y 671.000 millones de parámetros. En comparación, el modelo Llama 3.1 de Meta tiene 405.000 millones de parámetros.
A pesar de su tamaño, DeepSeek-V3 utiliza solo 37.000 millones de parámetros activos para cada tarea, algo que reduce los costos de hardware y hace que el modelo sea más accesible.
En pruebas internas, la inteligencia artificial superó a otros modelos como GPT-4o de OpenAI y Qwen 2.5 de Alibaba en una variedad de rubros, incluyendo tareas de codificación y procesamiento de texto.
Además, el modelo fue diseñado para ser compatible con hardware menos potente, algo que facilita su implementación en diferentes entornos.
China presentó su nuevo modelo de inteligencia artificial, DeepSeek, que promete superar a ChatGPT
DeepSeek, respaldada por el fondo de inversión cuantitativo High-Flyer Capital Management, desarrolló este modelo con un presupuesto relativamente bajo de u$s5,5 millones, en comparación con los cientos de millones que suelen requerir los modelos de vanguardia.
La empresa optó por una licencia permisiva, algo que le permite a los desarrolladores descargar y modificar el modelo para una amplia gama de aplicaciones, incluso comerciales.
Algunos críticos precisaron que el modelo puede tener ciertas limitaciones en cuanto a la libertad de expresión, ya que está sujeto a las regulaciones de internet de China.
Por ejemplo, el modelo no proporciona respuestas sobre temas sensibles como la represión de la Plaza de Tiananmen.