Atención ahorristas Precio de Bitcoin en dólares: ¿subirá por aranceles de Trump? Más información

Comunidad UP

La plataforma de GPUs de Nvidia para desarrollar IA conversacional que comprende y responde al lenguaje natural ha logrado algunos hitos clave

Por iProUP

13.08.2019 • 12:23hs • Tecnología

Tecnología

Nvidia rompe récords al entrenar a su inteligencia artificial para que "hable" en tiempo real

La plataforma de GPUs de Nvidia para desarrollar y ejecutar AI conversacional que comprende y responde a las solicitudes de lenguaje natural ha logrado algunos hitos clave y ha batido algunos récords que tienen grandes implicaciones para cualquiera que desarrolle su tecnología, incluyendo compañías grandes y pequeñas, ya que gran parte de el código que han utilizado para lograr estos avances es de código abierto, escrito en PyTorch y fácil de ejecutar.

Los mayores logros que Nvidia anunció hoy incluyen su récord en el entrenamiento de BERT, uno de los modelos de lenguaje IA más avanzados del mundo y un modelo de vanguardia ampliamente considerado como un buen estándar para el procesamiento del lenguaje natural.

La plataforma de inteligencia artificial de Nvidia pudo entrenar al modelo en solo 53 minutos, y el modelo entrenado pudo inferir con éxito (es decir, aplicar la capacidad aprendida lograda a través del entrenamiento para lograr resultados) en menos de 2 milisegundos (10 milisegundos se considera una marca alta en la industria), otro récord.

Te puede interesar

20 años no son nada: recorré la historia de Mercado Libre en 20 fotos

Estos avances se amplían y brindan beneficios del mundo real para cualquiera que trabaje con su IA de conversación y hardware de GPU de PNL.

Nvidia logró sus tiempos récord para el entrenamiento en uno de sus sistemas SuperPOD que está compuesto por 92 sistemas Nvidia DGX-2H con 1,472 GPU V100, y gestionó la inferencia en GPU Nvidia T4 con Nvidia TensorRT, que superó el rendimiento de CPU optimizadas en gran magnitud. Sin embargo puso a disposición el código de capacitación BERT y la muestra BERT optimizada de TensorRT a través de GitHub para que todos puedan aprovecharla.

Junto con estos hitos, el ala de Investigación de Nvidia también construyó y entrenó el modelo de lenguaje más grande jamás basado en "Transformadores", que es la tecnología que subyace también al BERT. Este modelo personalizado incluye 8.300 millones de parámetros, lo que lo hace 24 veces más grande que BERT-Large, el modelo BERT más grande actual.

Nvidia ha titulado este modelo "Megatron" y también ofreció el código PyTorch que usó para entrenar este modelo para que otros también puedan entrenar sus propios modelos de lenguaje similares basados en Transformers.

Temas relacionados

Internet Day 2025: cuándo es, quiénes participarán y cómo ser parte del evento

OpenAI ofrece ChatGPT Plus gratis: ¿En qué países estará disponible y quiénes pueden acceder?

Amazon lanzará su internet satelital en Argentina: ¿Cómo será el servicio que compite con Starlink?

Pymes argentinas apuestan a la inteligencia artificial: el 80% invertirá este año para tareas clave

Una altcoin de la red Solana se dispara un 1.000% y genera alerta entre inversores

La SEC fija nuevos criterios para regular las stablecoins: ¿Cuáles quedan afuera y por qué peligra USDT?

"Bitcoin puede desaparecer": el inquietante pronóstico del fundador de Twitter y las tres claves para salvarlo

La guerra comercial global podría acelerar la adopción de Bitcoin como refugio, según expertos

Cuál es el salario promedio pretendido por los argentinos y qué sectores tienen las mayores diferencias

Bill Gates, apocalíptico: reveló que la IA desplazará a los principales trabajos humanos

Cómo mejorar el rendimiento de los equipos con tecnología

Hoy escribe

La inteligencia artificial redefine el trabajo en Argentina: los puestos más buscados por las empresas

Te puede interesar

Caen los mercados y el inversor se pregunta: ¿cuál es la fórmula para recuperarse de una mala apuesta?

Una altcoin de la red Solana se dispara un 1.000% y genera alerta entre inversores

La SEC fija nuevos criterios para regular las stablecoins: ¿Cuáles quedan afuera y por qué peligra USDT?

"Bitcoin puede desaparecer": el inquietante pronóstico del fundador de Twitter y las tres claves para salvarlo

La guerra comercial global podría acelerar la adopción de Bitcoin como refugio, según expertos

Bitcoin alcanza cifra histórica en hash rate y aumenta un 6.81% la dificultad minera

Internet Day 2025: cuándo es, quiénes participarán y cómo ser parte del evento

Wall Street se desploma por aranceles de Trump y arrastra acciones líderes a mínimos históricos

Worldcoin, bajo análisis: expertos revelan qué debe pasar para que suba el precio y cuánto paga al mes

OpenAI ofrece ChatGPT Plus gratis: ¿En qué países estará disponible y quiénes pueden acceder?

Tether lanzará un nuevo dólar cripto tras las leyes de EEUU que podrían dejar a USDT fuera del mercado

Amazon lanzará su internet satelital en Argentina: ¿Cómo será el servicio que compite con Starlink?

Megaestafa cripto: red ilegal movió u$s 7.000 millones y un socio clave fue extraditado a Brasil

ARCA implementará controles más estrictos sobre compras internacionales desde julio

Altcoins: ¿Cuándo comienza el nuevo ciclo y qué tokens pueden rendir mejor en 2025?