No es al ave solitaria que con el cantar se consuela. Pero se llama Lyra, en alusión al pájaro originario de Australia que es famoso por su capacidad de imitar casi cualquier sonido. Se trata del algoritmo capaz de procesar el audio de una película o serie y devolver la posición y la duración en la que deben insertarse los subtítulos. Pero lo más notable de este desarrollo argentino es que, desde septiembre pasado, ya se emplea en los próximos estrenos de Netflix.
“Utilizamos tecnología de aprendizaje profundo, conocida como deep learning, que analiza la voz humana. El algoritmo aprende a detectar los segmentos a partir de muchas películas y series previamente subtituladas por seres humanos. Luego, ya entrenado, es capaz de reproducir esta tarea de forma automática. Cuanto más le enseñamos, mejor funciona”, explica Ezequiel Ansaldi, fundador y CEO de Zowl Labs.
Con sede en Buenos Aires, la empresa nació en 2015 con el fin de especializarse en proyectos de inteligencia artificial y, en particular, de procesamiento de audio y video, desarrollando herramientas que permitan acelerar tareas tediosas para el ser humano.
Autos híbridos y eléctricos en la Argentina: modelos disponibles, precios y autonomía
“El objetivo de reducir los tiempos de entrega y, por ende, el costo se consigue gracias a que la inteligencia artificial trabaja sin supervisión. Es como un robot que ensambla piezas en una fábrica: resulta más barato, más rápido y le permite al hombre ocuparse de tareas más complejas”, continúa el emprendedor.
De esta manera, la firma ya tiene entre sus clientes a compañías de la talla de Acindar, Andreani, Intellivision, King Agro y Axis Communications, junto con grupos de investigación y desarrollo de la Universidad de Buenos Aires, el Institut National de Recherche en Informatique et en Automatique (INRIA) y la Universidad de Rennes, ambos de Francia. “Contamos con más de 40 publicaciones científicas y somos parte del programa NVIDIA Inception”, agrega el emprendedor.
Sin embargo, llegar a Netflix supone, sin dudas, un salto cualitativo en sus iniciativas. “La primera etapa del proyecto requirió de dos meses y del trabajo de dos desarrolladores. Pero el ajuste del sistema es un proceso dinámico, que continuamente busca reentrenar el algoritmo con nuevas películas y series. Todo apunta a que, en un futuro, se puedan generar los subtítulos de forma completamente automática y con la traducción incluida. Pero, al menos por ahora, el ojo experto es necesario para validar el resultado”, completa Ansaldi.
Paul Allen, cofundador de Microsoft, falleció a los 65 años
Ese sentido adiestrado, en este caso, corre por cuenta de los integrantes de la firma Oxobox, una plataforma en la nube creada en Buenos Aires, en 2008, que provee bibliotecas audiovisuales y flujos de tareas colaborativas sobre este tipo de contenidos.
Por ejemplo, gestiona la distribución de comerciales del 35% de los mayores anunciantes de televisión en América Latina. Y suministra el sistema de venta de anuncios digitales a DirecTV en doce países de la región. Además, contribuye a la realización de festivales y premios de publicidad en la Argentina, México, Colombia y Guatemala. Con sus distintas unidades de negocio, de este modo, factura unos $80.000.000 anuales.
“Nuestra plataforma de Software como Servicio para gestionar material audiovisual ya cuenta con más de 2.000 funciones, que se encargan desde la ingesta y trascodificacion hasta el manejo de licencias y manifiestos contractuales. Pero desde el punto de vista técnico, intuimos que podíamos mejorar nuestros paradigmas de control de calidad utilizando inteligencia artificial”, detalla Ramiro Fernández, CEO de Oxobox.
¿Las ciudades inteligentes gastan menos recursos?
“Con nuestra división de OTT Services, somos un Netflix Preferred Fulfillment Partner, también llamados Netflix Preferred Vendor, uno de los 27 agentes de control de calidad que hay en el mundo. Tenemos una eficiencia reportada por Netflix del 99,4%”, subraya.
Pero como la empresa de streaming de contenido multimedia bajo demanda con sede en Silicon Valley justamente exige la mejora continua de los flujos de trabajo de sus proveedores, tanto en materia de calidad como de velocidad de las entregas, no podía haber mejor oportunidad para implementar esta solución, como vanguardia de la próxima generación de complementos de la empresa. De hecho, Fernández anticipa que prevén emplear inteligencia artificial en más de treinta tareas clave, enfocándose en todo aquello que hasta ahora les resultaba imposible sin esa herramienta.
“En el caso de los subtítulos para Netflix, básicamente definimos el alcance funcional y aspectos de ambiente, y Zowl Labs desarrolla el algoritmo. Acordamos comprar el desarrollo completo, incluido el algoritmo y el código fuente sin compilar. Nos reservamos todo derecho de propiedad y modificación”, puntualiza Fernández.
Los resultados, mientras tanto, superan a las expectativas. “En 40 segundos, Lyra devuelve un subtítulo sin leyendas, pero con los párrafos precisos para 90 minutos de contenido. Todavía hay mucho reentrenamiento que hacer porque, si bien tenemos 5.000 horas para alimentarlo, con un conjunto de datos que incluye ‘Luis Miguel, la serie’, ‘The Walking Dead’ e ‘Historia de un clan’, debemos hacerlo con bocados pequeños de no más de 100 horas. Nuestra idea de un uso más ambicioso del algoritmo aún tiene mucho recorrido, pero para control y pronóstico de calidad ya está disponible”, asegura.
De hecho, ilustra que esos 40 segundos que demora para procesar un filme de 90 minutos hoy les permiten ahorrar hasta dos días en subproyectos de subtitulado de ocho jornadas de duración. Y, lo más importante, de acuerdo con su perspectiva, que permite enfocar la contratación de recursos humanos según competencias lingüísticas y no técnicas. “Esto mejora la calidad del subtitulo y la experiencia del usuario que asiste al contenido, además de bajar el costo y el tiempo del proyecto”, concluye.