¿Qué hacer con tanta información? ¿Cómo procesarla? ¿Qué uso darle? Entre tanta abundancia hay quienes no saben qué hacer. "Lo importante no es el dato, sino sacarle jugo al dato", dice Martín Fernández Campos, un científico de datos en Uruguay, disciplina que ha crecido en el el mundo y demanda una mayor cantidad de expertos.
"La ciencia de datos es una forma de análisis estadístico que busca predecir. Mediante aprendizaje automático o algoritmos, basado en información que ya tiene, poder predecir datos a futuro", comentó Natalia Castro, que integra el programa en Data Science, que se ofrece en Uruguay, y es una colaboración entre el MIT (Instituto Tecnológico de Massachusetts) y una alianza de tres instituciones públicas: Universidad Tecnológica (UTEC), Agencia Nacional de Investigación e Innovación (ANII) y Plan Ceibal.
Fernández Campos es uno de ellos. Integra el Observatorio Ambiental del Ministerio de Ambiente, por lo que esta disciplina ya ha llegado al ámbito público. En lo que se está trabajando ahora es en un proyecto que, en base al procesamiento de imágenes ambientales y el aporte de colaboradores que les llegan, intentan predecir la ocurrencia de la aparición de floraciones de cianobacterias.
En el campo, se está trabajando en otros proyectos. Uno en el área forestal. Cuando se tala un árbol, la madera queda tirada en el campo y hay un aparato que las recoge. Una persona es la encargada de indicar cuál es el recorrido idóneo para recorrer esos lugares en el menor tiempo posible. Fernández Campos trabaja en un algoritmo que busca optimizar ese tiempo. "Aunque sea un 3% más rápido, en total se logra muchísimo ahorro", indicó.
Las aplicaciones también son sociales. Una de ellas es la detección temprana de autismo. La idea es utilizar video y procesamiento de video para ayudar en el diagnóstico. "La idea es generar estímulos en los niños, en base a ellos un algoritmo los procesa y genera una clasificación de riesgo de padecer autismo". Si bien nada de esta herramienta sustituye a lo que pueda indicar un médico, sí es cierto que hay un problema en la detección tardía del autismo y la idea que tienen es ayudar en el proceso de detección y la futura salud del niño.
Aplicaciones comerciales y bancarias
Gonzalo Pérez es otro de los que cursó esta maestría y logró ser premiado en un concurso presentado por la Agencia de Gobierno Electrónico y Sociedad de la Información (Agesic). La idea es aprovechar la inteligencia artificial para explorar datos.
Lo que desarrolla en un software facilita mucho la exploración de datos. "Los obtiene, procesa y muestra al usuario de diferentes formas", contó en una presentación. Una persona que es dueña en un restaurante puede saber gracias a estos algoritmos diferentes características de sus visitantes: "Por ejemplo, el 80% de las quejas las vas a tener de un 20% de los clientes", comentó. "La idea es desagregar la complejidad del dato", comentó.
Cuando una persona va a pedir un préstamo a un banco, la entidad realiza un análisis de riesgo de su persona: lo hace en base a otros préstamos que haya pedido, del historial crediticio. Hay científicos de datos que buscan ayudar a estas empresas a hacer análisis más completos, que obtienen información de las personas basada en un "scrapeo de la web". Esta es una técnica utilizada mediante programas de software que lo que hace es extraer información de un sitio web. Es información de lo que el usuario va dejando rastro en la web. La idea es que se haga un perfil de riesgo más afinado de cada persona.
Las grandes compañías ya lo aplican
Pedidos Ya es una de las empresas que más ha incorporado científicos de datos. Un área de aplicación es en la prevención de fraude: el objetivo general es identificar patrones de comportamiento fraudulento para prevenir ataques, contó a Cromo Agustina Sanguinetti, directora de Data Analytics de la empresa.
Hoy hay gente que hace reclamos fraudulentos de vouchers, cuyas personas intentan hacer un uso indebido de los beneficios que hace la firma. Los científicos de datos son claves para crear programas que permiten analizar y detectar estas amenazas antes de que se efectivice el robo de un descuento.
La segunda aplicación es para prevenir problemas en la operativa de los comercios y restaurantes que le pueden aparecer a los socios. Bajo análisis de datos, se busca ayudarlos a conocer cuándo pueden tener problemas de entrega ante una eventual alta demanda de pedidos. Eso requiere un análisis de información para el cual los expertos son indispensables.
El también llamado data science es, además, indispensable para las fotos de los productos de Pedidos Ya. "Lo que estamos trabajando es que una vez el socio sube esa foto le podemos decir automáticamente si esa foto es aceptada o rechazada", indicó Sanguinetti. La idea es que si es aceptada no interfiera una persona, si es rechazada se le expliquen los motivos por el cual no puede aparecer en el sistema y si está en duda sea analizada por un equipo de expertos fotográficos. Desarrollar esta tecnología requiere expertos en ciencia de datos que crean el algoritmo en cuestión.
Los dueños de los comercios, además, pueden gestionar sus propios menúes: lo que allí hacen es utilizar técnicas de lenguaje natural para identificar ciertas cosas de los textos que añaden. "Por ejemplo, analizar los ingredientes de un producto y lograr determinar, de manera automática, si es vegetariano o vegano. O si es un producto para compartir. De esa forma logramos categorizarlos dentro de nuestra plataforma", indicó.
En Mercado Libre
Mercado Libre también trabaja en la predicción de fraude. El sitio prohíbe subir una imagen a la publicación de un producto con un número de teléfono. La idea es que no pases por arriba a la plataforma. Uno de estos algoritmos creados identifica si esa imagen contiene un teléfono o no y, en ese caso, la herramienta prohíbe esa fotografía de forma automática. También es capaz de dar de baja de forma instantánea publicaciones de armas y drogas.
Si bien se aplica a nivel operativo con el objetivo de que se respeten las normas internas de la plataforma, tienen la intención de que mucha de la información que acumulan se pueda ofrecer a los usuarios. Por eso, desde el área de vehículos, inmuebles y servicios, cuentan con un laboratorio de investigación que busca asesorarlos en una compra y elaboran informes para colaborar con esa búsqueda.
"Por ejemplo, se les puede indicar la baja de precios en Punta Gorda que mejoraron a como estaban los precios respecto al año pasado. Ahí publicamos este tipo de información para aportar a la industria", dijo Esteban Angulo, director de Marketing de contenidos de la firma.
El director de la compañía indicó la importancia que tiene esta ciencia para los nuevos profesionales. "Antes te decían: ‘saber inglés va a ser clave’. Hoy saber lenguaje de datos es lo que era antes saber inglés", concluyó.
Fuente: elobservador.uy