Internet está en plena transición de un formato en el que predominaba la palabra escrita hacia otro en el cual crece la influencia del audio y el video.
Durante años, esta versión multimedia de la Red ganó terreno en detrimento del modelo basado en texto. Entre 2017 y 2018, ese proceso se aceleró y ahora el audio y el video son imparables.
Ezequiel Glinsky, director de Tecnología (CTO, sigla en inglés) de Microsoft Argentina, habló con iProUP sobre este proceso y sus consecuencias en las personas y organizaciones.
– Durante años, la Internet multimedia ganó terreno sobre la Red basada en texto. Entre 2017 y 2018 este proceso se aceleró de forma dramática y ahora el audio y el video son imparables. ¿Cuáles son las causas de este proceso?
– Asistimos a lo que se conoce como la Cuarta Revolución Industrial, cuya potencia reside en los datos y cada vez tenemos mayor acceso a cantidades masivas de información; la nube, cuyo enorme poder está comprimiendo la información del mundo y nos permite acceder y hacer más con ella a una escala nunca vista; y los algoritmos, en los que las mejoras recientes han alcanzado logros más precisos, como reconocer el habla e identificar imágenes.
Por lo tanto, las personas comienzan a reconocer en la práctica cómo con estas tres cualidades técnicas, tanto en Internet como en el manejo de otras tecnologías, se complementa la experiencia del usuario al dotarla de imágenes en alta definición, traducciones al instante e integración con múltiples plataformas.
En suma, se trata de un conjunto de operaciones que habilitan nuevas formas de acercarnos y apropiarnos de programas y herramientas. En el caso de Internet en particular, tendemos cada vez más a formatos multimediales, interactivos, con sujetos prosumidores.
– ¿;Podés compartir ejemplos de este proceso dentro de la organización? Me refiero a interfaces basadas en multimedia en lugar de texto
– En Microsoft estamos aplicando Inteligencia Artificial (IA) a todos nuestros productos. Esto hace que los usuarios puedan interactuar con la tecnología de una forma mucho más natural. Sin ir más lejos, en Office 365 ya es posible dictarle a la PC –por ejemplo– los mails que vamos a escribir, Power Point es capaz de detectar audio y no solo subtitularlo sino también traducirlo en tiempo real, etc.
La quinta generación de Toyota RAV4 abandona el diésel y pasa al híbrido
Esto ocurre gracias a la IA incorporada, que permite lograr mayores avances en el reconocimiento de imagen, de voz y en la comprensión de textos. Todo esto habilita a las personas a interactuar con audio, imágenes y texto de otras formas.
¿Algún ejemplo con los clientes de Microsoft?
– Fuera de Microsoft, un ejemplo en el cual se reemplaza el texto por la imagen es el caso de Supervielle. Desde el banco advirtieron que el uso de contraseñas resultaba muchas veces tedioso a la hora de ingresar al mobile banking. Por eso decidieron aplicar los servicios cognitivos de Microsoft Azure para que sus usuarios pudieran acceder a las cuentas a partir de una selfie, es decir, de una imagen. El reconocimiento facial es el método de autenticación más seguro de todos, porque utiliza algo único e irrepetible: nuestro rostro.
La persona se registra con una selfie. A partir de esto, la tecnología identifica puntos en su cara que son únicos e irrepetibles. Esos datos se procesan por un algoritmo de IA. Cada vez que se toma una selfie para iniciar sesión en el mobile banking, el sistema compara que los puntos y distancias del rostro sean iguales a los que ya estaban registrados. Así, se eliminan las contraseñas y se ingresa a la cuenta en apenas segundos.
Otro caso en línea con el anterior es el de Julieta, el chatbot de la Superintendencia de Riesgos del Trabajo (SRT), que a partir de la aplicación de IA puede responder las consultas más comunes en tres segundos, responde las 24 horas, los 365 días del año. Hoy, contesta más del 35% de las consultas. Este caso, en el sector público, es un ejemplo de cómo la IA puede modernizar servicios en dependencias del Estado.
De manera similar opera Alicia, el chatbot del Banco Ciudad, un asistente virtual que permite a los clientes realizar consultas y obtener información de preguntas frecuentes dialogando en un entorno dinámico, alineado a la experiencia digital que el usuario atraviesa en sus conversaciones habituales.
Para terminar, mencionaría el caso de Tambero, uno de las "startups" más prometedoras en AgTech de la Argentina y con peso internacional, que actualizó su interfaz y le posibilita al productor rural conocer en tiempo real el estado de su cultivo y ganado a partir de una serie de alertas, sostenidas por IA, que le posibilitan manejar grandes volúmenes de dato e información.
– Asistentes de voz, celulares que detectan el rostro del usuario, la inteligencia artificial para buscar fotos o traducir idiomas y la realidad aumentada son avances que se basan en las cámaras, los micrófonos, la voz, los oídos y los ojos. ¿Estos desarrollos provocarán la muerte del texto como interfaz del usuario?
– No soy muy amigo de ese tipo de afirmaciones. Hace muchos años, se dijo que el libro electrónico iba a terminar con el libro impreso. Algo parecido se sostuvo con la irrupción del ecommerce, alertando acerca de los peligros que causaría sobre las tiendas tradicionales.
Proptech: cómo alquilar sin inmobiliaria o comprar una casa por crowfunding
En definitiva, todo termina mutando y reconvirtiéndose y, a fin de cuentas, las organizaciones adaptan su realidad de negocio de acuerdo con sus posibilidades. Todas estas tecnologías vienen a potenciar el ingenio y las capacidades humanas. Se trata de construir plataformas poderosas que hagan a la innovación más rápida y accesible.
Se están redefiniendo no sólo los roles de las marcas y empresas, sino, también –y más fuertemente– la posición de los usuarios y consumidores en esta trama.
Son ellos quienes cuentan con más posibilidades de interacción, encuentro, creatividad y expansión. En síntesis, el texto no morirá, sino que cambiará: las interfaces textuales se verán enriquecidas con video, fotos y voz, como ya estamos viendo.
– ¿Cuáles son las posibilidades más cinéticas de esta cultura en línea donde el texto se queda en el fondo y los sonidos y las imágenes se convierten en el lenguaje universal?
– En este punto, me resulta interesante pensar el rol que juega el cuerpo. Si el texto otorgaba cierta uniformidad, con las imágenes y los sonidos el cuerpo entra en escena. La voz, los movimientos, las destrezas destacan ciertos rasgos particulares de las personas.
Y esa multiplicación de las posibilidades permite que las personas puedan interactuar con la tecnología a partir de la forma, los sentidos o los movimientos con los que se sientan más cómodos.
Por ejemplo, alguien que tiene dificultades visuales para leer podrá elegir las opciones de lectura en voz alta para poder tener acceso al texto. La cuestión de la accesibilidad para Microsoft es una prioridad.
Nuestra tecnología facilita a personas con determinadas discapacidades acceder a la información requerida. Como ya explicamos, Office incluye funciones, como Dictate o Narrator, para leer textos en voz alta o escribir a partir del reconocimiento de voz, entre muchas otras.
– ¿Ahora es más fácil comunicarse con las máquinas a través de imágenes y sonidos que mediante texto? ¿;Quiénes usan más estas interfaces multimedia? Por ejemplo, ¿;los millennials?
Argentinos desarrollaron el primer mate eléctrico que no se lava
– Me parece que, de a poco, nos vamos acoplando a distintos formatos. Las interfaces nos proponen una manera distinta de comunicarnos, trabajar, relacionarnos, en definitiva, pensarnos.
Las generaciones más jóvenes se acercan a las máquinas de una forma más natural, que incluye la interacción a partir de imágenes y sonidos. Sin embargo, hay generaciones mayores que han atravesado varias transformaciones digitales y tecnológicas, y que vieron reinventarse sus profesiones, hábitos, etc.
Esas personas no quedan de lado. Me animo a decir que también se integran con facilidad a las disposiciones multimediáticas que ofrecen las tecnologías: desde coordinar una reunión o hacerle alguna pregunta a un asistente virtual hasta grabar un mensaje de voz para amigos.
– La confusión de la desinformación que pesa sobre la vida online, ¿empeorará con este mundo multimedia?
– La vida en la red está expuesta a peligros como en cualquier otro ámbito de nuestra vida. Considero que debemos hacer un uso responsable, no confiar plenamente en todo lo que vemos en la web y, sobre todas las cosas, educarnos en tecnología.
Esto va más allá de un comportamiento individual, debería ser tenido en cuenta en empresas, escuelas, universidades y entidades públicas. En tiempos en los que uno pasa prácticamente todo el día online, es importante ser consciente de sus límites.
– ¿Las fotos y los sonidos alteran nuestra manera de pensar? ¿Un sistema de información dominado por las imágenes y los sonidos da prioridad a las emociones por encima de la racionalidad?
– Las fotos y los sonidos provocan nuevas maneras de pensar. Si uno se pone a hilar fino y se pregunta, ¿;la historia de la civilización no está muy ligada a las imágenes? Pensemos en las pinturas rupestres que antecedieron a la cultura occidental.
Nos hemos ido formateando para ser una sociedad visual y con fuerte atención en la imagen. Sin ir más lejos, hoy vemos cómo varios medios están experimentando nuevos lenguajes y formas de contar historias que incluyen voz, texto y sonido.
Son formatos nuevos acordes a los tiempos actuales y a los intereses del público. Creemos que la incorporación de imágenes y sonidos nos ofrece una nueva manera de consumir aplicaciones, noticias y de relacionarnos que enriquece las interacciones.