Cada vez más los comandos de voz están al alcance de la mano, en una gran variedad de dispositivos, comenzando por el celular, pasando por Alexa y similares, y hasta en algunos controles remotos.
Ya es casi en forma ubicua que nos encontremos con algo con lo que nos podamos comunicar mediante nuestra voz. Pero todo está aún en pañales, y hay más tecnologías disponibles que cuando se democraticen impactarán aún más de lo que ya lo han hecho.
La manera de hablar con la tecnología ha evolucionado durante los últimos años, comenzando por los teclados físicos y pasando a las pantallas táctiles hasta llegar a la voz. La interacción mediante la voz ha ido introduciéndose poco a poco en la vida de los usuarios, especialmente con la llegada de asistentes de voz y de nuevas soluciones en el ámbito telefónico para facilitar la redirección de llamadas, la recopilación de información básica de la persona que llama o agilizar gestiones como las reservas en un restaurante.
El sector está evolucionando a un ritmo vertiginoso e integrando nuevas herramientas para mejorar su calidad y eficiencia. Según Research and Markets, el mercado relacionado con el reconocimiento de voz va a crecer a un ritmo de un 17,2% anual desde 2019 y alcanzará los 26,79 mil millones de euros para 2025.
En este sentido, masvoz, compañía con más de 15 años de experiencia en servicios de comunicaciones para empresas, analiza las tecnologías de voz que supondrán una revolución en la manera en la que nos comunicamos, ya sea con un contact center o con cualquier otro dispositivo:
- Reconocimiento automático del habla (ASR)
En entornos telefónicos, esta tecnología es la responsable de entender y transcribir cuando el interlocutor dicta un número de DNI o de teléfono a la operadora virtual, lo que permite evitar la marcación vía teclado y crear una interacción más sencilla para el usuario. En un principio, esta tecnología solo era capaz de entender dígitos y letras como números de teléfono. De hecho, en sus comienzos en los años 60, los investigadores lograron que reconociera las cuatro vocales y nueve consonantes, y en los 70 el sistema de ASR más avanzado solo reconocía mil palabras.
Hoy en día, gracias a programas más avanzados, los sistemas son capaces de reconocer el lenguaje natural y se utiliza para transcribir llamadas o conversaciones completas y para subtitular o traducir una voz automáticamente.
- Análisis del habla
Se trata de una tecnología que es capaz de analizar las llamadas de voz en tiempo real. Muy usada en el ámbito de la atención al cliente o el retail, se trata de una herramienta que detecta la emoción, el tono e incluso el estrés en la voz. Estos datos de audio se analizan y también sirven para identificar si un usuario está molesto o frustrado. De este modo, la persona que está al otro lado podrá gestionar mejor la petición o necesidad del usuario y considerar cuál es la mejor manera de abordar un problema. Con toda la información obtenida del análisis de estas interacciones, las compañías pueden mejorar su servicio y adaptarse a las necesidades de su público objetivo.
- Voice Engine Optimization (VEO)
Los altavoces inteligentes con asistente de voz ya son un elemento más en la decoración de muchos hogares. Según cifras de OC&C, en 2022 el 55% de los hogares tendrá uno o varios de estos dispositivos. Por ello, interactuar con los asistentes virtuales se convertirá en algo cotidiano y las búsquedas mediante voz se incrementarán exponencialmente.
De hecho, ComScore afirma que la mitad de las búsquedas en 2020 se harán por voz. Este nuevo hábito significa un desafío para los expertos en marketing digital, puesto que las estrategias de contenido deberán estar enfocadas a la creación de preguntas y respuestas y todo ello en torno a la creación de palabras clave de conversación para responder en lenguaje natural. Esta estrategia para optimizar las búsquedas por voz es lo que se llama Voice Engine Optimization o VEO, concepto que será primordial para elaborar una estrategia de marketing en el futuro.
- Biometría de voz
Esta tecnología se encuentra todavía en fases iniciales de desarrollo pero su llegada supondrá un gran avance en seguridad y privacidad de datos personales. En lugar de usar la huella dactilar o los rasgos faciales, este es un sistema que crea una huella vocal, única, segura e intransferible como medida de autenticación y firma digital. Para obtener la huella vocal de una persona se realizan una serie de pruebas y registros en los que el sistema tiene en cuenta rasgos físicos como la forma y el tamaño de la boca, además de la pronunciación, frecuencia y velocidad de la voz.
Esta tecnología tendrá múltiples aplicaciones en diversos ámbitos. Por ejemplo, con la biometría de voz será posible votar por teléfono en unas elecciones, autorizar transacciones bancarias, obtener una contraseña olvidada o autenticarse en un Contact Center. De hecho, según un estudio de emarketer, en Estados Unidos estiman que, este año, 21 millones de personas harán al menos una compra a través de un altavoz inteligente. En estas transacciones la seguridad es muy importante y los avances en biometría permitirán que estas compras sean totalmente seguras y los datos estén protegidos.
"Gracias a estas nuevas tecnologías, las posibilidades de realizar acciones con la voz se amplían de manera exponencial y cada vez son más las empresas que apuestan por ellas. La capacidad de análisis de los datos que proporcionan permite dar un valor diferencial y personalizar la relación con el usuario, ofreciendo así un servicio más eficiente." señala Alfred Nesweda, CEO de masvoz.
La capacidad del habla es, sin duda, un rasgo inherente al ser humano, pero la forma de utilizarla está evolucionando. Alexa y Google Assistant son ya compañeros en las vidas de los usuarios, pero la tecnología de voz llegará más allá de los asistentes. Hacer un pago con la voz o entender conversaciones en idiomas extranjeros gracias a la traducción simultánea serán realidades que cambiarán el uso del discurso, indicó Ecommerce News.