Cada vez que deja un mensaje de voz, habla con alguien en un centro de llamadas o se une a una llamada de conferencia, se están creando datos. Toneladas de datos. Mientras que los asistentes de voz como Alexa y Google Home obtienen la mayor atención, millones de horas de datos de voz permanecen inactivos en las empresas de hoy en día, dejando una enorme cantidad de valor potencial sobre la mesa.

Si los datos de voz son un recurso sin explotar, ¿qué impide que las empresas aprovechen todo su valor? La voz es mucho más difícil de asegurar, entregar y analizar que los datos tradicionales. Presenta desafíos únicos para aplicaciones de aprendizaje automático que requieren datos limpios, diversos y representativos.

Pero también es un momento emocionante en el espacio de la computación de voz, y las compañías que pueden superar estos desafíos obtendrán los beneficios de esta nueva frontera.

Los datos de Enterprise Voice están en todas partes

Mientras que los chatbots tradicionales pueden haber pasado su cenit , la IA conversacional -la capacidad de interactuar con las computadoras a través del habla- está aumentando de manera inequívoca. De hecho, 1 de cada 5 búsquedas en la aplicación móvil de Google son búsquedas de voz, y Amazon Alexa recientemente superó las 10,000 habilidades.

Las interfaces de voz continuarán ampliándose en plataformas habilitadas para Internet de las cosas (IoT) como automóviles, teléfonos inteligentes y navegadores de Internet.

Y podrán mantener conversaciones más largas e inteligentes. Un estudio de Juniper Research pronostica que los chatbots avanzados ahorrarán a la industria del servicio al cliente $ 8 mil millones al año para 2022.

Pero no se trata solo de interfaces de voz. Hay millones de interacciones de voz existentes con humanos todos los días, como llamadas de servicio al cliente, interacciones con proveedores de atención médica y más.

Empresas como Pindrop están incrementando estas llamadas con inteligencia artificial para detectar fraudes, pero solo estamos empezando a arañar la superficie.

Imagine la extracción de datos existentes del centro de llamadas para calcular la probabilidad de que los clientes compren su producto o entreguen métricas de satisfacción del cliente en tiempo real.

Las empresas deben dejar de pensar en los datos de voz como solo una interfaz o el resultado de una conversación. Por el contrario, los datos de voz son una fuente única de información crítica para el negocio.

Los desafíos son abundantes, pero también lo son las herramientas necesarias para resolverlos

Analizar y comprender los datos de voz trae desafíos únicos. Imagina que tienes una conversación de una hora con dos altavoces. ¿Cómo separe las dos voces? ¿Cómo controlas el ruido ambiental? ¿Cómo corriges los sesgos si hay más mujeres que hablantes masculinos? Estos son algunos de los desafíos que enfrenta la naciente industria del análisis de voz.

Se están haciendo disponibles más herramientas para hacerlo más fácil.

Plataformas como Amazon Lex facilitan la creación de reconocimiento de voz y reconocimiento de lenguaje natural en aplicaciones de software. Pero a menudo se enfocan en el texto traducido, perdiendo gran parte del contexto original. El análisis de voz puede determinar la edad, el dialecto, el género, los niveles de estrés y más, todo lo cual requiere trabajar directamente con los datos de voz originales y no con el texto traducido.

Las herramientas son geniales, pero solo si puede acceder a los datos. Las regulaciones y la seguridad de los datos crean obstáculos adicionales para las empresas. La redacción de datos a menudo es necesaria para cumplir con las regulaciones de cumplimiento y entregar datos de manera segura en toda la empresa.

Pero los datos de voz no se pueden transformar simplemente como un número de seguridad social o tarjeta de crédito en una base de datos. Las herramientas necesitan una transcripción anotada para identificar los datos confidenciales y volver a los datos de origen para sobrescribir el audio original. Es posible que se requieran filtros para ofuscar las voces para evitar la correlación entre los datos de voz y otras #características de #identificación.

¡No te pierdas nuestra pagina de Facebook!!