¿Cómo funcionan los dispositivos de voz?

– “Alexa, ajusta la temperatura de la casa a 20 grados”

– “Alexa, quiero comprar helado”

– “Hola Google, ¿qué hay en mi calendario mañana a las 9:00 am?”

– “Hey Google, ¿cómo está el tráfico?”

Controlar las luces, las cerraduras de las puertas, los electrodomésticos, y hasta los dispositivos domésticos inteligentes son algunas de las funciones que podemos realizar hoy en día sin movernos del sofá y con sólo un comando de voz.

Hoy en día, las VUI (Interfaces de Usuario de Voz) están dominando el mundo.

Están por todas partes. Podemos encontrarlas en teléfonos, televisores, hogares inteligentes y otros productos. Cada vez más dispositivos controlados por voz, como Apple HomePod, Google Home y Amazon Echo, están irrumpiendo en el mercado. Las interfaces de usuario de voz están ayudando a mejorar todo tipo de experiencias de usuario, y algunos creen que la voz representará el 50% de todas las búsquedas para el 2020.

Pero, para algo que hacemos todos los días sin pensar, la conversación entre máquinas y humanos es compleja. Entonces, ¿qué es exactamente un dispositivo de voz? ¿qué hay detrás de las tecnologías de estos dispositivos?

¿Qué son Las Tecnologías VUI?

Las tecnologías VUI (Interfaces de Usuario de Voz), son las tecnologías que permiten a las personas interactuar con computadoras y dispositivos a través de la entrada de voz. Se usan por lo general para iniciar un servicio o proceso automatizado, haciendo que estos dispositivos actúen de forma inteligente entendiendo y respondiendo a las diferentes instrucciones.

Ya sea que estemos hablando de VUIs para aplicaciones móviles o para altavoces inteligentes en el hogar, las interacciones de voz son cada vez más comunes en la tecnología actual, en la actualidad hay 50 millones de búsquedas por voz al mes y para que nos hagamos una idea, hace 3 años no eran ni el 10% del tráfico. En el año 2020 se espera que sean 200 millones de búsquedas por mes.

¿Cómo funciona un dispositivo VUI?

Las tecnologías de conducta detrás de las VUI son en cierto grado de inteligencia artificial (IA). La computación en la nube, el machine learning, la recopilación de datos y el procesamiento, se combinan para convertirse en inteligencias artificiales poderosas que presentarán las VUI como un modo indispensable de comunicación con las computadoras.

El proceso de una tecnología VUI se vería así:

Input de voz → Entendimiento del lenguaje natural → Output de voz → Interpretación inteligente → Agente

Entonces, por ejemplo cuando le preguntas a Alexa: “¿Cómo está el tiempo hoy?”, el dispositivo graba tu voz. Luego esa grabación se envía a través de Internet a los Servicios de voz de Alexa de Amazon, que analiza la grabación de tu voz en sus bas. Luego, el sistema envía la salida relevante a su dispositivo. Cuando se le pregunta sobre el clima, se envía un archivo de audio y Alexa le informa el pronóstico del tiempo. Si Alexa necesita responder algo, pasará por el mismo proceso descrito anteriormente, pero en orden inverso.

Como podemos ver, es mucho lo que hay detrás de un simple “Alexa, ajusta la temperatura de la casa a 20 grados” o de un “Hey Google, ¿cómo está el tráfico?”. Los datos y el aprendizaje automático son la base del poder de estos dispositivos de voz, y sólo se irán fortaleciendo a medida que aumente su popularidad y la cantidad de datos que recopila. Con nuestras voces diversas, complejas y variables, más grande es el reto de humanizar y condensar esta experiencia.

Aún así, mucho es el trabajo que se está haciendo para el reconocimiento de voz y la interconexión, incluido el uso de machine learning para reconocer y calcular los patrones de habla específicos de una persona a lo largo del tiempo. El objetivo detrás de estas tecnologías es hacer del lenguaje hablado una interfaz de usuario tan natural como hablar con otro ser humano.

¡No podemos esperar a ver los avances en este terreno!

Solicita aquí gratis nuestro paper “Tu empresa habla (o debería)” para conocer mejor el potencial de tecnologías de reconocimiento de Voz.

Desde Multiplica, estamos investigando y trabajando en proyectos de Voz, te contamos más sobre nuestros servicios en Voice Design.

Por si te perdiste estos imprescindibles

Comentarios