Tecnología

Un altavoz inteligente permite activar o silenciar zonas de conversación en una habitación

Funciona con pequeños micrófonos independientes, que navegan por el espacio y reconocen las voces de los hablantes

Los pequeños micrófonos individuales del altavoz inteligente pueden colocarse en cualquier lugar de la habitación: se ubican gracias al sonido, sin requerir imágenes.

Los pequeños micrófonos individuales del altavoz inteligente pueden colocarse en cualquier lugar de la habitación: se ubican gracias al sonido, sin requerir imágenes. / Créditos: April Hong/University of Washington.

Pablo Javier Piacente

Un sistema de altavoz inteligente emplea un “enjambre” de diminutos micrófonos que se despliegan en forma independiente por una habitación, detectando las voces de las personas presentes. La tecnología aplicada se combina con algoritmos de aprendizaje profundo, permitiendo a los usuarios silenciar ciertas áreas o separar conversaciones simultáneas, incluso si dos personas que están cerca tienen voces similares. Los diminutos micrófonos robóticos se ubican únicamente mediante el sonido, sin la necesidad de cámaras o imágenes. 

Investigadores de la Universidad de Washington y la empresa Microsoft, en Estados Unidos, han desarrollado un “enjambre” acústico robótico que, junto con redes neuronales artificiales, separa y localiza con alta precisión pequeños micrófonos que navegan por una habitación en forma independiente. El sistema de altavoz inteligente permite silenciar ciertas zonas o activar otras, en función de las necesidades de cada usuario en un momento determinado.

Sonido inteligente

Si nos encontramos en una sala repleta de gente y cerramos los ojos, nos es imposible diferenciar el discurso de cada persona o identificar dónde se encuentra exactamente cada una de ellas en la habitación. Esto es extremadamente difícil de procesar para el cerebro humano, pero el nuevo sistema de altavoz inteligente parece lograrlo. "Por primera vez, utilizando lo que llamamos un “enjambre acústico robótico”, podemos rastrear las posiciones de varias personas que hablan en una habitación y separar su discurso", indicó en una nota de prensa Malek Itani, autor principal del nuevo estudio. 

Según describen los científicos en los resultados de su investigación, publicada recientemente en la revista Nature Communications, el sistema permite localizar y controlar el sonido, aislando por ejemplo a una persona que habla desde un lugar específico en una habitación llena de gente, sin señales visuales provenientes de cámaras. Solamente emplea la información acústica y la procesa mediante algoritmos de aprendizaje profundo.

La “flota” de micrófonos robóticos, cada uno de aproximadamente una pulgada de diámetro, parte automáticamente desde una estación de carga y se distribuye por el espacio. Esto permite que el sistema se mueva entre diferentes entornos y se configure en forma independiente, captando y separando las voces de los hablantes. Cuando es necesario por cuestiones de energía, los micrófonos regresan a la estación de carga.

El sistema permite silenciar o concentrarse en el habla de una región específica en una sala llena de gente. Créditos: Paul G. Allen School / YouTube.

Amplia diversidad de aplicaciones

A medida que se mueven desde su cargador, cada pequeño micrófono robótico emite un sonido de alta frecuencia, similar a los que emplean los murciélagos para ubicarse, utilizando esta señal y otros sensores para evitar obstáculos. El despliegue automático permite que los dispositivos se coloquen solos con máxima precisión, facilitando un mejor control del sonido que si los colocara una persona. 

El equipo de especialistas realizó pruebas en oficinas, salas de estar y cocinas, con grupos de tres a cinco personas hablando. En todos estos entornos, el sistema podía discernir diferentes voces a una distancia de 50 centímetros entre sí con un 90% de efectividad, sin información previa sobre la cantidad de hablantes. 

Las aplicaciones de este sistema de altavoz inteligente son múltiples. En una reunión en una sala de conferencias, por ejemplo, se podría implementar un sistema de este tipo en lugar de un micrófono centralizado, lo que permitiría un mejor control del audio en el recinto.  

Por último, los investigadores creen que a medida que avance la tecnología se podrían implementar enjambres acústicos en viviendas inteligentes, para diferenciar mejor a las personas que hablan con parlantes inteligentes. Por ejemplo, mediante un sistema de este tipo las personas sentadas en un sofá, ubicadas en una “zona activa”, podrían controlar vocalmente un televisor u otros dispositivos.

Referencia

Creating speech zones with self-distributing acoustic swarms. Malek Itani, Tuochao Chen, Takuya Yoshioka and Shyamnath Gollakota. Nature Communications (2023). DOI:https://doi.org/10.1038/s41467-023-40869-8