¿Videoconferencia desde el naufragio del Titanic?


Puerta del océano

Expediciones OceanGate

Un investigador ha llevado la tecnología de videoconferencia a uno de los lugares más remotos de la tierra: los restos del naufragio del HMS Titanic, que descansa en el lecho marino a 13,000 pies debajo de la superficie.

“Es como si ahora pudiéramos realizar videoconferencias desde el abismo”, cube Alex Waibel, investigador de la Universidad Carnegie Mellon y Instituto de Tecnología de Karlsruhe.

¿Asustado todavía?

Waibel es un experto en tecnología de texto a voz. Actualmente, la única forma en que los investigadores que exploran los restos del Titanic u otros objetivos en aguas profundas en sumergibles se comunican con la superficie es a través de mensajes de texto enviados por sonar. Las señales de radio no funcionan bien bajo el agua, lo que presenta un dilema de comunicaciones para el que los científicos han estado encontrando soluciones desde la Segunda Guerra Mundial.

durante una reciente Expediciones OceanGate viaje, Waibel narró su inmersión y usó tecnología de reconocimiento de voz para convertir lo que decía en mensajes transmisibles. En la superficie, la tecnología en la que Waibel y su equipo fueron pioneros luego volvió a sintetizar los mensajes de texto crudos en video usando IA. El resultado fue un video casi en tiempo actual que usaba la voz de Waibel sobre un video que parecía que sus labios se movían en sincronía con las palabras. Estos esfuerzos están destinados a ayudar a la comunicación pure en entornos extremos, pero también podrían tener potencial en los mercados de consumo. Waibel es investigador de Zoom y asesora la investigación de IA y el desarrollo de tecnología lingüística de la empresa.

“Al interpretar y recrear la comunicación de voz pure, estamos tratando de reducir la carga de trabajo de los científicos y pilotos en tales misiones de forma pure, a pesar de los desafíos impuestos por el agua salada, el estrés operativo, el diálogo conversacional y las malas condiciones acústicas”, dijo Waibel a CMU. Aaron Aupperlee.

Hemos escrito sobre el tremendos avances y crecimiento del mercado de reconocimiento de voz, que está entrando en una fase acelerada de desarrollo y adopción en varios sectores clave. El trabajo de Waibel se basa en esa tendencia con un mecanismo de entrega que utiliza transmisiones de bajo ancho de banda (en este caso por sonar) para entregar efectivamente video completo, aunque sintetizado, al usuario last.

La tecnología utiliza una voz sintetizada que suena como el orador, basándose en los avances en la tecnología de texto a voz impulsada por IA.. Otra aplicación potencial de la tecnología es la traducción rápida de un idioma a otro, donde un usuario last ve un video en un idioma comprensible que el hablante en realidad no conoce.

Related Articles

Cadena de suministro de China: Shenzhen no se construyó en un día

El Monetary Instances publicó recientemente una...

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

spot_img

Stay in touch!

Follow our Instagram