LEONCIO HUAMÁN: Peruano premiado por el MIT diseña dispositivo inclusivo que transcribe la voz en texto



LEONCIO HUAMÁN: Peruano premiado por el MIT diseña dispositivo inclusivo que transcribe la voz en texto

EL INGENIERO ENTRÓ AL RANKING DE INNOVADORES MENORES DE 35 LATINOAMÉRICA 2019 DEL MIT TECHNOLOGY REVIEW: Compartir el aula con compañeros universitarios con discapacidad auditiva lo llevó a buscar una solución de la mano de la tecnología. Con el wearable Vision D, Leoncio Huamán logró hacer realidad ese sueño: mejorar la comunicación de personas con problemas auditivos para que puedan entender y comunicarse con su interlocutor.

La tecnología de inteligencia artificial y nube fueron empleadas en este dispositivo IoT (Internet de las Cosas) que ofrece una transcripción del discurso oral a texto que llegará casi en tiempo real a la persona con discapacidad auditiva para que pueda mantener una conversación manteniendo el contacto visual y sin necesidad del lenguaje de señas.

Gracias a este innovador invento, Huamán entró al ranking del concurso Innovadores menores de 35 Latinoamérica 2019 del MIT Technology Review, propiedad del Instituto Tecnológico de Massachusetts.

La investigadora en el Departamento de investigación en Virología y Biotecnología del Instituto Conmemorativo Gorgas (Panamá) y miembro del jurado, Sandra López, destacó que el proyecto "es innovador y excelente" y valora su "impacto positivo directo y su capacidad de mejorar la calidad de vida" sus usuarios.

Mejor calidad de vida
Este dispositivo -llamado Vision D- ha sido probado satisfactoriamente por 15 miembros de la Asociación de Jóvenes y Adolescentes Sordos del Perú, y Huamán espera que pueda ser utilizado por los beneficiados de programas sociales del Ministerio de Desarrollo e Inclusión Social (Midis), institución a la cual se acercará próximamente.

Los adolescentes de 13 a 16 años se mostraron muy interesados en probar el dispositivo, sobre todo porque el visor se parece al scouter o rastreador de ki de la popular serie anime Dragon Ball Z, que mide el poder de los guerreros. Con su retroalimentación pudo afinar el prototipo del dispositivo, diseñado con piezas impresas en 3D.

El sistema completo está compuesto por un procesador con pantalla y teclado que se conecta a un micrófono y, a su vez, al wearable que se debe colocar en las gafas del usuario. Además, requiere de una conexión a Internet (3G o 4G) o Wifi.

Al utilizar el servicio Watson Speech to Text que corre en la nube pública de IBM, cada vez que alguien se comunique por el micrófono, el dispositivo enviará la información al procesador para que la información verbal sea traducida a texto.

La pantalla mostrará en tres líneas de texto y el mensaje luego se reflejará en una mica de vidrio ubicada sobre el lente para que la persona con discapacidad auditiva pueda leer la información con hasta dos segundos de retraso. Así podrá continuar la comunicación verbal con su interlocutor y mantener un diálogo fluido, sin perder el contacto visual.

"La información también será enviada por mensaje de texto al celular del usuario", precisó Huamán a la Agencia Andina
.

Además, el procesador se conecta con otro servicio de IBM que permite traducir el discurso en el idioma preferido. Si el interlocutor habla inglés, por ejemplo, el usuario de Vision D podrá leer el texto en español.

"Vision D también podría ser de utilidad a los estudiantes con dificultades auditivas para que entiendan sus clases sin necesitar de un intérprete de señas", dijo el ingeniero electrónico, quien se desempeña como Solution Architect Hybrid Solutions en IBM Perú.

Acceso al público
Su objetivo es que este wearable llegue a más personas con problemas auditivos. Por ello, espera que el premio del MIT le permita obtener una inversión económica para masificar el uso de Vision D. "Con el premio obtuve la oportunidad de viajar a México a fines de este mes de enero para participar en una mesa de negocios con inversores de todo el mundo", contó.

La fabricación de un dispositivo cuesta un estimado de 180 dólares (aproximadamente 500 soles). "El implante coclear normalmente puede requerir de entre 10,000 y 20,000 dólares y los audífonos medicados cuestan unos 1,000 soles porque deben ser configurados para cada usuario", comentó. Con esta propuesta, las personas con discapacidad auditiva tendrán una solución más económica.

Huamán no planea vender el dispositivo en el mercado nacional. El ingeniero electrónico buscará alianzas para asegurar su producción masiva y después se asegurará que llegue a las personas más necesitadas.

El proyecto -que realmente inició en el 2015 y luego fue retomado en el 2018- tiene aún más retos pendientes. Huamán planea reducir el tamaño del dispositivo que se ubica en las gafas del usuario para hacerlo más portable. Ya cuenta con una maqueta impresa en 3D para ello.

Por otro lado, la tecnología utilizada también puede mejorar. Si logra el financiamiento, se puede emplear otros servicios que permitan analizar el contenido. "El usuario podría recibir al finalizar el día un resumen o un análisis de los temas sobre los cuales tuvo una conversación", agregó. En su opinión, aplicando inteligencia artificial se podría evaluar el sentimiento de la comunicación para identificar momentos positivos, negativos o neutrales.

También está a la expectativa del apoyo de la comunidad. Por eso, renunció a la patente y compartió su código de programación para que otros desarrolladores aporten recomendaciones a su propuesta.

Lee más noticias de ciencia, tecnología e innovación en la Agencia Andina.




Recibe directamente las noticias ingresando tu correo:

(Le llegará un mensaje para confirmar la suscripción.)
Con tecnología de Blogger.