Una IA capaz de generar rostros en base a clips de audio de personas hablando

Publicado el

spot_img

A estas alturas ya no nos vamos a sorprender de lo que puede ser capaz de hacer la Inteligencia Artificial en diferentes ámbitos, incluyendo un modelo de Inteligencia Artificial capaz de recrear visualmente cómo será una persona en función de la forma en la que habla.

Este modelo de Inteligencia Artificial del que os hablamos existe, se llama Speech2Face, y le basta tan sólo tres segundos de un clip de audio para generar la correspondiente recreación visual, aunque la precisión mejorará conforme el clip de audio sea de duración superior.

Dicho modelo fue generado por científicos del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT, del cual ya escribieron un artículo al respecto, publicado en el año 2019.

Un logro de la IA basándose únicamente en clips de audio

Para conseguir que el algoritmo de IA sea capaz de imaginar al rostro de una persona en base a un fragmento de audio, entrenaron a un modelo utilizando millones de vídeos disponibles tanto en YouTube como en el resto de Internet, en los cuales se muestran a personas hablando.

En el proceso de capacitación del modelo de IA no ha habido participación human alguna. Esto ha permitido que el modelo pueda establecer correlaciones entre la forma del habla con el rostro de las personas, incluyendo aspectos como la edad, género y origen étnico de las personas.

Para mejorar aún más la precisión, los investigadores crearon un decodificador facial que lleva a cabo la reconstrucción de la cara, sin considerar variantes de ese mismo rostro como posiciones e iluminaciones diferentes: en las reconstrucciones aparecen los rostros mirando al frente con una iluminación frontal.

Si bien existen problemas en algunos casos, como cuando se habla con la voz lo suficientemente elevada o más bien baja, generándose confusiones en la recreación, y que en las recreaciones no son todo lo perfecta posibles a las personas hablantes, en este punto queda en cuestión el aspecto de la privacidad.

Los científicos se defienden que este modelo fue generado para fines científicos y que «no puede recuperar la verdadera identidad de una persona por su voz».

Más información/crédito de la imagen: Speech2Face

Si te ha gustado el contenido Invítanos a un café. ¡Gracias por seguir leyéndonos!

La noticia Una IA capaz de generar rostros en base a clips de audio de personas hablando fue publicada originalmente en Wwwhatsnew.com por Fco. José Hidalgo.

En Portada

Guerra en Irán y medidas económicas de Abinader para el país

Senadores, en su mayoría del oficialismo, exhortaron este martes a los partidos de oposición...

MLB: Oneil Cruz ante un gran reto en el 2026 de MLB

Oneil Cruz fue considerado un súper prospecto desde antes de convertirse en pelotero profesional....

Delta suspendió trato especial a congresistas en aeropuertos

La aerolínea Delta suspendió temporalmente el trato especial que da a los congresistas en...

Dominicana llega a su año 70 en la MLB consolidada como la gran mina

Cuando el 23 de septiembre de 1956 Osvaldo Virgil inscribió la primera bandera dominicana...

Noticias Relacionadas

Desarrollan una pupila de metal líquido que imita al ojo humano para la futura visión de las máquinas

La visión de las máquinas es clave para tecnologías como robots, coches autónomos o...

Desarrollan una pupila de metal líquido que imita al ojo humano para la futura visión de las máquinas

La visión de las máquinas es clave para tecnologías como robots, coches autónomos o...

Cómo la guerra en Irán puede hacer que tu próximo móvil sea más caro: el riesgo de una nueva crisis de los chips

El conflicto en Oriente Medio no solo sube el precio de la gasolina de...