Una IA capaz de generar rostros en base a clips de audio de personas hablando

Publicado el

spot_img

A estas alturas ya no nos vamos a sorprender de lo que puede ser capaz de hacer la Inteligencia Artificial en diferentes ámbitos, incluyendo un modelo de Inteligencia Artificial capaz de recrear visualmente cómo será una persona en función de la forma en la que habla.

Este modelo de Inteligencia Artificial del que os hablamos existe, se llama Speech2Face, y le basta tan sólo tres segundos de un clip de audio para generar la correspondiente recreación visual, aunque la precisión mejorará conforme el clip de audio sea de duración superior.

Dicho modelo fue generado por científicos del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT, del cual ya escribieron un artículo al respecto, publicado en el año 2019.

Un logro de la IA basándose únicamente en clips de audio

Para conseguir que el algoritmo de IA sea capaz de imaginar al rostro de una persona en base a un fragmento de audio, entrenaron a un modelo utilizando millones de vídeos disponibles tanto en YouTube como en el resto de Internet, en los cuales se muestran a personas hablando.

En el proceso de capacitación del modelo de IA no ha habido participación human alguna. Esto ha permitido que el modelo pueda establecer correlaciones entre la forma del habla con el rostro de las personas, incluyendo aspectos como la edad, género y origen étnico de las personas.

Para mejorar aún más la precisión, los investigadores crearon un decodificador facial que lleva a cabo la reconstrucción de la cara, sin considerar variantes de ese mismo rostro como posiciones e iluminaciones diferentes: en las reconstrucciones aparecen los rostros mirando al frente con una iluminación frontal.

Si bien existen problemas en algunos casos, como cuando se habla con la voz lo suficientemente elevada o más bien baja, generándose confusiones en la recreación, y que en las recreaciones no son todo lo perfecta posibles a las personas hablantes, en este punto queda en cuestión el aspecto de la privacidad.

Los científicos se defienden que este modelo fue generado para fines científicos y que «no puede recuperar la verdadera identidad de una persona por su voz».

Más información/crédito de la imagen: Speech2Face

Si te ha gustado el contenido Invítanos a un café. ¡Gracias por seguir leyéndonos!

La noticia Una IA capaz de generar rostros en base a clips de audio de personas hablando fue publicada originalmente en Wwwhatsnew.com por Fco. José Hidalgo.

En Portada

Banco Mundial destaca estabilidad y crecimiento de RD

Representantes del Directorio del Banco Mundial destacaron  la estabilidad macroeconómica y política, así como...

Víctor Estévez: «La entrega total del grupo nos llevó a la final»

Los Toros del Este están de vuelta en la serie final tras pasarse cuatro...

Maquinista fallecido en accidente de tren en Barcelona

El maquinista del tren que esta noche ha chocado contra un muro de contención...

Varios heridos al chocar tren con un muro caído en las vías en España

Un tren de cercanías chocó este martes contra un muro de contención que cayó...

Noticias Relacionadas

Esta marca de tecnología va a dejar de hacer móviles, pero aseguran que los usuarios tendrán soporte

El mercado de la telefonía móvil vive una creciente demanda de fabricantes que desean...

La escasez de memoria RAM es tan elevada que se ha producido el primer robo en una fábrica

La escasez de la memoria RAM continúa azotando a los fabricantes tecnológicos. Esta situación...

La escasez de memoria RAM es tan elevada que se ha producido el primer robo en una fábrica

La escasez de la memoria RAM continúa azotando a los fabricantes tecnológicos. Esta situación...