Imagen, la herramienta desarrollada por Google para generar ilustraciones en base a un texto

Publicado el

spot_img

A través del uso de mecanismos de inteligencia artificial, ya ha quedado demostrada la capacidad de generar imágenes a partir de una descripción en texto. OpenAI nos sorprendió con DALL-E, un sistema que posteriormente fue presentado en una edición mejorada: DALL-E 2.

Google, a través de su división de investigación, afirma haber logrado un mecanismo más potente. Fue presentado recientemente, bajo el nombre de Imagen.

Imagen, un generador basado en descripciones textuales

Google Research, la división de proyectos de investigación del gigante de Internet, presentó Imagen, un sistema de IA que crea imágenes fotorrealistas a partir de una entrada de texto.

Para codificar el texto presentado al sistema, Imagen utiliza un codificador llamado T5-XXL. Lo que hace este sistema es, en base a los datos que domina, desarrollar un bosquejo de 64 x 64 píxeles. Posteriormente, mediante mecanismos de difusión, la IA amplía la resolución a 256 × 256 píxeles y posteriormente a 1024 × 1024 píxeles, obteniendo resultados nítidos y de aspecto realista, al retocar los detalles durante el proceso de ampliación.

Un aspecto interesante de este sistema es su capacidad de autocorrección. Mientras es refinada la imagen durante su proceso de ampliación, la IA es capaz de evaluar hasta qué punto los retoques aplicados establecen una relación entre la frase de referencia y el resultado obtenido.

Desde Google Research afirman que este es un desarrollo sin precedentes, destacando como logros el establecimiento de optimizaciones en el codificador de texto; el establecimiento de un nuevo difusor de umbral, para obtener imágenes de mayor resolución; la optimización del uso de memoria en los equipos que ejecuten este sistema; y la evaluación positiva del índice de correlaciones entre los textos de referencia y las imágenes generadas.

Las demostraciones de momento se limitan a los ejemplos compartidos por Google. Para evitar riesgos de uso indebido, aún no se ha liberado el uso de esta herramienta. “En este momento, hemos decidido no lanzar el código o una demostración pública. En trabajos futuros, exploraremos un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones”, señala el equipo de Imagen en la web del proyecto. 

Otro detalle destacado por el equipo de Imagen es que, para trabajos futuros, necesitarán refinar la muestra de datos con las que entrenan este sistema, para evitar sesgos, ofensas u otros problemas sociales o distorsiones de la realidad. En esta primera instancia, el foco estuvo puesto en el desarrollo de los aspectos más técnicos del sistema, trabajando con conjunto de datos extraídos de la web sin filtrar.

Una completa descripción técnica de este proyecto, junto a ejemplos que ilustran el potencial de esta herramienta, se encuentran disponibles en el sitio web de Google Research.

Si te ha gustado el contenido Invítanos a un café. ¡Gracias por seguir leyéndonos!

En Portada

Gobierno abre licitación para la autopista del Ámbar

El Fideicomiso para la Operación, Mantenimiento y Expansión de la Red Vial Principal de...

Cristhian Adames impulsa a Tigres del Licey en racha de victorias

Después de una racha de cinco derrotas, ganar tres partidos consecutivos cambia el chip...

Aumentan a 75 los muertos por incendio de Hong Kong

El incendio declarado en siete edificios de un complejo residencial de Hong Kong deja...

Brasil autoriza su primera vacuna contra el dengue para personas de 12 a 59 años

Este artículo fue publicado originalmente en El Día. Brasil dio un paso significativo en su...

Noticias Relacionadas

Así es Shopping Research: la nueva función de ChatGPT que te busca el regalo perfecto estas Navidades

Piensa en la última vez que quisiste comprar algo que no fuera los espaguetis...

Las llamadas spam por fin tienen los días contados: la nueva ley del Gobierno pretende acabar las estafas telefónicas

España quiere acabar con las tediosas llamadas spam desde hace años. Si echamos la...

Cloudflare se enfrenta a LaLiga con una app que registra los bloqueos de sus webs por culpa del fútbol pirata

Cloudflare está en el centro de todas las miradas. Esta nube para el mundo...