Imagen, la herramienta desarrollada por Google para generar ilustraciones en base a un texto

Publicado el

spot_img

A través del uso de mecanismos de inteligencia artificial, ya ha quedado demostrada la capacidad de generar imágenes a partir de una descripción en texto. OpenAI nos sorprendió con DALL-E, un sistema que posteriormente fue presentado en una edición mejorada: DALL-E 2.

Google, a través de su división de investigación, afirma haber logrado un mecanismo más potente. Fue presentado recientemente, bajo el nombre de Imagen.

Imagen, un generador basado en descripciones textuales

Google Research, la división de proyectos de investigación del gigante de Internet, presentó Imagen, un sistema de IA que crea imágenes fotorrealistas a partir de una entrada de texto.

Para codificar el texto presentado al sistema, Imagen utiliza un codificador llamado T5-XXL. Lo que hace este sistema es, en base a los datos que domina, desarrollar un bosquejo de 64 x 64 píxeles. Posteriormente, mediante mecanismos de difusión, la IA amplía la resolución a 256 × 256 píxeles y posteriormente a 1024 × 1024 píxeles, obteniendo resultados nítidos y de aspecto realista, al retocar los detalles durante el proceso de ampliación.

Un aspecto interesante de este sistema es su capacidad de autocorrección. Mientras es refinada la imagen durante su proceso de ampliación, la IA es capaz de evaluar hasta qué punto los retoques aplicados establecen una relación entre la frase de referencia y el resultado obtenido.

Desde Google Research afirman que este es un desarrollo sin precedentes, destacando como logros el establecimiento de optimizaciones en el codificador de texto; el establecimiento de un nuevo difusor de umbral, para obtener imágenes de mayor resolución; la optimización del uso de memoria en los equipos que ejecuten este sistema; y la evaluación positiva del índice de correlaciones entre los textos de referencia y las imágenes generadas.

Las demostraciones de momento se limitan a los ejemplos compartidos por Google. Para evitar riesgos de uso indebido, aún no se ha liberado el uso de esta herramienta. “En este momento, hemos decidido no lanzar el código o una demostración pública. En trabajos futuros, exploraremos un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones”, señala el equipo de Imagen en la web del proyecto. 

Otro detalle destacado por el equipo de Imagen es que, para trabajos futuros, necesitarán refinar la muestra de datos con las que entrenan este sistema, para evitar sesgos, ofensas u otros problemas sociales o distorsiones de la realidad. En esta primera instancia, el foco estuvo puesto en el desarrollo de los aspectos más técnicos del sistema, trabajando con conjunto de datos extraídos de la web sin filtrar.

Una completa descripción técnica de este proyecto, junto a ejemplos que ilustran el potencial de esta herramienta, se encuentran disponibles en el sitio web de Google Research.

Si te ha gustado el contenido Invítanos a un café. ¡Gracias por seguir leyéndonos!

En Portada

Realizan operativo para incautar patinetas eléctricas que operaban de forma irregular en SFM

SAN FRANCISCO DE MACORÍS.– La Policía Nacional realizó un operativo en esta ciudad para...

El roster definitivo de RD para el Clásico Mundial de Béisbol

Por fin el anhelado roster del Clásico Mundial de Béisbol salió de manera oficial,...

Alza del oro está beneficiando los ingresos fiscales del Estado

Las recaudaciones fiscales por concepto de los impuestos a la minería podrían definirse como...

Victor Wembanyama le gana el duelo a Cooper Flagg

Los San Antonio Spurs resistieron un empuje tardío de los Dallas Mavericks y se...

Noticias Relacionadas

Elon Musk va por Apple y Samsung: Starlink podría lanzar su propio móvil con conexión satelital

Starlink continúa expandiendo sus planes de negocio para llegar a nuevos mercados. En los...

¿Es malo cargar el móvil toda la noche? Estos son los hábitos que dañan la batería de tu teléfono

Ya sabemos que la batería es una de las partes del móvil que más...

España se suma al veto a las redes para menores: cómo funciona y qué otros países lo aplican

Pedro Sánchez ha aprovechado su intervención en la Cumbre Mundial de los Gobiernos en...