Imagen, la herramienta desarrollada por Google para generar ilustraciones en base a un texto

Publicado el

spot_img

A través del uso de mecanismos de inteligencia artificial, ya ha quedado demostrada la capacidad de generar imágenes a partir de una descripción en texto. OpenAI nos sorprendió con DALL-E, un sistema que posteriormente fue presentado en una edición mejorada: DALL-E 2.

Google, a través de su división de investigación, afirma haber logrado un mecanismo más potente. Fue presentado recientemente, bajo el nombre de Imagen.

Imagen, un generador basado en descripciones textuales

Google Research, la división de proyectos de investigación del gigante de Internet, presentó Imagen, un sistema de IA que crea imágenes fotorrealistas a partir de una entrada de texto.

Para codificar el texto presentado al sistema, Imagen utiliza un codificador llamado T5-XXL. Lo que hace este sistema es, en base a los datos que domina, desarrollar un bosquejo de 64 x 64 píxeles. Posteriormente, mediante mecanismos de difusión, la IA amplía la resolución a 256 × 256 píxeles y posteriormente a 1024 × 1024 píxeles, obteniendo resultados nítidos y de aspecto realista, al retocar los detalles durante el proceso de ampliación.

Un aspecto interesante de este sistema es su capacidad de autocorrección. Mientras es refinada la imagen durante su proceso de ampliación, la IA es capaz de evaluar hasta qué punto los retoques aplicados establecen una relación entre la frase de referencia y el resultado obtenido.

Desde Google Research afirman que este es un desarrollo sin precedentes, destacando como logros el establecimiento de optimizaciones en el codificador de texto; el establecimiento de un nuevo difusor de umbral, para obtener imágenes de mayor resolución; la optimización del uso de memoria en los equipos que ejecuten este sistema; y la evaluación positiva del índice de correlaciones entre los textos de referencia y las imágenes generadas.

Las demostraciones de momento se limitan a los ejemplos compartidos por Google. Para evitar riesgos de uso indebido, aún no se ha liberado el uso de esta herramienta. “En este momento, hemos decidido no lanzar el código o una demostración pública. En trabajos futuros, exploraremos un marco para la externalización responsable que equilibre el valor de la auditoría externa con los riesgos del acceso abierto sin restricciones”, señala el equipo de Imagen en la web del proyecto. 

Otro detalle destacado por el equipo de Imagen es que, para trabajos futuros, necesitarán refinar la muestra de datos con las que entrenan este sistema, para evitar sesgos, ofensas u otros problemas sociales o distorsiones de la realidad. En esta primera instancia, el foco estuvo puesto en el desarrollo de los aspectos más técnicos del sistema, trabajando con conjunto de datos extraídos de la web sin filtrar.

Una completa descripción técnica de este proyecto, junto a ejemplos que ilustran el potencial de esta herramienta, se encuentran disponibles en el sitio web de Google Research.

Si te ha gustado el contenido Invítanos a un café. ¡Gracias por seguir leyéndonos!

En Portada

Recortes de la Fed y posibles oportunidades para RD

La Reserva Federal de Estados Unidos (Fed) recortó ayer su tasa de referencia en...

Juegos salvados: Estévez sería onceavo líder de rescates

El criollo lidera la Liga Americana con 40 salvados en sus primeras 46 oportunidades para...

Presidente de Ecuador planteará leyes más duras contra el narco

El presidente ecuatoriano Daniel Noboa propuso el miércoles crear una Asamblea Constituyente vía consulta...

Lewin Díaz a la puerta de hacer historia en KBO

El cañonero Lewin Díaz está a las puertas de hacer historia en la Liga...

Noticias Relacionadas

Internet está a punto de cambiar: China crea el primer chip 6G ‘universal’ con velocidades más rápidas

China ha dado un golpe en la mesa para tomar la delantera frente a...

Nueve errores que cometes al cargar el móvil que ponen en riesgo tu casa, según bomberos

Conectar el móvil, electrodomésticos, diferentes dispositivos electrónicos o medios de transporte como los patinetes...

Cosas absurdas que hacemos con el móvil y no tienen sentido en 2025

Han pasado ya unos cuantos años desde que los móviles llegaron a nuestras vidas....