Google ha anunciado la llegada de Imagen 2, la segunda generación de su modelo de inteligencia artificial (IA) capaz de crear y editar imágenes a partir de un texto. La versión mejorada se encuentra ahora disponible para un público más amplio, especialmente para los clientes de Google Cloud que utilizan Vertex AI y que han sido aprobados para el acceso.
A pesar de las mejoras sustanciales en calidad de imagen y nuevas opcionescomo la capacidad para renderizar texto y logotipos, Google no ha revelado la información sobre los datos utilizados para entrenar el nuevo modelo. Además, no se ha introducido forma alguna para que los creadores tengan opción de participar en el avance de Imagen 2.
Imagen 2, desarrollada con tecnología de Google DeepMind
En comparación con la primera generación del desarrollo, la calidad de imagen ha mejorado significativamente. La capacidad de Imagen 2 para generar texto y logotipos la equipara con otros modelos líderes en generación de imágenes, como DALL-E 3 de OpenAI y Titan Image Generator de Amazon. No obstante, el trabajo de Google Destaca al poder renderizar texto en varios idiomas, incluyendo chino, hindi, japonés, coreano, portugués, inglés y español.con planes de agregar más idiomas en 2024.
Gracias a «nuevas técnicas de entrenamiento y modelado«, Imagen 2 puede comprender descripciones más detalladas y, de esta forma, es capaz de ofrecer respuestas precisas a preguntas sobre elementos en una imagen. Estas técnicas también mejoran la comprensión multilingüe, permitiéndole traducir un comando en un idioma y mostrar el resultado en otro.
El uso de SynthID, resulta clave en esta IA.Google afirma que estas marcas de agua son resistentes a ediciones de imagen, como compresión, filtros y ajustes de color. La detección de estas marcas de agua requiere una herramienta proporcionada por Google que no está disponible para terceros.
Detalles que quedan por conocer
Aunque Google no ha revelado los datos utilizados para entrenar Imagen 2, la empresa mantiene silencio sobre este asunto. A pesar de las preocupaciones sobre la generación de contenido generado por IA, Google no proporciona un mecanismo para que los creadores opten por no participar o recibir compensación. En cambio, ofrece una política de indemnización que protege a los clientes elegibles de IA de vértice contra reclamaciones de derechos de autor relacionados tanto con el uso de datos de entrenamiento de Google como con las salidas de Imagen 2.
Si bien Imagen 2 busca abordar problemas que afectan a la creación de imágenes por IA, donde el modelo genera copias exactas de ejemplos de entrenamiento, las preocupaciones sobre propiedad intelectual siguen estando ahí. Las empresas, según una encuesta de Acrolinx, consideran la propiedad intelectual como su mayor preocupación en el uso de inteligencia artificial generativa. El caso es que Google ha dado un paso importante para plantar batalla en un segmento del mercado que, ahora mismo, está en franca expansión.