Amazon ha anunciado su incursión en el campo de la inteligencia artificial orientada a la generación de imágenes a partir de descripciones de texto. Durante la conferencia re:Invent de AWS, la compañía presentó Titan Image Generator.
Acceso limitado a esta tecnología
Es importante señalar que, a diferencia de plataformas accesibles para el público en general, como DALL-E de OpenAI o Midjourney, Titan Image Generator no se presenta como una aplicación disponible para uso inmediato en la web, se posiciona como una plataforma destinada a desarrolladores, con acceso programado a través de Amazon Bedrock.
Según lo expresado en el blog oficial de la empresa, Amazon Titan Image Generator se presenta como una herramienta valiosa para clientes pertenecientes a diversas industrias, tales como publicidad, comercio electrónico, medios y entretenimiento.
Esta innovadora solución facilita la creación de imágenes realistas de calidad de estudio o mejora las imágenes existentes mediante indicaciones de lenguaje natural. De este modo, permite una rápida ideación y versión en grandes volúmenes de imágenes, todo ello a un costo reducido.
Orientado a diferentes industrias y más posibilidades
Una característica fascinante de esta nueva inteligencia artificial es su capacidad para generar imágenes a través de comandos de texto. No obstante, su alcance va más allá: una vez creado el objeto principal, los usuarios tienen la flexibilidad de continuar editando el material sin afectar la creación original.
En el transcurso de la conferencia de AWS, se exhibió un ejemplo impresionante: la creación artificial de una iguana sobre un fondo de color sólido. De manera subsecuente, se desafió a la inteligencia artificial a suprimir el fondo existente y reemplazarlo por un escenario boscoso.
Titan Image Generator ofrece la capacidad de cargar una fotografía y solicitar diversas variantes, modificar su tamaño, o incluso agregar o eliminar detalles en secciones específicas según las preferencias del usuario.
Fase preliminar exclusiva en inglés
En la plataforma web de AWS, se destaca que Titan Image Generator aún se encuentra en una fase preliminar, y, al menos hasta el momento, los comandos de texto para generar imágenes deben ingresarse en inglés.
No se ha revelado si Amazon tiene previsto habilitar la capacidad de comprensión de indicaciones en otros idiomas para esta inteligencia artificial. Lo notable de esta nueva propuesta radica en su enfoque no como una aplicación o un sitio web de acceso público, sino como un modelo de inteligencia artificial.
Amazon busca que los desarrolladores aprovechen esta herramienta para crear sus propios generadores de imágenes basados en texto. La compañía enfatiza que, más allá de los datos utilizados para entrenar la IA, los programadores tendrán la libertad de emplear conjuntos de datos personalizados en sus proyectos.
Marca de agua identificable
Adicionalmente, Amazon ha determinado que todas las imágenes generadas con Titan Image Generator incluyan automáticamente una marca de agua invisible.
La empresa ha optado por mantener ciertos detalles en reserva, limitándose a señalar que esta información no se integrará en los metadatos del archivo y será inalterable, sin posibilidad de ser eliminada o modificada.