MGIE, la IA de Apple para editar imágenes tal como se hace con Photoshop

También están preparando una IA al estilo de ChatGPT.

La competencia en el ámbito de la inteligencia artificial se intensifica: OpenAI lidera con su próximo lanzamiento, el ChatGPT con GPT-5 en desarrollo, mientras que Microsoft presenta su Copilot con GPT-4, y Google impulsa Gemini.

¿Qué hay de Apple?

Aunque Cupertino llega tarde al juego, su debut no solo es previsible, sino que tampoco debería considerarse una desventaja, dada su influencia en sectores como el de los smartphones. Esta semana, Apple reveló MGIE, su primer modelo de inteligencia artificial.

En plena efervescencia de la inteligencia artificial, Apple siempre ha adoptado una postura cautelosa y calculada. Mientras otras grandes tecnológicas aceleraban para lanzar sus herramientas de IA tras la irrupción de ChatGPT, el equipo de Tim Cook permanecía en silencio.

Sin embargo, se rumorea que en Cupertino se ha desarrollado un chatbot al estilo de Apple GPT, y se esperan importantes anuncios sobre inteligencia artificial para finales de 2024. MGIE representa un comienzo sumamente prometedor.

Descripción y Funcionamiento de MGIE

Recientemente, un equipo conformado por expertos de Apple y la Universidad de California en Santa Bárbara presentó el Motor de Generación de Imágenes Multimodales (MMLM, por sus siglas en inglés).

También conocido como MGIE, se trata de un modelo de inteligencia artificial de código abierto diseñado para editar imágenes de manera similar a Photoshop, pero utilizando comandos de texto simples y la potencia de la IA.

Aunque ya existen editores de imágenes impulsados por IA, el equipo detrás de MGIE señala en su documento que “las instrucciones humanas a menudo son demasiado concisas para ser capturadas y seguidas por los métodos actuales”.

Como consecuencia, los ajustes realizados a menudo resultan mediocres o por debajo de las expectativas. MGIE emplea un enfoque diferente, utilizando modelos de lenguaje multimodales de gran escala para comprender las instrucciones.

Además, el modelo se entrena con una variedad de imágenes. En resumen, el aprendizaje de MMLM contribuye a que MGIE comprenda mejor las órdenes en lenguaje natural, incluso cuando estas no son particularmente detalladas o densas en descripciones.

Salir de la versión móvil