La semana ha estado marcada por importantes avances en el mundo de la inteligencia artificial, con especial atención a Gemini 1.5 Pro y el lanzamiento de Astra.
Las nuevas capacidades de Gemini 1.5 Pro
Pietro Schirano, un desarrollador con conocimientos en programación, ha publicado un video donde muestra las capacidades de estas nuevas tecnologías utilizando un script creado con las herramientas de Google.
Impresionado por las demostraciones de Gemini que reconocían objetos captados por una cámara, Schirano creó su propia versión de Gemini 1.5 Pro Flash utilizando Python.
El script permite que la cámara del ordenador interprete lo que ve en tiempo real. En el video, Schirano aparece sosteniendo su teléfono móvil y el script describe en la pantalla su apariencia física y lo que está haciendo (sostener el iPhone). Sorprendentemente, el script también reconoce una puerta en el fondo de la imagen.
I was so impressed with the Astra demo at Google I/O yesterday that I decided to build my own version using Gemini 1.5 Pro Flash.
It’s so fast and really good. ⚡️
It was even able to detect the gate! Content is streamed directly from my camera.
Voice via @elevenlabsio pic.twitter.com/qr2yvToQet
— Pietro Schirano (@skirano) May 15, 2024
Todavía quedan cosas por pulir en el script
Si bien el script aún no está optimizado y solo analiza fotogramas individuales, Schirano tiene planes para optimizarlo y hacerlo “más mágico” antes de lanzarlo al público. Además, espera que en el futuro pueda analizar vídeo en tiempo real.
Este ejemplo demuestra el potencial de la inteligencia artificial para transformar nuestra realidad.
Se abre un sinfín de posibilidades y aplicaciones, especialmente en el ámbito de la accesibilidad. La creatividad de programadores como Schirano nos acerca a un futuro donde la inteligencia artificial no solo es ciencia ficción, sino una herramienta tangible que mejora nuestras vidas.
En lugar de enfocarnos en las críticas, debemos aprovechar el ingenio y la innovación para explorar las aplicaciones prácticas de estos avances. La inteligencia artificial tiene el potencial de resolver problemas reales y mejorar la calidad de vida de las personas.
Es importante destacar que el video de Schirano muestra un caso de uso específico, y las capacidades de Gemini 1.5 Pro y Astra van mucho más allá.