OpenAI presentó este martes una serie de herramientas innovadoras que facilitarán a los desarrolladores la creación de aplicaciones basadas en su tecnología de inteligencia artificial, mientras la empresa compite con gigantes tecnológicos en la carrera por la inteligencia artificial generativa.
La startup anunció un nuevo instrumento en tiempo real, que se lanzará de inmediato para pruebas, permitiendo a los desarrolladores crear aplicaciones de voz con inteligencia artificial utilizando un único conjunto de instrucciones.
Nuevo sistema para aplicaciones con voz
Anteriormente, el proceso requería que los desarrolladores pasaran por al menos tres etapas: primero, transcribir el audio; luego, ejecutar el modelo de texto generado para obtener una respuesta a la consulta; y finalmente, usar un modelo de conversión de texto a voz.
Una parte significativa de los ingresos de OpenAI proviene de empresas que utilizan sus servicios para desarrollar sus propias aplicaciones de IA, lo que convierte el lanzamiento de capacidades avanzadas en un punto de venta clave.
Además, la competencia ha aumentado a medida que gigantes tecnológicos como Alphabet, matriz de Google, integran modelos de IA capaces de procesar diferentes tipos de información, como video, audio y texto, en sus operaciones.
Ronda de inversionistas para crecimiento de OpenAI
Se espera que los ingresos de OpenAI se disparen a $11.6 mil millones el próximo año, frente a los $3.7 mil millones estimados para 2024, según informó Reuters el mes pasado. La compañía también está en medio de una recaudación de fondos de $6.5 mil millones que podría valorar su capital en $150 mil millones.
Como parte del lanzamiento del martes, OpenAI introdujo una herramienta de ajuste fino para modelos después del entrenamiento, que permitirá a los desarrolladores mejorar las respuestas generadas por los modelos utilizando imágenes y texto.
Este proceso de ajuste fino puede incluir retroalimentación de humanos que alimentan al modelo con ejemplos de buenas y malas respuestas basadas en sus resultados.
El uso de imágenes para ajustar modelos proporcionaría capacidades más robustas de comprensión visual, permitiendo aplicaciones como búsqueda visual mejorada y detección de objetos optimizada para vehículos autónomos, según indicó OpenAI.
Además, la startup reveló una herramienta que permitiría a modelos más pequeños aprender de modelos más grandes, junto con “Prompt Caching”, que reduce algunos costos de desarrollo a la mitad al reutilizar fragmentos de texto que la IA ha procesado anteriormente.
Fuente: OpenAI