Nuevas herramientas de OpenAI para la creación de apps de voz con inteligencia artificial

3 octubre, 2024

OpenAI presentó este martes una serie de herramientas innovadoras que facilitarán a los desarrolladores la creación de aplicaciones basadas en su tecnología de inteligencia artificial, mientras la empresa compite con gigantes tecnológicos en la carrera por la inteligencia artificial generativa.

La startup anunció un nuevo instrumento en tiempo real, que se lanzará de inmediato para pruebas, permitiendo a los desarrolladores crear aplicaciones de voz con inteligencia artificial utilizando un único conjunto de instrucciones.

Nuevo sistema para aplicaciones con voz

Anteriormente, el proceso requería que los desarrolladores pasaran por al menos tres etapas: primero, transcribir el audio; luego, ejecutar el modelo de texto generado para obtener una respuesta a la consulta; y finalmente, usar un modelo de conversión de texto a voz.

Una parte significativa de los ingresos de OpenAI proviene de empresas que utilizan sus servicios para desarrollar sus propias aplicaciones de IA, lo que convierte el lanzamiento de capacidades avanzadas en un punto de venta clave.

Además, la competencia ha aumentado a medida que gigantes tecnológicos como Alphabet, matriz de Google, integran modelos de IA capaces de procesar diferentes tipos de información, como video, audio y texto, en sus operaciones.

Ronda de inversionistas para crecimiento de OpenAI

Se espera que los ingresos de OpenAI se disparen a $11.6 mil millones el próximo año, frente a los $3.7 mil millones estimados para 2024, según informó Reuters el mes pasado. La compañía también está en medio de una recaudación de fondos de $6.5 mil millones que podría valorar su capital en $150 mil millones.

Como parte del lanzamiento del martes, OpenAI introdujo una herramienta de ajuste fino para modelos después del entrenamiento, que permitirá a los desarrolladores mejorar las respuestas generadas por los modelos utilizando imágenes y texto.

Este proceso de ajuste fino puede incluir retroalimentación de humanos que alimentan al modelo con ejemplos de buenas y malas respuestas basadas en sus resultados.

El uso de imágenes para ajustar modelos proporcionaría capacidades más robustas de comprensión visual, permitiendo aplicaciones como búsqueda visual mejorada y detección de objetos optimizada para vehículos autónomos, según indicó OpenAI.

Además, la startup reveló una herramienta que permitiría a modelos más pequeños aprender de modelos más grandes, junto con “Prompt Caching”, que reduce algunos costos de desarrollo a la mitad al reutilizar fragmentos de texto que la IA ha procesado anteriormente.

Fuente: OpenAI

Etiquetas

3 octubre, 2024

Nuevo sistema para aplicaciones con voz

Ronda de inversionistas para crecimiento de OpenAI

Huesos sintéticos impresos en 3D: esperanza para pacientes con cáncer

Fire HD 8, la tablet económica de Amazon que incorpora IA

Artículos relacionados

Grok se actualiza, ahora genera documentos y código con IA

GPT-4.1 se anuncia con mejoras en rendimiento y precio frente a GPT-4o

Google activa Gemini 2.5 Pro en México con funciones premium

El filósofo digital, cómo una IA engañó a la élite intelectual con el libro “Hipnocracia”

Adblock Detectado