OpenAI ha anunciado una serie de novedades y mejoras en sus modelos y productos para desarrolladores, así como una reducción de precios en muchas partes de su plataforma. Aquí tienes un resumen de los anuncios más destacados:
- GPT-4 Turbo: Es una versión avanzada del modelo GPT-4 que tiene conocimiento de eventos mundiales hasta abril de 2023. Puede manejar una ventana de contexto de 128K, lo que le permite procesar el equivalente a más de 300 páginas de texto en una sola solicitud. Además, su rendimiento optimizado ha permitido reducir su precio en un factor de 3x para tokens de entrada y 2x para tokens de salida en comparación con GPT-4.
- Actualizaciones en la llamada de funciones: Permite describir funciones de aplicaciones o APIs externas a los modelos, y el modelo puede elegir inteligentemente generar un objeto JSON con argumentos para llamar a esas funciones. Ahora es posible solicitar múltiples acciones en un solo mensaje.
- Mejora en el seguimiento de instrucciones y modo JSON: GPT-4 Turbo mejora en tareas que requieren el seguimiento cuidadoso de instrucciones y soporta un nuevo modo JSON, que asegura que el modelo responda con JSON válido.
- Salidas reproducibles y probabilidades logarítmicas: Un nuevo parámetro
seed
permite obtener salidas reproducibles. Además, se lanzará una función para devolver las probabilidades logarítmicas de los tokens de salida más probables. - GPT-3.5 Turbo actualizado: También se ha lanzado una nueva versión de GPT-3.5 Turbo que soporta una ventana de contexto de 16K por defecto y tiene mejoras en el seguimiento de instrucciones y en el modo JSON.
- Assistants API: Permite construir experiencias de tipo agente dentro de aplicaciones propias. Con esta API se puede manejar el estado de los hilos de conversación de forma persistente y se introducen herramientas como el Code Interpreter y Retrieval.
- GPT-4 Turbo con visión: Esta versión puede aceptar imágenes como entradas, habilitando casos de uso como la generación de subtítulos y el análisis de imágenes.
- DALL·E 3: Ahora los desarrolladores pueden integrar DALL·E 3 directamente en sus aplicaciones a través de la API de imágenes.
- Text-to-speech (TTS): Se ha lanzado un modelo TTS que ofrece seis voces preestablecidas y dos variantes de modelo, permitiendo generar habla de calidad humana a partir de texto.
- Acceso experimental a la personalización de GPT-4: Se ha creado un programa de acceso experimental para la personalización fina de GPT-4, aunque se indica que aún se requiere más trabajo para lograr mejoras significativas sobre el modelo base en comparación con las ganancias logradas con la personalización de GPT-3.5.
- Modelos personalizados: Para organizaciones que necesitan más personalización de lo que la afinación puede proporcionar, se ha lanzado un programa de Modelos Personalizados, que permite trabajar con investigadores de OpenAI para entrenar un GPT-4 personalizado a un dominio específico.
- Reducción de precios: Se han reducido varios precios a lo largo de la plataforma para pasar ahorros a los desarrolladores.
Estas actualizaciones representan avances significativos tanto en la capacidad técnica de los modelos de IA como en la accesibilidad y versatilidad para los desarrolladores que buscan integrar estas herramientas en sus aplicaciones.
https://openai.com/blog/new-models-and-developer-products-announced-at-devday