Actualización: 24 de abril de 2024

Presentamos las API de GPT‑3.5 Turbo y Whisper

Los desarrolladores ahora pueden integrar los modelos GPT‑3.5 Turbo y Whisper en sus aplicaciones y productos a través de nuestra API.

Formas elípticas verdes que crean un patrón de ondas rítmicas sobre un fondo oscuro degradado.

Cargando...

Actualización del 24 de abril de 2024: Se ha eliminado el nombre de la API de ChatGPT. Las menciones a la API de ChatGPT en este blog se refieren a la API de GPT‑3.5 Turbo.

Los modelos ChatGPT y Whisper ahora están disponibles en nuestra API, por lo que los desarrolladores podrán acceder a funciones lingüísticas (no solo de chat) y de voz a texto de última generación. Gracias a una serie de optimizaciones en todo el sistema, hemos logrado reducir los costos de ChatGPT en un 90 % desde diciembre, y estamos trasladando ese ahorro a los usuarios de la API. Los desarrolladores ahora pueden utilizar nuestro modelo Whisper large-v2 de código abierto en la API con resultados mucho más rápidos y rentables. Los usuarios de la API de GPT‑3.5 pueden esperar mejoras continuas en los modelos y la posibilidad de elegir capacidades exclusivas para un control más exhaustivo de los modelos. También hemos escuchado atentamente los comentarios de los desarrolladores y hemos perfeccionado las condiciones de servicio de nuestra API para satisfacer mejor sus necesidades.

Comienza ahora(se abre en una nueva ventana)

Primeros usuarios de las API de GPT-3.5 Turbo y Whisper

Snap Inc⁠(se abre en una nueva ventana)., el creador de Snapchat, presentó esta semana My AI para Snapchat+. La función piloto se ejecuta en la API de GPT‑3.5. My AI ofrece a los usuarios de Snapchat un bot de chat amigable y personalizable a su alcance que ofrece recomendaciones e incluso puede escribir una poesía japonesa en cuestión de segundos. Snapchat, que hace de la comunicación y la mensajería algo habitual, cuenta con 750 millones de usuarios mensuales:

My AI para Snapchat+

Quizlet⁠(se abre en una nueva ventana) es una plataforma de aprendizaje global con más de 60 millones de estudiantes que lo utilizan para estudiar, practicar y dominar lo que están aprendiendo. Quizlet ha trabajado con OpenAI durante los últimos tres años, y ha aprovechado GPT‑3 en diversos casos de uso, como aprendizaje de vocabulario y exámenes de práctica. Con el lanzamiento de la API de GPT‑3.5, Quizlet presenta Q-Chat, un tutor de IA totalmente flexible que ofrece a los estudiantes preguntas adaptables según el material de estudio pertinente a través de una divertida experiencia de chat:

Q-Chat de Quizlet

Instacart⁠(se abre en una nueva ventana) está ampliando su aplicación para que los clientes puedan hacer consultas sobre alimentos y obtener respuestas inspiradoras que les permitan comprar. Para ello, se utiliza ChatGPT junto con la propia IA de Instacart y los datos de productos de sus más de 75 000 establecimientos minoristas asociados para ayudar a los clientes a descubrir ideas para objetivos de compra abiertos, como “¿Cómo hago unos tacos de pescado estupendos?” o “¿Qué almuerzo saludable puedo preparar a mis hijos?”. Instacart tiene previsto lanzar “Ask Instacart” a finales de este año:

Ask Instacart de Instacart

Shop⁠(se abre en una nueva ventana) es la aplicación de Shopify que utilizan 100 millones de compradores para buscar productos y marcas de su gusto. La API de GPT‑3.5 se utiliza para impulsar el nuevo asistente de compras de Shop. Cuando los clientes buscan productos, el asistente de compras les hace recomendaciones personalizadas según sus preferencias. El nuevo asistente de compras de Shop, basado en IA, agilizará las compras en la aplicación al escanear millones de productos para encontrar rápidamente lo que buscan los compradores o ayudarles a descubrir algo nuevo:

Aplicación Shop de Shopify

Speak⁠(se abre en una nueva ventana) es una aplicación de aprendizaje de idiomas basada en IA cuyo objetivo es desarrollar el mejor camino hacia la fluidez lingüística. Es la aplicación de inglés de más rápido crecimiento en Corea del Sur y ya está utilizando la API de Whisper para impulsar un nuevo producto de asistencia lingüística con IA y llevarlo rápidamente al resto del mundo. La precisión de nivel humano de Whisper para estudiantes de idiomas de todos los niveles permite una verdadera práctica conversacional abierta y una retroalimentación muy precisa:

The Speak App

API de GPT-3.5

Modelo: La familia de modelos de ChatGPT que lanzamos hoy, gpt-3.5-turbo, es el mismo modelo utilizado en el producto ChatGPT. Su precio es de 0,002 USD por 1000 tokens, 10 veces más económico que los modelos de GPT‑3.5 actuales. También es nuestro mejor modelo para muchos casos de uso que no son de chat: hemos visto a los primeros usuarios migrar de text-davinci-003 a gpt-3.5-turbo con solo unos pequeños ajustes en sus consultas.

API: Tradicionalmente, los modelos de GPT consumen texto no estructurado, que se representa al modelo como una secuencia de “tokens”. En cambio, los modelos de ChatGPT consumen una secuencia de mensajes junto con metadatos. (Para los curiosos: la entrada se sigue presentando al modelo como una secuencia de “tokens” para que el modelo consuma; el formato en bruto utilizado por el modelo es un nuevo formato llamado Chat Markup Language⁠(se abre en una nueva ventana) [“ChatML”]).

Hemos creado un nuevo extremo para interactuar con nuestros modelos de ChatGPT:

Bash

1curl https://api.openai.com/v1/chat/completions \
2 -H "Authorization: Bearer $OPENAI_API_KEY" \
3 -H "Content-Type: application/json" \
4 -d '{
5 "model": "gpt-3.5-turbo",
6 "messages": [{"role": "user", "content": "What is the OpenAI mission?"}] 
7 }'

Para obtener más información sobre la API de GPT‑3.5, visita nuestra guía Chat⁠(se abre en una nueva ventana).

Actualizaciones de ChatGPT

Mejoramos constantemente nuestros modelos de ChatGPT y queremos poner estas mejoras a disposición de los desarrolladores. Los desarrolladores que utilicen el modelo gpt-3.5-turbo obtendrán siempre nuestro modelo estable recomendado, aunque seguirán teniendo la flexibilidad de optar por una versión específica del modelo. Por ejemplo, hoy lanzamos gpt-3.5-turbo-0301, que recibirá soporte al menos hasta el 1.º de junio, y actualizaremos gpt-3.5-turbo a una nueva versión estable en abril. La página de modelos⁠(se abre en una nueva ventana) ofrecerá información actualizada sobre la transición.

Instancias exclusivas

Ahora también ofrecemos instancias exclusivas para los usuarios que deseen un mayor control sobre la versión específica del modelo y el rendimiento del sistema. Por defecto, las solicitudes se ejecutan en una infraestructura informática compartida con otros usuarios, que pagan por solicitud. Nuestra API se ejecuta en Azure y, con las instancias exclusivas, los desarrolladores pagarán por período de tiempo por una asignación de infraestructura informática reservada para atender sus solicitudes.

Los desarrolladores obtienen un control total sobre la carga de la instancia (una carga mayor mejora el rendimiento, pero hace que cada solicitud sea más lenta), la opción de activar funciones, como límites de contexto más largos, y la posibilidad de fijar la instantánea del modelo.

Las instancias exclusivas pueden tener sentido desde el punto de vista económico para los desarrolladores que trabajan con más de aproximadamente 450 millones de tokens al día. Además, permite optimizar directamente la carga de trabajo de un desarrollador frente al rendimiento del hardware, lo que puede reducir drásticamente los costos en relación con la infraestructura compartida. Si tienes consultas sobre las instancias exclusivas, contáctanos⁠.

API de Whisper

Whisper⁠, el modelo de voz a texto que lanzamos en septiembre de 2022, ha recibido grandes elogios de la comunidad de desarrolladores, pero también puede ser difícil de ejecutar. Ahora hemos puesto a disposición el modelo large-v2 a través de nuestra API, que ofrece un acceso cómodo a demanda a un precio de 0,006 USD por minuto. Además, nuestra pila de servidores altamente optimizada garantiza un rendimiento más rápido en comparación con otros servicios.

La API de Whisper está disponible a través de nuestros extremos de transcriptions (transcribe en el idioma de origen) o translations (transcribe al inglés), y acepta diversos formatos (m4a, mp3, mp4, mpeg, mpga, wav, webm):

Bash

1curl https://api.openai.com/v1/audio/transcriptions
2 -H "Authorization: Bearer $OPENAI_API_KEY" \
3 -H "Content-Type: multipart/form-data" \
4 -F model="whisper-1" \
5 -F file="@/path/to/file/openai.mp3"

Para obtener más información sobre la API de Whisper, visita nuestra guía Voz a texto⁠(se abre en una nueva ventana).

Enfoque para desarrolladores

Durante los últimos seis meses, hemos estado recopilando opiniones de nuestros clientes de la API para saber cómo podemos prestarles un mejor servicio. Hemos realizado cambios específicos, como los siguientes:

Los datos enviados a través de la API ya no se utilizan para mejorar el servicio (incluida la formación de modelos), a menos que la organización opte por ello.
Se ha implementado una política de conservación de datos de 30 días por defecto para los usuarios de la API, con opciones de conservación más estrictas según las necesidades de los usuarios.
Se ha eliminado nuestra revisión previa al lanzamiento (desbloqueada gracias a la mejora de nuestra supervisión automatizada).
Se ha mejorado la documentación para desarrolladores.
Se han simplificado nuestras condiciones de servicio y políticas de uso⁠(se abre en una nueva ventana), incluidas aquellas relativas a la propiedad de los datos: los usuarios son propietarios de los datos de entrada y salida de los modelos.

En los dos últimos meses, el tiempo de actividad no ha cumplido con nuestras expectativas ni las de los usuarios. La principal prioridad de nuestro equipo de ingeniería ahora es la estabilidad de los casos de uso en producción: sabemos que para garantizar que la IA beneficie a toda la sociedad, necesitamos ser un proveedor de servicios fiable. Te aseguramos que seguiremos mejorando el tiempo de actividad en los próximos meses.

Creemos que la IA puede brindar oportunidades increíbles y formación accesible para todo el mundo, y la mejor manera de conseguirlo es permitir que todos aporten en su desarrollo. Esperamos que los cambios que anunciamos hoy den lugar a muchas aplicaciones de las que todos puedan beneficiarse. Empieza a crear aplicaciones de última generación con ChatGPT y Whisper.

Comienza ahora(se abre en una nueva ventana)

Autores

Greg Brockman, Atty Eleti, Elie Georges, Joanne Jang, Logan Kilpatrick, Rachel Lim, Luke Miller y Michelle Pokrass

Contribuidores

Jeff Belgum, Jake Berdine, Trevor Cai, Alexander Carney, Brooke Chan, Che Chang, Derek Chen, Ruby Chen, Aidan Clark, Thomas Degry, Steve Dowling, Sheila Dunning, Liam Fedus, Vik Goel, Scott Gray, Aurelia Guy, Jeff Harris, Peter Hoeschele, Angela Jiang, Denny Jin, Jong Wook Kim, Yongjik Kim, Michael Lampe, Daniel Levy, Brad Lightcap, Patricia Lue, Bianca Martin, Christine McLeavey, Luke Metz, Andrey Mishchenko, Vinnie Monaco, Evan Morikawa, Mira Murati, Rohan Nuttall, Alex Paino, Ashley Pantuliano, Mikhail Pavlov, Andrew Peng, Henrique Ponde de Oliveira Pinto, Alec Radford, Kendra Rimbach, Aliisa Rosenthal, Nick Ryder, Ted Sanders, Heather Schmidt, John Schulman, Zarina Stanik, Felipe Such, Nick Turley, Carroll Wainwright, Peter Welinder, Clemens Winter, Sherwin Wu, Tao Xu, Qiming Yuan, Barret Zoph

Presentamos las API de GPT‑3.5 Turbo y Whisper

Primeros usuarios de las API de GPT-3.5 Turbo y Whisper

API de GPT-3.5

Bash

Actualizaciones de ChatGPT

Instancias exclusivas

API de Whisper

Bash

Enfoque para desarrolladores

Autores

Contribuidores

Artículos relacionados