Ir al contenido principal
OpenAI

Actualización: 24 de abril de 2024

Producto

Presentamos las API para GPT-3.5 Turbo y Whisper

Los desarrolladores ya pueden incorporar los modelos de GPT‑3.5 Turbo y Whisper a sus aplicaciones y productos mediante nuestra API.

Formas elípticas verdes que crean un patrón de ondas rítmicas sobre un fondo oscuro degradado.
Cargando…

Actualización del 24 de abril de 2024: el nombre API de ChatGPT se ha eliminado. Las menciones a la API de ChatGPT que figuran en este blog hacen referencia a la API de GPT‑3.5 Turbo.

Los modelos de ChatGPT y Whisper ya están disponibles en nuestra API, que ofrece a los desarrolladores acceso a un lenguaje puntero (¡no solo un chat!) y funciones de transcripción de voz. Gracias a una serie de mejoras en todo el sistema, hemos conseguido una reducción de costes del 90 % en ChatGPT desde diciembre; ahora estamos trasladando esos ahorros a los usuarios de la API. Los desarrolladores ya pueden usar nuestro modelo large-v2 de código abierto de Whisper en la API con resultados mucho más rápidos y rentables. Los usuarios de la API de GPT‑3.5 obtendrán mejoras constantes del modelo y la opción de elegir una capacidad específica para obtener un mayor control de los modelos. También hemos prestado mucha atención a los comentarios de nuestros desarrolladores, por lo que hemos perfeccionado las condiciones del servicio de nuestra API para satisfacer sus necesidades.

Primeros usuarios de las API de GPT-3.5 Turbo y Whisper

Snap Inc(se abre en una ventana nueva)., el creador de Snapchat, presentó My AI para Snapchat+ esta semana. La función experimental se ejecuta en la API de GPT‑3.5. My AI pone al alcance de los usuarios de Snapchat un chatbot intuitivo y adaptable que ofrece recomendaciones e incluso puede escribir un haiku para los amigos en segundos. Snapchat, que combina la comunicación y la mensajería, cuenta con 750 millones de usuarios al mes:

My AI de Snapchat+

Quizlet(se abre en una ventana nueva) es una plataforma mundial de aprendizaje que usan más de 60 millones de estudiantes para preparar, practicar y dominar cualquier materia que estén estudiando. Quizlet ha estado funcionando con OpenAI durante los últimos tres años, en los que ha aprovechado GPT‑3 en numerosas aplicaciones, como el aprendizaje de vocabulario o las pruebas prácticas. Con la puesta en marcha de la API de GPT‑3.5, Quizlet introduce Q-Chat, un tutor de IA totalmente adaptativo que hace participar a los estudiantes con preguntas que se ajustan a los materiales de estudio correspondientes mediante una divertida experiencia de chat:

Q-Chat de Quizlet

Instacart(se abre en una ventana nueva) mejora su aplicación para que los clientes puedan hacer preguntas sobre alimentos y reciban respuestas inspiradoras que les ayuden en la compra. Esta herramienta usa ChatGPT, la propia IA de Instacart y datos de productos de más de 75 000 locales de comercios minoristas asociados con el fin de ayudar a los clientes a encontrar ideas relacionadas con el tipo de compra que quieres hacer, por ejemplo, «¿cómo puedo preparar unos buenos tacos de pescado?» o «¿cuál sería una comida saludable para mis hijos?». Instacart prevé estrenar «Ask Instacart» a finales de este año:

Ask Instacart de Instacart

Shop(se abre en una ventana nueva), la aplicación de Shopify, cuenta con 100 millones de usuarios que la utilizan para buscar e interactuar con los productos y las marcas que les gustan. La API de GPT‑3.5 se usa para mejorar el nuevo asistente de compra de Shop. Cuando los usuarios buscan productos, el asistente de compra hace recomendaciones personalizadas según sus peticiones. El nuevo asistente de compra de Shop basado en IA agilizará las compras en la aplicación mediante el escaneado de millones de productos para encontrar rápidamente lo que los compradores están buscando o ayudarles a descubrir artículos nuevos:

Aplicación Shop de Shopify

Speak(se abre en una ventana nueva) es una aplicación de aprendizaje de idiomas basada en IA cuyo objetivo consiste en crear el mejor plan para conseguir fluidez oral. Es la aplicación para aprender inglés que crece más rápido en Corea del Sur, y ya utiliza la API de Whisper para dar vida a su nuevo asistente lingüístico por IA y ponerla a disposición del resto del mundo. La precisión humana que Whisper ofrece a los estudiantes de idiomas de cualquier nivel permite practicar conversaciones abiertas reales y obtener comentarios muy rigurosos:

Aplicación Speak

API de GPT-3.5

Modelo: la familia de modelos de ChatGPT que lanzamos hoy, gpt-3.5-turbo, es el mismo modelo que se usa en el producto ChatGPT. Su precio es de 0,002 $ por cada mil tókenes, es decir, diez veces más barato que los modelos existentes de GPT‑3.5. También es nuestro mejor modelo para numerosas aplicaciones distintas al chat: hemos visto cómo los primeros usuarios que lo probaron migraron de text-davinci-003 a gpt-3.5-turbo; tan solo fueron necesarios unos pequeños ajustes en los prompts.

API: tradicionalmente, los modelos de GPT procesan texto no estructurado, que se representa en el modelo como una secuencia de «tókenes». En cambio, los modelos de ChatGPT procesan una secuencia de mensajes junto con metadatos. (Para los curiosos: bajo la superficie, las entradas se transmiten al modelo como una secuencia de «tókenes» que el modelo procesa; el formato básico que usa el modelo es nuevo y se llama Chat Markup Language(se abre en una ventana nueva) («ChatML»)).

Hemos creado un nuevo endpoint para interactuar con nuestros modelos de ChatGPT:

Bash

1
curl https://api.openai.com/v1/chat/completions \
2
-H "Authorization: Bearer $OPENAI_API_KEY" \
3
-H "Content-Type: application/json" \
4
-d '{
5
"model": "gpt-3.5-turbo",
6
"messages": [{"role": "user", "content": "What is the OpenAI mission?"}]
7
}'

Para obtener más información sobre la API de GPT‑3.5, consulta nuestra guía del chat(se abre en una ventana nueva).

Mejoras de ChatGPT

Mejoramos constantemente nuestros modelos de ChatGPT y queremos que estas mejoras también estén disponibles para los desarrolladores. Los desarrolladores que usan el modelo gpt-3.5-turbo dispondrán siempre de nuestro modelo estable recomendado, además de seguir contando con la flexibilidad de elegir una versión específica del modelo. Por ejemplo, hoy lanzamos gpt-3.5-turbo-0301, que podrá usarse hasta el 1 de junio, por lo menos, y actualizaremos gpt-3.5-turbo a una nueva versión estable en abril. La página de los modelos(se abre en una ventana nueva) ofrecerá las mejoras de transición.

Instancias dedicadas

Ahora también ofrecemos instancias dedicadas para usuarios que deseen tener más control sobre las versiones concretas de un modelo y del rendimiento del sistema. Por defecto, las solicitudes se ejecutan en una infraestructura de computación compartida con otros usuarios que pagan por solicitud. Nuestra API funciona con Azure y, en las instancias dedicadas, los desarrolladores pagarán por los períodos de tiempo asignados a la infraestructura de computación necesarios para satisfacer sus solicitudes.

Los desarrolladores tendrán pleno control de la carga de una instancia (una carga mayor mejora la capacidad de procesamiento, pero ralentiza las solicitudes), la opción de habilitar funciones, como limitaciones de contexto más extensas, y la capacidad de fijar la copia de un modelo.

Las peticiones específicas pueden tener sentido en términos económicos para los desarrolladores que utilizan en torno a 450 millones de tókenes al día. Además, permiten optimizar de manera directa la carga de trabajo de un desarrollador frente al rendimiento del hardware, lo cual puede reducir significativamente los costes relativos a una infraestructura compartida. Si tienes preguntas sobre las instancias dedicadas, contacta con nosotros.

API de Whisper

Whisper, el modelo de transcripción de voz de código abierto desde septiembre de 2022, ha sido ampliamente elogiado por la comunidad de desarrolladores, aunque puede ser difícil de ejecutar. Ya está disponible el modelo large-v2 en nuestra API, que ofrece un cómodo acceso bajo demanda a un precio de 0,006 $ por minuto. A ello se suma nuestro stack altamente optimizado, que garantiza un rendimiento más veloz en comparación con otros servicios.

La API de Whisper está disponible mediante nuestros endpoints de transcriptions (transcribe en el idioma original) o translations (transcribe en inglés) y acepta varios formatos (m4a, mp3, mp4, mpeg, mpga, wav y webm):

Bash

1
curl https://api.openai.com/v1/audio/transcriptions
2
-H "Authorization: Bearer $OPENAI_API_KEY" \
3
-H "Content-Type: multipart/form-data" \
4
-F model="whisper-1" \
5
-F file="@/path/to/file/openai.mp3"

Para obtener más información sobre la API de Whisper, consulta nuestra guía de transcripción de voz(se abre en una ventana nueva).

Atención a los desarrolladores

Durante los últimos seis meses, hemos estado recopilando opiniones de los clientes de nuestra API con el objetivo de saber cómo podemos ofrecerles un mejor servicio. Hemos hecho cambios concretos, como:

  • El envío de datos mediante la API ya no se usa en las mejoras del servicio (incluido el entrenamiento del modelo), a menos que la organización lo solicite.
  • La aplicación de una política de conservación de datos durante 30 días por defecto para los usuarios de la API, con opciones más estrictas de conservación en función de las necesidades del usuario.
  • La eliminación de nuestra evaluación previa al lanzamiento (debido a la mejora de nuestra supervisión automatizada).
  • La mejora de la documentación del desarrollador.
  • La simplificación de nuestras condiciones de servicio y políticas de uso(se abre en una ventana nueva), incluidas las condiciones relativas a la propiedad de los datos: los usuarios son propietarios de los aportes y los resultados de los modelos.

Durante los últimos dos meses, nuestros tiempos de disponibilidad no han cumplido con nuestras expectativas ni con las de nuestros usuarios. La principal prioridad actual de nuestro equipo de ingeniería es la estabilidad en las aplicaciones de producción; sabemos que el acceso a la IA beneficia a toda la humanidad y exige que seamos un proveedor de servicios fiable. ¡Mejoraremos el tiempo de disponibilidad durante los próximos meses!

Creemos que la IA puede ofrecer oportunidades increíbles y empoderamiento económico para todos, por lo que la mejor forma de conseguirlo es permitir que cualquier persona crezca gracias a ella. Esperamos que los cambios anunciados hoy se traduzcan en numerosas aplicaciones que cualquiera pueda aprovechar. Empieza a crear la próxima generación de aplicaciones basadas en ChatGPT y Whisper.

Contribuidores

Jeff Belgum, Jake Berdine, Trevor Cai, Alexander Carney, Brooke Chan, Che Chang, Derek Chen, Ruby Chen, Aidan Clark, Thomas Degry, Steve Dowling, Sheila Dunning, Liam Fedus, Vik Goel, Scott Gray, Aurelia Guy, Jeff Harris, Peter Hoeschele, Angela Jiang, Denny Jin, Jong Wook Kim, Yongjik Kim, Michael Lampe, Daniel Levy, Brad Lightcap, Patricia Lue, Bianca Martin, Christine McLeavey, Luke Metz, Andrey Mishchenko, Vinnie Monaco, Evan Morikawa, Mira Murati, Rohan Nuttall, Alex Paino, Ashley Pantuliano, Mikhail Pavlov, Andrew Peng, Henrique Ponde de Oliveira Pinto, Alec Radford, Kendra Rimbach, Aliisa Rosenthal, Nick Ryder, Ted Sanders, Heather Schmidt, John Schulman, Zarina Stanik, Felipe Such, Nick Turley, Carroll Wainwright, Peter Welinder, Clemens Winter, Sherwin Wu, Tao Xu, Qiming Yuan y Barret Zoph