Esta es una serie de 5 artículos que exploran las estrategias de comunicación con el cliente para pequeñas empresas, centrándose en los servicios de contestador:
-
¿Por qué las pequeñas empresas necesitan un servicio de contestador?: Descubra la importancia y los beneficios de los servicios de contestador.
-
Subcontratación vs. recepcionistas en vivo internos: ¿Qué son los recepcionistas en vivo? ¿Debería subcontratar o contratar internamente?
-
Sistemas de contestador telefónico automatizados (Respuesta de voz interactiva IVR vs. Agentes de IA de voz): ¿Qué es un servicio de contestador automático? ¿Debería usar la respuesta de voz interactiva o los agentes de IA de voz?
-
Decisión: ¿Deberían mis pequeñas empresas usar recepcionistas en vivo o servicios de contestador automático?: Ha aprendido todo sobre los servicios de contestador de nuestra serie. Ahora es el momento de decidir qué tipo de servicio es mejor para su negocio.
-
(Este artículo) OpenAI vs. Humano vs. IA de voz: una comparación de costos: ¿Se pregunta si debería cambiar a la última tecnología de IA de voz? Echemos un vistazo a los costos reales.
TLDR:
- Tanto OpenAI como los humanos pueden ser caros:
- La API en tiempo real de OpenAI puede habilitar la experiencia de agente de voz (IA) a aproximadamente $1 por minuto.
- Los recepcionistas virtuales a pedido (humanos) también tienen un precio de alrededor de $1 por minuto.
- Pero hay opciones equilibradas con advertencias:
- Cuando se emplean a largo plazo, los agentes humanos con buen inglés pueden costar tan solo $5 por hora ($0.08 por minuto).
- Los agentes de IA de voz ofrecidos por startups pueden costar tan solo $7.2 por hora ($0.12 por minuto).
Si prefiere escuchar una versión de audio de este artículo, aquí está el video:
Costo real de la API en tiempo real de ChatGPT-4o
OpenAI lanzó su API en tiempo real para ChatGPT-4o el 1 de octubre de 2024. Esto es 5 meses después del lanzamiento de GPT-4o, el primer modelo de lenguaje grande omnicanal. El rendimiento es asombroso. Chatgpt-4o-realtime suena como un humano, responde como un humano y es robusto contra ruidos e interrupciones.
Sin embargo, ¿es asequible Chatgpt-4o-realtime?
A primera vista, la API en tiempo real de OpenAI parece aproximadamente 30 veces más cara que GPT-4o-mini en texto ($5 vs. $0.15 / 1M tokens de entrada).

Precios de chatgpt-4o-realtime en octubre de 2024

Precios de chatgpt-4o-mini en octubre de 2024
OpenAI afirma que cuesta aproximadamente $0.06 por minuto para la entrada de audio y $0.24 por minuto para la salida de audio. Sumando esto, sugiere que no debería exceder los $0.30 por minuto, ¿verdad?
Realizamos una prueba en el mundo real de la API 4o-realtime y descubrimos que cuesta aproximadamente $1 por minuto.

Captura de pantalla del costo de una prueba de la API en tiempo real de ChatGPT-4o
Realizamos una conversación de voz de 5 minutos con la API chatgpt-4o-realtime y descubrimos que costó $5.38. La conversación de voz de 5 minutos tiene aproximadamente 142 segundos de audio transcrito (piense en ello como entrada de audio), el resto es principalmente salida de audio.
En otra prueba que hicimos, una conversación simple de 10 minutos costó alrededor de $10.
¡Vaya, eso es caro! En realidad, es aproximadamente 10 veces más caro que los propios agentes de voz de Seasalt.ai.
Si algunos desarrolladores solo están probando la API e intentando dedicar un esfuerzo significativo a entrenar un agente de IA de voz que realmente haga algo, ¡pueden gastar fácilmente cientos de dólares en un día!
API en tiempo real de ChatGPT-4o vs. Agentes humanos – ¿cuál es más asequible?
Entonces, si se construyera un agente de IA de voz usando la API en tiempo real de ChatGPT-4o, costaría alrededor de $1 por minuto, o $60 por hora.
¿Cuánto cuesta un agente humano?
Si utiliza uno interno, como un recepcionista de mostrador, su salario podría oscilar entre el salario mínimo ($7.25 federal a $16 en California) y quizás $20 a $30 por hora.
Si utiliza una agencia externa, el precio puede variar: algunos comienzan en $349/mes por 200 minutos más una tarifa de configuración. Seasalt.ai ha escrito una encuesta detallada sobre esto: Costo de los recepcionistas en vivo: internos vs. subcontratación.

Resumen de proveedores de recepcionistas en vivo por Seasalt.ai
API en tiempo real de ChatGPT-4o vs. otros agentes de IA de voz – ¿cuál es la diferencia?
La API en tiempo real de ChatGPT-4o representa un avance significativo en la tecnología de IA de voz, ofreciendo varias diferencias clave en comparación con otros agentes de IA de voz:
- Capacidad de respuesta: proporciona interacciones casi en tiempo real, con tiempos de respuesta promedio de 2 a 3 segundos
- Robustez: La API permite interrupciones y redireccionamientos durante las conversaciones, lo que permite un flujo de diálogo más natural
- De extremo a extremo: la API no requiere unir diferentes componentes, como voz a texto (Azure, Deepgram, etc.) y texto a voz (Azure, Eleven Labs).
Pero la advertencia aquí es el costo: la API en tiempo real de ChatGPT-4o cuesta aproximadamente $1 por minuto, mientras que otros agentes de IA de voz pueden costar tan solo $0.12 por minuto.

Comparación de productos de agentes de IA de voz por Seasalt.ai
Hay una diferencia de precio de 10 veces, pero ¿hay una diferencia de rendimiento de 10 veces? Eso lo juzgará el cliente.
Veredicto
Para los propietarios de negocios, básicamente hay 4 opciones:
- Agentes humanos internos
- Subcontratar a una empresa diferente, ya sea en el país o en el extranjero
- Usar un agente de IA de voz asequible
- Construir con la API en tiempo real de OpenAI más avanzada/cara
A continuación, resumí los diversos pros y contras de las diferentes opciones:
- La API en tiempo real de OpenAI ofrece la experiencia más rápida y natural, pero requiere experiencia técnica y es costosa.
- Los agentes humanos a pedido en tierra son buenos para tareas básicas en inglés perfecto, pero tienen una integración limitada.
- Los agentes humanos a largo plazo en el extranjero son los más asequibles, pero pueden ser poco confiables debido a problemas de infraestructura y alta rotación.
- Los agentes de IA de voz integrados ofrecen un equilibrio entre costo, características y facilidad de uso, pero pueden ser un poco menos receptivos y tener peculiaridades de integración.

Diferentes opciones para servicios de contestador telefónico: humanos vs. OpenAI vs. startups de IA de voz
Como profesional en el campo del reconocimiento de voz y el procesamiento del lenguaje natural, mis dos centavos son:
- Utilice los agentes de IA de voz integrados en el mercado, como el que construí con orgullo con SeaChat. Son maduros y asequibles.
- Dele otro año a la API en tiempo real de OpenAI para que los conejillos de indias la prueben, y con suerte el precio bajará a un más asequible $10/hora, entonces se volverá realmente asombrosa. ¡Cuidado, agentes humanos!
Aprende más
Si desea explorar primero la tecnología de voz de IA para el servicio al cliente a un precio razonable, puede visitar SeaChat o puede reservar una demostración con nosotros.
Acerca de esta serie
Esta es una serie de 5 artículos que exploran las estrategias de comunicación con el cliente para pequeñas empresas, centrándose en los servicios de contestador:
-
¿Por qué las pequeñas empresas necesitan un servicio de contestador?: Descubra la importancia y los beneficios de los servicios de contestador.
-
Subcontratación vs. recepcionistas en vivo internos: ¿Qué son los recepcionistas en vivo? ¿Debería subcontratar o contratar internamente?
-
Sistemas de contestador telefónico automatizados (Respuesta de voz interactiva IVR vs. Agentes de IA de voz): ¿Qué es un servicio de contestador automático? ¿Debería usar IVR robótico o agentes de IA de voz?
-
Decisión: ¿Deberían mis pequeñas empresas usar recepcionistas en vivo o servicios de contestador automático?: Ha aprendido todo sobre los servicios de contestador de nuestra serie. Ahora es el momento de decidir qué tipo de servicio es mejor para su negocio.
-
(Este artículo) OpenAI vs. Humano vs. IA de voz: una comparación de costos: La última tecnología de IA de voz de OpenAI es un gran agente de IA de voz. ¿Cuál es el costo real?