Ceci est une série de 5 articles explorant les stratégies de communication client pour les petites entreprises, en se concentrant sur les services de réponse:
-
Pourquoi les petites entreprises ont-elles besoin d’un service de réponse ?: Découvrez l’importance et les avantages des services de réponse.
-
Externalisation vs. réceptionnistes en direct internes: Que sont les réceptionnistes en direct ? Devez-vous externaliser ou embaucher en interne ?
-
Systèmes de réponse téléphonique automatisés (Réponse vocale interactive IVR vs. Agents d’IA vocale): Qu’est-ce qu’un service de réponse automatisé ? Devez-vous utiliser la réponse vocale interactive ou les agents d’IA vocale ?
-
Décision : Mes petites entreprises devraient-elles utiliser des réceptionnistes en direct ou des services de réponse automatisés ?: Vous avez tout appris sur les services de réponse de notre série. Il est maintenant temps de décider quel type de service est le mieux adapté à votre entreprise.
-
(Cet article) OpenAI vs. Humain vs. IA vocale : une comparaison des coûts: Vous vous demandez si vous devriez passer à la dernière technologie d’IA vocale ? Jetons un coup d’œil aux coûts réels.
TLDR:
- OpenAI et les humains peuvent être chers :
- L’API en temps réel d’OpenAI peut permettre une expérience d’agent vocal (IA) à environ 1 $ par minute.
- Les réceptionnistes virtuels à la demande (humains) sont également tarifés à environ 1 $ par minute.
- Mais il existe des options équilibrées avec des mises en garde :
- Lorsqu’ils sont employés à long terme, les agents humains avec une bonne maîtrise de l’anglais peuvent coûter aussi peu que 5 $ par heure (0,08 $ par minute).
- Les agents d’IA vocale proposés par les startups peuvent coûter aussi peu que 7,2 $ par heure (0,12 $ par minute).
Si vous préférez écouter une version audio de cet article, voici la vidéo :
Coût réel de l’API en temps réel de ChatGPT-4o
OpenAI a publié son API en temps réel pour ChatGPT-4o le 1er octobre 2024. C’est 5 mois après la publication de GPT-4o, le premier grand modèle linguistique omnicanal. Les performances sont époustouflantes. Chatgpt-4o-realtime sonne comme un humain, répond comme un humain et est robuste face aux bruits et aux interruptions.
Cependant, Chatgpt-4o-realtime est-il abordable ?
À première vue, l’API en temps réel d’OpenAI semble environ 30 fois plus chère que GPT-4o-mini en texte (5 $ vs 0,15 $ / 1 million de jetons d’entrée).

Tarification d’octobre 2024 pour chatgpt-4o-realtime

Tarification d’octobre 2024 pour chatgpt-4o-mini
OpenAI affirme que le coût de l’entrée audio est d’environ 0,06 $ par minute et de 0,24 $ par minute pour la sortie audio. En additionnant ces chiffres, cela ne devrait pas dépasser 0,30 $ par minute, n’est-ce pas ?
Nous avons effectué un test réel de l’API 4o-realtime et avons constaté qu’elle coûte environ 1 $ par minute.

Capture d’écran du coût d’un test de l’API en temps réel de ChatGPT-4o
Nous avons mené une conversation vocale de 5 minutes avec l’API chatgpt-4o-realtime et avons constaté qu’elle coûtait 5,38 $. La conversation vocale de 5 minutes contient environ 142 secondes d’audio transcrit (considérez-le comme une entrée audio), le reste étant principalement une sortie audio.
Lors d’un autre test que nous avons effectué, une simple conversation de 10 minutes a coûté environ 10 $.
Ouch, c’est cher. C’est en fait environ 10 fois plus cher que les propres agents vocaux de Seasalt.ai.
Si certains développeurs ne font que tester l’API et essaient de consacrer des efforts significatifs à la formation d’un agent d’IA vocale qui fait réellement quelque chose, ils peuvent facilement dépenser des centaines de dollars par jour !
API en temps réel de ChatGPT-4o vs. Agents humains – lequel est le plus abordable ?
Donc, si l’on construisait un agent d’IA vocale en utilisant l’API en temps réel de ChatGPT-4o, cela coûterait environ 1 $ par minute, soit 60 $ de l’heure.
Combien coûte un agent humain ?
Si vous en utilisez un en interne, comme un réceptionniste, son salaire peut varier entre le salaire minimum (7,25 $ fédéral à 16 $ en Californie) et peut-être 20 à 30 $ de l’heure.
Si vous utilisez une agence externe, le prix peut varier : certains commencent à 349 $/mois pour 200 minutes plus des frais d’installation. Seasalt.ai a réalisé une enquête détaillée à ce sujet : Coût des réceptionnistes en direct : interne vs. externalisation.

Résumé des fournisseurs de réceptionnistes en direct par Seasalt.ai
API en temps réel de ChatGPT-4o vs. autres agents d’IA vocale – quelle est la différence ?
L’API en temps réel de ChatGPT-4o représente une avancée significative dans la technologie d’IA vocale, offrant plusieurs différences clés par rapport aux autres agents d’IA vocale :
- Réactivité : elle offre des interactions quasi en temps réel, avec des temps de réponse moyens de 2 à 3 secondes
- Robustesse : L’API permet les interruptions et les redirections pendant les conversations, ce qui permet un flux de dialogue plus naturel
- De bout en bout : l’API ne nécessite pas de coller différents composants ensemble, tels que la parole au texte (Azure, Deepgram, etc.) et le texte à la parole (Azure, Eleven labs).
Mais la mise en garde ici est le coût : l’API en temps réel de ChatGPT-4o coûte environ 1 $ par minute, tandis que d’autres agents d’IA vocale peuvent coûter aussi peu que 0,12 $ par minute.

Comparaison des produits d’agents d’IA vocale par Seasalt.ai
Il y a une différence de prix de 10 fois, mais y a-t-il une différence de performance de 10 fois ? C’est au client de juger.
Verdict
Pour les propriétaires d’entreprise, il existe fondamentalement 4 options :
- Agents humains internes
- Externaliser à une autre entreprise, soit onshore, soit offshore
- Utiliser un agent d’IA vocale abordable
- Construire avec l’API en temps réel d’OpenAI la plus avancée/chère
J’ai résumé les différents avantages et inconvénients des différentes options ci-dessous :
- L’API en temps réel d’OpenAI offre l’expérience la plus rapide et la plus naturelle, mais nécessite une expertise technique et est coûteuse.
- Les agents humains à la demande onshore sont bons pour les tâches de base en anglais parfait, mais ont une intégration limitée.
- Les agents humains à long terme offshore sont les plus abordables, mais peuvent être peu fiables en raison de problèmes d’infrastructure et d’un taux de rotation élevé.
- Les agents d’IA vocale intégrés offrent un équilibre entre le coût, les fonctionnalités et la facilité d’utilisation, mais peuvent être légèrement moins réactifs et présenter des bizarreries d’intégration.

Différentes options pour les services de réponse téléphonique : humains vs. OpenAI vs. startups d’IA vocale
En tant que praticien dans le domaine de la reconnaissance vocale et du traitement du langage naturel, mes deux centimes sont :
- Utilisez les agents d’IA vocale intégrés sur le marché, comme celui que j’ai fièrement construit avec SeaChat. Ils sont matures et abordables.
- Donnez une autre année à l’API en temps réel d’OpenAI pour que les cobayes la testent, et j’espère que le prix baissera à un prix plus abordable de 10 $/heure, alors elle deviendra vraiment incroyable. Attention, agents humains !
En savoir plus
Si vous souhaitez d’abord explorer la technologie vocale de l’IA pour le service client à un prix raisonnable, vous pouvez visiter SeaChat ou vous pouvez réserver une démo avec nous.
À propos de cette série
Ceci est une série de 5 articles explorant les stratégies de communication client pour les petites entreprises, en se concentrant sur les services de réponse:
-
Pourquoi les petites entreprises ont-elles besoin d’un service de réponse ?: Découvrez l’importance et les avantages des services de réponse.
-
Externalisation vs. réceptionnistes en direct internes: Que sont les réceptionnistes en direct ? Devez-vous externaliser ou embaucher en interne ?
-
Systèmes de réponse téléphonique automatisés (Réponse vocale interactive IVR vs. Agents d’IA vocale): Qu’est-ce qu’un service de réponse automatisé ? Devez-vous utiliser l’IVR robotique ou les agents d’IA vocale ?
-
Décision : Mes petites entreprises devraient-elles utiliser des réceptionnistes en direct ou des services de réponse automatisés ?: Vous avez tout appris sur les services de réponse de notre série. Il est maintenant temps de décider quel type de service est le mieux adapté à votre entreprise.
-
(Cet article) OpenAI vs. Humain vs. IA vocale : une comparaison des coûts: La dernière technologie d’IA vocale d’OpenAI est un excellent agent d’IA vocale. Quel est le coût réel ?