Dies ist eine Serie von 5 Artikeln, die Kommunikationsstrategien für kleine Unternehmen untersuchen, wobei der Schwerpunkt auf Anrufbeantworterdiensten liegt:
-
Warum kleine Unternehmen einen Anrufbeantworterdienst benötigen?: Entdecken Sie die Bedeutung und Vorteile von Anrufbeantworterdiensten.
-
Outsourcing vs. interne Live-Rezeptionisten: Was sind Live-Rezeptionisten? Sollten Sie auslagern oder intern einstellen?
-
Automatisierte Telefonbeantwortungssysteme (Interaktive Sprachantwort IVR vs. Sprach-KI-Agenten): Was ist ein automatischer Anrufbeantworterdienst? Sollten Sie interaktive Sprachantwort oder Sprach-KI-Agenten verwenden?
-
Entscheidung: Sollten meine kleinen Unternehmen Live-Rezeptionisten oder automatisierte Anrufbeantworterdienste nutzen?: Sie haben in unserer Serie alles über Anrufbeantworterdienste gelernt. Jetzt ist es an der Zeit zu entscheiden, welche Art von Dienst für Ihr Unternehmen am besten geeignet ist.
-
(Dieser Artikel) OpenAI vs. Mensch vs. Sprach-KI: Ein Kostenvergleich: Sie fragen sich, ob Sie auf die neueste Sprach-KI-Technologie umsteigen sollten? Werfen wir einen Blick auf die tatsächlichen Kosten.
TLDR:
- Sowohl OpenAI als auch Menschen können teuer sein:
- Die Realtime API von OpenAI kann ein Sprachagenten-Erlebnis (KI) für etwa 1 US-Dollar pro Minute ermöglichen.
- Virtuelle Rezeptionisten (menschlich) auf Abruf kosten ebenfalls etwa 1 US-Dollar pro Minute.
- Aber es gibt ausgewogene Optionen mit Einschränkungen:
- Bei langfristiger Beschäftigung können menschliche Agenten mit guten Englischkenntnissen nur 5 US-Dollar pro Stunde (0,08 US-Dollar pro Minute) kosten.
- Sprach-KI-Agenten, die von Startups angeboten werden, können nur 7,2 US-Dollar pro Stunde (0,12 US-Dollar pro Minute) kosten.
Wenn Sie eine Audioversion dieses Artikels bevorzugen, finden Sie hier das Video:
Reale Kosten der ChatGPT-4o Realtime API
OpenAI hat seine Realtime API für ChatGPT-4o am 1. Oktober 2024 veröffentlicht. Dies ist 5 Monate nach der Veröffentlichung von GPT-4o, dem ersten omnichanel Large Language Model. Die Leistung ist atemberaubend. Chatgpt-4o-realtime klingt wie ein Mensch, reagiert wie ein Mensch und ist robust gegenüber Geräuschen und Unterbrechungen.
Ist Chatgpt-4o-realtime jedoch erschwinglich?
Auf den ersten Blick scheint die Realtime API von OpenAI etwa 30-mal teurer zu sein als GPT-4o-mini im Text (5 $ vs. 0,15 $ / 1 Mio. Eingabetoken).

Preise für chatgpt-4o-realtime im Oktober 2024

Preise für chatgpt-4o-mini im Oktober 2024
OpenAI behauptet, dass die Kosten für Audioeingabe etwa 0,06 $ pro Minute und für Audioausgabe 0,24 $ pro Minute betragen. Wenn man diese zusammenzählt, sollte es 0,30 $ pro Minute nicht überschreiten, oder?
Wir haben einen Praxistest der 4o-realtime API durchgeführt und festgestellt, dass sie etwa 1 $ pro Minute kostet.

Screenshot der Kosten für einen Test der ChatGPT-4o Realtime API
Wir führten ein 5-minütiges Sprachgespräch mit der chatgpt-4o-realtime API und stellten fest, dass es 5,38 $ kostete. Das 5-minütige Sprachgespräch enthielt etwa 142 Sekunden transkribiertes Audio (stellen Sie es sich als Audioeingabe vor), der Rest war hauptsächlich Audioausgabe.
In einem anderen Test, den wir durchgeführt haben, kostete ein einfaches Gespräch von 10 Minuten etwa 10 $.
Uff, das ist teuer. Es ist tatsächlich etwa 10-mal teurer als die eigenen Sprachagenten von Seasalt.ai.
Wenn einige Entwickler nur die API testen und versuchen, einen Sprach-KI-Agenten zu trainieren, der tatsächlich etwas tut, können sie leicht Hunderte von Dollar an einem Tag ausgeben!
ChatGPT-4o Realtime API vs. menschliche Agenten – was ist erschwinglicher?
Wenn man also einen Sprach-KI-Agenten mit der ChatGPT-4o Realtime API bauen würde, würde er etwa 1 US-Dollar pro Minute oder 60 US-Dollar pro Stunde kosten.
Wie viel kostet ein menschlicher Agent?
Wenn Sie einen internen Mitarbeiter einsetzen, z. B. einen Empfangsmitarbeiter, kann dieser zwischen dem Mindestlohn (7,25 US-Dollar bundesweit bis 16 US-Dollar in Kalifornien) und vielleicht 20 bis 30 US-Dollar pro Stunde verdienen.
Wenn Sie eine externe Agentur beauftragen, kann der Preis variieren: einige beginnen bei 349 US-Dollar/Monat für 200 Minuten plus Einrichtungsgebühr. Seasalt.ai hat dazu eine detaillierte Umfrage erstellt: Kosten von Live-Rezeptionisten: Inhouse vs. Outsourcing.

Zusammenfassung Anbieter Live-Rezeptionisten von Seasalt.ai
ChatGPT-4o Realtime API vs. andere Sprach-KI-Agenten – was ist der Unterschied?
Die Realtime API von ChatGPT-4o stellt einen bedeutenden Fortschritt in der Sprach-KI-Technologie dar und bietet mehrere wesentliche Unterschiede im Vergleich zu anderen Sprach-KI-Agenten:
- Reaktionsfähigkeit: Sie bietet nahezu Echtzeit-Interaktionen mit durchschnittlichen Antwortzeiten von 2 bis 3 Sekunden
- Robustheit: Die API ermöglicht Unterbrechungen und Umleitungen während Gesprächen, was einen natürlicheren Dialogfluss ermöglicht
- End-to-End: Die API erfordert kein Zusammenfügen verschiedener Komponenten, wie z. B. Spracherkennung (Azure, Deepgram usw.) und Text-to-Speech (Azure, Eleven Labs).
Der Haken ist jedoch der Preis: Die Realtime API von ChatGPT-4o kostet etwa 1 US-Dollar pro Minute, während andere Sprach-KI-Agenten nur 0,12 US-Dollar pro Minute kosten können.

Produktvergleich Sprach-KI-Agenten von Seasalt.ai
Es gibt einen 10-fachen Preisunterschied, aber gibt es auch einen 10-fachen Leistungsunterschied? Das muss der Kunde beurteilen.
Fazit
Für Geschäftsinhaber gibt es im Grunde 4 Optionen:
- Interne menschliche Agenten
- Outsourcing an ein anderes Unternehmen, entweder im Inland oder im Ausland
- Verwendung eines erschwinglichen Sprach-KI-Agenten
- Erstellung mit der fortschrittlichsten/teuersten OpenAI Realtime API
Ich habe die verschiedenen Vor- und Nachteile der verschiedenen Optionen unten zusammengefasst:
- Die OpenAI Realtime API bietet die schnellste und natürlichste Erfahrung, erfordert jedoch technisches Fachwissen und ist teuer.
- Onshore On Demand Human Agents eignen sich gut für grundlegende Aufgaben in perfektem Englisch, haben aber eine begrenzte Integration.
- Offshore Long Term Human Agents sind am günstigsten, können aber aufgrund von Infrastrukturproblemen und hoher Fluktuation unzuverlässig sein.
- Integrierte Sprach-KI-Agenten bieten ein Gleichgewicht zwischen Kosten, Funktionen und Benutzerfreundlichkeit, können aber etwas weniger reaktionsschnell sein und Integrationsprobleme aufweisen.

Verschiedene Optionen für Telefonbeantwortungsdienste: Mensch vs. OpenAI vs. Sprach-KI-Startups
Als Praktiker im Bereich Spracherkennung und Verarbeitung natürlicher Sprache sind meine zwei Cents:
- Verwenden Sie die integrierten Sprach-KI-Agenten auf dem Markt, wie den, den ich stolz mit SeaChat gebaut habe. Sie sind ausgereift und erschwinglich.
- Geben Sie der OpenAI Realtime API ein weiteres Jahr Zeit, damit die Versuchskaninchen sie testen können, und hoffentlich wird der Preis auf erschwingliche 10 US-Dollar/Stunde sinken, dann wird sie wirklich erstaunlich. Achtung, menschliche Agenten!
Erfahren Sie mehr
Wenn Sie zunächst die KI-Sprachtechnologie für den Kundenservice zu einem vernünftigen Preis erkunden möchten, können Sie SeaChat besuchen oder eine Demo bei uns buchen.
Über diese Serie
Dies ist eine Serie von 5 Artikeln, die Kommunikationsstrategien für kleine Unternehmen untersuchen, wobei der Schwerpunkt auf Anrufbeantworterdiensten liegt:
-
Warum kleine Unternehmen einen Anrufbeantworterdienst benötigen?: Entdecken Sie die Bedeutung und Vorteile von Anrufbeantworterdiensten.
-
Outsourcing vs. interne Live-Rezeptionisten: Was sind Live-Rezeptionisten? Sollten Sie auslagern oder intern einstellen?
-
Automatisierte Telefonbeantwortungssysteme (Interaktive Sprachantwort IVR vs. Sprach-KI-Agenten): Was ist ein automatischer Anrufbeantworterdienst? Sollten Sie robotische IVR oder Sprach-KI-Agenten verwenden?
-
Entscheidung: Sollten meine kleinen Unternehmen Live-Rezeptionisten oder automatisierte Anrufbeantworterdienste nutzen?: Sie haben in unserer Serie alles über Anrufbeantworterdienste gelernt. Jetzt ist es an der Zeit zu entscheiden, welche Art von Dienst für Ihr Unternehmen am besten geeignet ist.
-
(Dieser Artikel) OpenAI vs. Mensch vs. Sprach-KI: Ein Kostenvergleich: Die neueste Sprach-KI-Technologie von OpenAI ist ein großartiger Sprach-KI-Agent. Was sind die tatsächlichen Kosten?