To seria 5 artykułów badających strategie komunikacji z klientami dla małych firm, skupiająca się na usługach odpowiadania:
-
Dlaczego małe firmy potrzebują usługi odpowiadania?: Odkryj znaczenie i korzyści usług odpowiadania.
-
Outsourcing vs. wewnętrzni recepcjoniści na żywo: Kim są recepcjoniści na żywo? Czy powinieneś zlecać na zewnątrz, czy zatrudniać wewnętrznie?
-
Automatyczne systemy odbierania telefonów (Interaktywna odpowiedź głosowa IVR vs. Agenci głosowej sztucznej inteligencji): Co to jest automatyczna usługa odpowiadania? Czy powinieneś używać interaktywnej odpowiedzi głosowej czy agentów głosowej sztucznej inteligencji?
-
Decyzja: Czy moje małe firmy powinny korzystać z recepcjonistów na żywo czy z automatycznych usług odpowiadania?: Nauczyłeś się wszystkiego o usługach odpowiadania z naszej serii. Teraz nadszedł czas, aby zdecydować, jaki rodzaj usługi jest najlepszy dla Twojej firmy.
-
(Ten artykuł) OpenAI vs. Człowiek vs. Głosowa sztuczna inteligencja: Porównanie kosztów: Zastanawiasz się, czy powinieneś przejść na najnowszą technologię głosowej sztucznej inteligencji? Przyjrzyjmy się rzeczywistym kosztom.
TLDR:
- Zarówno OpenAI, jak i ludzie mogą być drodzy:
- OpenAI Realtime API może umożliwić doświadczenie agenta głosowego (AI) za około 1 USD za minutę.
- Wirtualni recepcjoniści na żądanie (ludzie) również kosztują około 1 USD za minutę.
- Ale istnieją zrównoważone opcje z zastrzeżeniami:
- Przy długoterminowym zatrudnieniu, ludzcy agenci z dobrą znajomością języka angielskiego mogą kosztować zaledwie 5 USD za godzinę (0,08 USD za minutę).
- Agenci głosowej sztucznej inteligencji oferowani przez startupy mogą kosztować zaledwie 7,2 USD za godzinę (0,12 USD za minutę).
Jeśli wolisz posłuchać wersji audio tego artykułu, oto wideo:
Rzeczywisty koszt API Realtime ChatGPT-4o
OpenAI wydało swoje API Realtime dla ChatGPT-4o 1 października 2024 r. Jest to 5 miesięcy po wydaniu GPT-4o, pierwszego wielokanałowego dużego modelu językowego. Wydajność jest oszałamiająca. Chatgpt-4o-realtime brzmi jak człowiek, reaguje jak człowiek i jest odporny na hałas i zakłócenia.
Czy jednak Chatgpt-4o-realtime jest przystępny cenowo?
Na pierwszy rzut oka API Realtime OpenAI wydaje się około 30 razy droższe niż GPT-4o-mini w tekście (5 USD vs. 0,15 USD / 1 mln tokenów wejściowych).

Ceny chatgpt-4o-realtime w październiku 2024

Ceny chatgpt-4o-mini w październiku 2024
OpenAI twierdzi, że koszt wejścia audio wynosi około 0,06 USD za minutę, a wyjścia audio 0,24 USD za minutę. Sumując to, sugeruje to, że nie powinno przekraczać 0,30 USD za minutę, prawda?
Przeprowadziliśmy rzeczywisty test API 4o-realtime i stwierdziliśmy, że kosztuje on około 1 USD za minutę.

Zrzut ekranu kosztów jednego testu API Realtime ChatGPT-4o
Przeprowadziliśmy 5-minutową rozmowę głosową z API chatgpt-4o-realtime i stwierdziliśmy, że kosztowała ona 5,38 USD. 5-minutowa rozmowa głosowa zawiera około 142 sekundy transkrybowanego dźwięku (pomyśl o tym jako o wejściu audio), reszta to głównie wyjście audio.
W innym przeprowadzonym przez nas teście, prosta 10-minutowa rozmowa kosztowała około 10 USD.
Ojej, to drogo. W rzeczywistości jest to około 10 razy droższe niż własne agenty głosowe Seasalt.ai.
Jeśli niektórzy programiści tylko testują API i próbują poświęcić znaczący wysiłek na szkolenie agenta głosowej sztucznej inteligencji, który faktycznie coś robi, mogą łatwo wydać setki dolarów dziennie!
API Realtime ChatGPT-4o vs. Agenci ludzcy – który jest bardziej przystępny cenowo?
Zatem jeśli ktoś zbudował agenta głosowej sztucznej inteligencji za pomocą API Realtime ChatGPT-4o, będzie to kosztować około 1 USD za minutę, czyli 60 USD za godzinę.
Ile kosztuje ludzki agent?
Jeśli zatrudnisz kogoś wewnętrznie, na przykład recepcjonistkę, może ona zarabiać od płacy minimalnej (7,25 USD federalnie do 16 USD w Kalifornii) do może 20 do 30 USD za godzinę.
Jeśli korzystasz z agencji zewnętrznej, cena może się różnić: niektóre zaczynają się od 349 USD/miesiąc za 200 minut plus opłata za konfigurację. Seasalt.ai przeprowadziło szczegółowe badanie na ten temat: Koszt recepcjonistów na żywo: wewnętrznie vs. outsourcing.

Podsumowanie dostawców recepcjonistów na żywo przez Seasalt.ai
API Realtime ChatGPT-4o vs. inni agenci głosowej sztucznej inteligencji – jaka jest różnica?
API Realtime ChatGPT-4o stanowi znaczący postęp w technologii głosowej sztucznej inteligencji, oferując kilka kluczowych różnic w porównaniu z innymi agentami głosowej sztucznej inteligencji:
- Reaktywność: zapewnia interakcje niemal w czasie rzeczywistym, ze średnim czasem odpowiedzi od 2 do 3 sekund
- Solidność: API umożliwia przerywanie i przekierowywanie podczas rozmów, co pozwala na bardziej naturalny przepływ dialogu
- Kompleksowość: API nie wymaga łączenia różnych komponentów, takich jak mowa na tekst (Azure, Deepgram itp.) i tekst na mowę (Azure, Eleven labs).
Ale haczyk tkwi w kosztach: API Realtime ChatGPT-4o kosztuje około 1 USD za minutę, podczas gdy inni agenci głosowej sztucznej inteligencji mogą kosztować zaledwie 0,12 USD za minutę.

Porównanie produktów agentów głosowej sztucznej inteligencji przez Seasalt.ai
Istnieje 10-krotna różnica w cenie, ale czy istnieje 10-krotna różnica w wydajności? To już ocena klienta.
Werdykt
Dla właścicieli firm istnieją zasadniczo 4 opcje:
- Wewnętrzni agenci ludzcy
- Zlecanie na zewnątrz innej firmie, zarówno krajowej, jak i zagranicznej
- Korzystanie z przystępnego cenowo agenta głosowej sztucznej inteligencji
- Budowanie z najbardziej zaawansowanym/drogim API Realtime OpenAI
Poniżej podsumowałem różne zalety i wady różnych opcji:
- OpenAI Realtime API oferuje najszybsze i najbardziej naturalne doświadczenie, ale wymaga wiedzy technicznej i jest drogie.
- Agenci ludzcy na żądanie w kraju są dobrzy do podstawowych zadań w doskonałym języku angielskim, ale mają ograniczoną integrację.
- Długoterminowi agenci ludzcy za granicą są najtańsi, ale mogą być zawodni z powodu problemów z infrastrukturą i wysokiej rotacji.
- Zintegrowani agenci głosowej sztucznej inteligencji oferują równowagę między kosztami, funkcjami i łatwością użycia, ale mogą być nieco mniej responsywni i mieć pewne problemy z integracją.

Różne opcje usług odpowiadania telefonicznego: człowiek vs. OpenAI vs. startupy głosowej sztucznej inteligencji
Jako praktyk w dziedzinie rozpoznawania mowy i przetwarzania języka naturalnego, moje dwa grosze to:
- Korzystaj z zintegrowanych agentów głosowej sztucznej inteligencji dostępnych na rynku, takich jak ten, który z dumą zbudowałem z SeaChat. Są dojrzałe i przystępne cenowo.
- Daj API Realtime OpenAI jeszcze rok na przetestowanie przez świnki morskie, a miejmy nadzieję, że cena spadnie do bardziej przystępnych 10 USD/godzinę, wtedy stanie się naprawdę niesamowite. Uważajcie, ludzcy agenci!
Dowiedz się więcej
Jeśli chcesz najpierw zapoznać się z technologią głosowej sztucznej inteligencji do obsługi klienta w rozsądnej cenie, możesz odwiedzić SeaChat lub zarezerwować u nas demo.
O tej serii
To seria 5 artykułów badających strategie komunikacji z klientami dla małych firm, skupiająca się na usługach odpowiadania:
-
Dlaczego małe firmy potrzebują usługi odpowiadania?: Odkryj znaczenie i korzyści usług odpowiadania.
-
Outsourcing vs. wewnętrzni recepcjoniści na żywo: Kim są recepcjoniści na żywo? Czy powinieneś zlecać na zewnątrz, czy zatrudniać wewnętrznie?
-
Automatyczne systemy odbierania telefonów (Interaktywna odpowiedź głosowa IVR vs. Agenci głosowej sztucznej inteligencji): Co to jest automatyczna usługa odpowiadania? Czy powinieneś używać robotycznego IVR czy agentów głosowej sztucznej inteligencji?
-
Decyzja: Czy moje małe firmy powinny korzystać z recepcjonistów na żywo czy z automatycznych usług odpowiadania?: Nauczyłeś się wszystkiego o usługach odpowiadania z naszej serii. Teraz nadszedł czas, aby zdecydować, jaki rodzaj usługi jest najlepszy dla Twojej firmy.
-
(Ten artykuł) OpenAI vs. Człowiek vs. Głosowa sztuczna inteligencja: Porównanie kosztów: Najnowsza technologia głosowej sztucznej inteligencji od OpenAI to świetny agent głosowej sztucznej inteligencji. Jaki jest rzeczywisty koszt?