Это серия из 5 статей, посвященных стратегиям общения с клиентами для малого бизнеса, с акцентом на услуги автоответчика:
-
Почему малому бизнесу нужна служба автоответчика?: Узнайте о важности и преимуществах услуг автоответчика.
-
Аутсорсинг против штатных живых секретарей: Кто такие живые секретари? Стоит ли вам аутсорсить или нанимать в штат?
-
Автоматизированные системы телефонных ответов (интерактивная голосовая система IVR против голосовых ИИ-агентов): Что такое автоматизированная служба ответов? Стоит ли использовать интерактивную голосовую систему или голосовых ИИ-агентов?
-
Решение: Должен ли мой малый бизнес использовать живых секретарей или автоматизированные службы ответов?: Вы узнали все о службах ответов из нашей серии. Теперь пришло время решить, какой тип услуги лучше всего подходит для вашего бизнеса.
-
(Эта статья) OpenAI против человека против голосового ИИ: сравнение затрат: Задумываетесь, стоит ли переходить на новейшую технологию голосового ИИ? Давайте посмотрим на реальные затраты.
TLDR:
- И OpenAI, и люди могут быть дорогими:
- OpenAI Realtime API может обеспечить работу голосового агента (ИИ) примерно за 1 доллар в минуту.
- Виртуальные секретари по запросу (люди) также стоят около 1 доллара в минуту.
- Но есть сбалансированные варианты с оговорками:
- При долгосрочном найме человеческие агенты с хорошим английским могут стоить всего 5 долларов в час (0,08 доллара в минуту).
- Голосовые ИИ-агенты, предлагаемые стартапами, могут стоить всего 7,2 доллара в час (0,12 доллара в минуту).
Если вы предпочитаете послушать аудиоверсию этой статьи, вот видео:
Реальная стоимость API Realtime ChatGPT-4o
OpenAI выпустила свой API Realtime для ChatGPT-4o 1 октября 2024 года. Это произошло через 5 месяцев после выпуска GPT-4o, первой омниканальной большой языковой модели. Производительность потрясающая. Chatgpt-4o-realtime звучит как человек, реагирует как человек и устойчив к шумам и прерываниям.
Однако, доступен ли Chatgpt-4o-realtime?
На первый взгляд, API Realtime OpenAI кажется примерно в 30 раз дороже, чем GPT-4o-mini в тексте (5 долларов против 0,15 доллара / 1 млн входных токенов).

Цены на chatgpt-4o-realtime в октябре 2024 года

Цены на chatgpt-4o-mini в октябре 2024 года
OpenAI утверждает, что стоимость аудиовхода составляет около 0,06 доллара в минуту, а аудиовыхода — 0,24 доллара в минуту. Суммируя это, можно предположить, что это не должно превышать 0,30 доллара в минуту, верно?
Мы провели реальное тестирование API 4o-realtime и обнаружили, что оно стоит примерно 1 доллар в минуту.

Скриншот стоимости одного теста API Realtime ChatGPT-4o
Мы провели 5-минутную голосовую беседу с API chatgpt-4o-realtime и обнаружили, что она стоила 5,38 доллара. 5-минутная голосовая беседа содержит около 142 секунд транскрибированного аудио (считайте это аудиовходом), остальное — это в основном аудиовыход.
В другом проведенном нами тесте простой 10-минутный разговор стоил около 10 долларов.
Ух ты, это дорого. На самом деле, это примерно в 10 раз дороже, чем собственные голосовые агенты Seasalt.ai.
Если некоторые разработчики просто тестируют API и пытаются приложить значительные усилия для обучения голосового ИИ-агента, который действительно что-то делает, они могут легко потратить сотни долларов в день!
API Realtime ChatGPT-4o против человеческих агентов – что более доступно?
Итак, если кто-то создаст голосового ИИ-агента с использованием API Realtime ChatGPT-4o, это будет стоить около 1 доллара в минуту, или 60 долларов в час.
Сколько стоит человеческий агент?
Если вы используете штатного сотрудника, например, секретаря на ресепшене, его зарплата может составлять от минимальной заработной платы (7,25 доллара федерального уровня до 16 долларов в Калифорнии) до, возможно, 20-30 долларов в час.
Если вы используете стороннее агентство, цена может варьироваться: некоторые начинаются от 349 долларов в месяц за 200 минут плюс плата за установку. Seasalt.ai провела подробное исследование по этому вопросу: Стоимость живых секретарей: штатные против аутсорсинга.

Сводка поставщиков живых секретарей от Seasalt.ai
API Realtime ChatGPT-4o против других голосовых ИИ-агентов – в чем разница?
API Realtime ChatGPT-4o представляет собой значительный прогресс в технологии голосового ИИ, предлагая несколько ключевых отличий по сравнению с другими голосовыми ИИ-агентами:
- Отзывчивость: он обеспечивает почти реальное время взаимодействия, со средним временем ответа от 2 до 3 секунд
- Надежность: API позволяет прерывать и перенаправлять во время разговоров, что обеспечивает более естественный поток диалога
- Комплексность: API не требует склеивания различных компонентов, таких как преобразование речи в текст (Azure, Deepgram и т. д.) и преобразование текста в речь (Azure, Eleven labs).
Но загвоздка здесь в стоимости: API Realtime ChatGPT-4o стоит примерно 1 доллар в минуту, в то время как другие голосовые ИИ-агенты могут стоить всего 0,12 доллара в минуту.

Сравнение продуктов голосовых ИИ-агентов от Seasalt.ai
Разница в цене в 10 раз, но есть ли разница в производительности в 10 раз? Это решать клиенту.
Вердикт
Для владельцев бизнеса есть в основном 4 варианта:
- Штатные человеческие агенты
- Аутсорсинг в другую компанию, как внутри страны, так и за рубежом
- Использование доступного голосового ИИ-агента
- Создание с использованием самого передового/дорогого API Realtime OpenAI
Я кратко изложил различные плюсы и минусы различных вариантов ниже:
- OpenAI Realtime API предлагает самый быстрый и естественный опыт, но требует технических знаний и является дорогим.
- Штатные человеческие агенты по запросу хороши для базовых задач на идеальном английском, но имеют ограниченную интеграцию.
- Долгосрочные человеческие агенты за рубежом являются наиболее доступными, но могут быть ненадежными из-за проблем с инфраструктурой и высокой текучести кадров.
- Интегрированные голосовые ИИ-агенты предлагают баланс между стоимостью, функциями и простотой использования, но могут быть немного менее отзывчивыми и иметь особенности интеграции.

Различные варианты услуг телефонного ответа: человек против OpenAI против стартапов голосового ИИ
Как практик в области распознавания речи и обработки естественного языка, мое мнение таково:
- Используйте интегрированные голосовые ИИ-агенты на рынке, такие как тот, который я с гордостью создал с SeaChat. Они зрелые и доступные.
- Дайте API Realtime OpenAI еще год, чтобы подопытные его протестировали, и, надеюсь, цена упадет до более доступных 10 долларов в час, тогда он станет по-настоящему удивительным. Осторожно, человеческие агенты!
Узнать больше
Если вы хотите сначала изучить технологию голосового ИИ для обслуживания клиентов по разумной цене, вы можете посетить SeaChat или можете записаться на демонстрацию у нас.
Об этой серии
Это серия из 5 статей, посвященных стратегиям общения с клиентами для малого бизнеса, с акцентом на услуги автоответчика:
-
Почему малому бизнесу нужна служба автоответчика?: Узнайте о важности и преимуществах услуг автоответчика.
-
Аутсорсинг против штатных живых секретарей: Кто такие живые секретари? Стоит ли вам аутсорсить или нанимать в штат?
-
Автоматизированные системы телефонных ответов (интерактивная голосовая система IVR против голосовых ИИ-агентов): Что такое автоматизированная служба ответов? Стоит ли использовать роботизированную IVR или голосовых ИИ-агентов?
-
Решение: Должен ли мой малый бизнес использовать живых секретарей или автоматизированные службы ответов?: Вы узнали все о службах ответов из нашей серии. Теперь пришло время решить, какой тип услуги лучше всего подходит для вашего бизнеса.
-
(Эта статья) OpenAI против человека против голосового ИИ: сравнение затрат: Новейшая технология голосового ИИ от OpenAI — это отличный голосовой ИИ-агент. Какова реальная стоимость?