Esta é uma série de 5 artigos que exploram estratégias de comunicação com o cliente para pequenas empresas, com foco em serviços de atendimento:
-
Por que as Pequenas Empresas Precisam de um Serviço de Atendimento?: Descubra a importância e os benefícios dos serviços de atendimento.
-
Terceirização vs. Recepcionistas ao Vivo Internos: O que são recepcionistas ao vivo? Você deve terceirizar ou contratar internamente?
-
Sistemas de Atendimento Telefônico Automatizados (Resposta de Voz Interativa IVR vs. Agentes de IA de Voz): O que é um serviço de atendimento automatizado? Você deve usar a Resposta de Voz Interativa ou agentes de IA de Voz?
-
Decisão: Minhas Pequenas Empresas Devem Usar Recepcionistas ao Vivo ou Serviços de Atendimento Automatizados?: Você aprendeu tudo sobre os serviços de atendimento em nossa série. Agora é hora de decidir qual tipo de serviço é o melhor para o seu negócio.
-
(Este Artigo) OpenAI vs. Humano vs. IA de Voz: Uma Comparação de Custos: Se pergunta se deve mudar para a mais recente tecnologia de IA de voz? Vamos dar uma olhada nos custos reais.
TLDR:
- Tanto a OpenAI quanto os humanos podem ser caros:
- A API em tempo real da OpenAI pode habilitar a experiência de agente de voz (IA) por cerca de US$ 1 por minuto.
- Recepcionistas virtuais sob demanda (humanos) também custam cerca de US$ 1 por minuto.
- Mas há opções equilibradas com ressalvas:
- Quando empregados a longo prazo, agentes humanos com bom inglês podem custar apenas US$ 5 por hora (US$ 0,08 por minuto).
- Agentes de IA de voz oferecidos por startups podem custar apenas US$ 7,2 por hora (US$ 0,12 por minuto).
Se você preferir ouvir uma versão em áudio deste artigo, aqui está o vídeo:
Custo Real da API em Tempo Real do ChatGPT-4o
A OpenAI lançou sua API em tempo real para o ChatGPT-4o em 1º de outubro de 2024. Isso ocorre 5 meses após o lançamento do GPT-4o, o primeiro modelo de linguagem grande omnicanal. O desempenho é impressionante. O Chatgpt-4o-realtime soa como um humano, responde como um humano e é robusto contra ruídos e interrupções.
No entanto, o Chatgpt-4o-realtime é acessível?
À primeira vista, a API em tempo real da OpenAI parece cerca de 30 vezes mais cara que o GPT-4o-mini em texto (US$ 5 vs. US$ 0,15 / 1 milhão de tokens de entrada).

Preços do chatgpt-4o-realtime em outubro de 2024

Preços do chatgpt-4o-mini em outubro de 2024
A OpenAI afirma que custa aproximadamente US$ 0,06 por minuto para entrada de áudio e US$ 0,24 por minuto para saída de áudio. Somando isso, sugere que não deve exceder US$ 0,30 por minuto, certo?
Realizamos um teste real da API 4o-realtime e descobrimos que custa aproximadamente US$ 1 por minuto.

Captura de tela do custo de um teste da API em tempo real do ChatGPT-4o
Realizamos uma conversa de voz de 5 minutos com a API chatgpt-4o-realtime e descobrimos que custou US$ 5,38. A conversa de voz de 5 minutos tem cerca de 142 segundos de áudio transcrito (pense nisso como entrada de áudio), o restante é principalmente saída de áudio.
Em outro teste que fizemos, uma conversa simples de 10 minutos custou cerca de US$ 10.
Caramba, isso é caro. Na verdade, é cerca de 10 vezes mais caro que os próprios agentes de voz da Seasalt.ai.
Se alguns desenvolvedores estão apenas testando a API e tentando dedicar um esforço significativo para treinar um agente de IA de voz que realmente faça algo, eles podem facilmente gastar centenas de dólares em um dia!
API em Tempo Real do ChatGPT-4o vs. Agentes Humanos – qual é mais acessível?
Então, se alguém construísse um agente de IA de voz usando a API em tempo real do ChatGPT-4o, custaria cerca de US$ 1 por minuto, ou US$ 60 por hora.
Quanto custa um agente humano?
Se você usar um interno, como um recepcionista de recepção, ele pode ganhar entre o salário mínimo (US$ 7,25 federal a US$ 16 na Califórnia) e talvez US$ 20 a US$ 30 por hora.
Se você usar uma agência terceirizada, o preço pode variar: alguns começam em US$ 349/mês por 200 minutos mais taxa de configuração. A Seasalt.ai escreveu uma pesquisa detalhada sobre isso: Custo de Recepcionistas ao Vivo: Interno vs. Terceirização.

Resumo de Fornecedores de Recepcionistas ao Vivo por Seasalt.ai
API em Tempo Real do ChatGPT-4o vs. outros Agentes de IA de Voz – qual é a diferença?
A API em tempo real do ChatGPT-4o representa um avanço significativo na tecnologia de IA de voz, oferecendo várias diferenças-chave em comparação com outros agentes de IA de voz:
- Capacidade de resposta: ela fornece interações quase em tempo real, com tempos de resposta médios de 2 a 3 segundos
- Robustez: A API permite interrupções e redirecionamentos durante as conversas, permitindo um fluxo de diálogo mais natural
- De ponta a ponta: a API não exige a junção de diferentes componentes, como fala para texto (Azure, Deepgram, etc.) e texto para fala (Azure, Eleven labs).
Mas a ressalva aqui é o custo: a API em tempo real do ChatGPT-4o custa aproximadamente US$ 1 por minuto, enquanto outros agentes de IA de voz podem custar apenas US$ 0,12 por minuto.

Comparação de Produtos de Agentes de IA de Voz por Seasalt.ai
Há uma diferença de preço de 10 vezes, mas há uma diferença de desempenho de 10 vezes? Isso é para o cliente julgar.
Veredito
Para os proprietários de empresas, existem basicamente 4 opções:
- Agentes humanos internos
- Terceirizar para uma empresa diferente, seja onshore ou offshore
- Usar um agente de IA de voz acessível
- Construir com a API em tempo real da OpenAI mais avançada/cara
Resumi os vários prós e contras das diferentes opções abaixo:
- A API em tempo real da OpenAI oferece a experiência mais rápida e natural, mas requer experiência técnica e é cara.
- Os agentes humanos sob demanda onshore são bons para tarefas básicas em inglês perfeito, mas têm integração limitada.
- Os agentes humanos de longo prazo offshore são os mais acessíveis, mas podem ser não confiáveis devido a problemas de infraestrutura e alta rotatividade.
- Os agentes de IA de voz integrados oferecem um equilíbrio entre custo, recursos e facilidade de uso, mas podem ser ligeiramente menos responsivos e ter peculiaridades de integração.

Diferentes opções para serviços de atendimento telefônico: humanos vs. OpenAI vs. startups de IA de voz
Como profissional na área de reconhecimento de fala e processamento de linguagem natural, meus dois centavos são:
- Use os agentes de IA de voz integrados no mercado, como o que eu orgulhosamente construí com o SeaChat. Eles são maduros e acessíveis.
- Dê mais um ano para a API em tempo real da OpenAI para que os cobaias a testem, e espero que o preço caia para um mais acessível US$ 10/hora, então ela se tornará realmente incrível. Cuidado, agentes humanos!
Saiba mais
Se você quiser explorar primeiro a tecnologia de voz de IA para atendimento ao cliente a um preço razoável, você pode visitar SeaChat ou você pode agendar uma demonstração conosco.
Sobre esta Série
Esta é uma série de 5 artigos que exploram estratégias de comunicação com o cliente para pequenas empresas, com foco em serviços de atendimento:
-
Por que as Pequenas Empresas Precisam de um Serviço de Atendimento?: Descubra a importância e os benefícios dos serviços de atendimento.
-
Terceirização vs. Recepcionistas ao Vivo Internos: O que são recepcionistas ao vivo? Você deve terceirizar ou contratar internamente?
-
Sistemas de Atendimento Telefônico Automatizados (Resposta de Voz Interativa IVR vs. Agentes de IA de Voz): O que é um serviço de atendimento automatizado? Você deve usar IVR robótico ou Agentes de IA de Voz?
-
Decisão: Minhas Pequenas Empresas Devem Usar Recepcionistas ao Vivo ou Serviços de Atendimento Automatizados?: Você aprendeu tudo sobre os serviços de atendimento em nossa série. Agora é hora de decidir qual tipo de serviço é o melhor para o seu negócio.
-
(Este Artigo) OpenAI vs. Humano vs. IA de Voz: Uma Comparação de Custos: A mais recente tecnologia de IA de voz da OpenAI é um ótimo agente de IA de voz. Qual é o custo real?