음성 AI 플랫폼 가격 총정리: 분당 얼마가 적정한가
음성 AI 플랫폼 가격 총정리: 분당 얼마가 적정한가
음성 AI 플랫폼을 도입하려고 가격 페이지를 열면 혼란이 시작됩니다. 어디는 분당 $0.05, 어디는 $0.35, 어디는 "문의하세요". 게다가 광고하는 가격에 STT 비용이 포함인지, LLM 비용은 별도인지, 전화번호 비용은 또 얼마인지... 정리가 안 됩니다.
이 글에서는 주요 음성 AI 플랫폼 7곳의 가격을 실질 분당 비용 기준으로 비교하고, 숨겨진 비용 항목과 ROI 계산법까지 다룹니다. 각 플랫폼의 기능을 더 깊이 비교하고 싶다면 Bland vs Vapi vs Retell 심층 비교도 함께 읽어보세요.
가격 범위: $0.01에서 $1까지
먼저 전체 그림을 보겠습니다. 음성 AI 플랫폼의 분당 가격은 $0.01에서 $1 사이에 분포합니다. 이렇게 차이가 큰 이유는 플랫폼마다 포함하는 항목이 다르기 때문입니다.
- $0.01-0.05: STT/TTS만 제공 (LLM 비용 별도)
- $0.05-0.15: 올인원 패키지 (STT + LLM + TTS + 전화)
- $0.15-0.50: 구독형 + 분당 과금 (소프트웨어 비용 포함)
- $0.50-1.00: 엔터프라이즈 올인원 (컨설팅, SLA, 전용 인프라 포함)
플랫폼별 가격 비교
1. Bland AI — $0.09/min
구조: 올인원 분당 과금
Bland AI는 심플합니다. 분당 $0.09에 STT, LLM, TTS, 전화 연결이 모두 포함됩니다. 추가 비용 없음.
- 기본 가격: $0.09/min
- STT: 포함
- LLM: 포함 (GPT-4o 기본)
- TTS: 포함
- 전화번호: 포함
- HIPAA: 기본 포함
월 10,000분 사용 시: $900
2. Vapi — $0.05/min + 알파
구조: 플랫폼 비용 + 컴포넌트 비용 별도
Vapi의 기본 플랫폼 비용은 분당 $0.05로 가장 저렴해 보입니다. 하지만 실제 비용을 계산하려면 각 컴포넌트 비용을 더해야 합니다.
- 플랫폼 비용: $0.05/min
- STT (Deepgram): +$0.0043/min
- STT (AssemblyAI): +$0.015/min
- LLM (GPT-4o): +$0.01-0.03/min (대화 길이에 따라 변동)
- TTS (ElevenLabs): +$0.01/min
- TTS (PlayHT): +$0.008/min
- 전화번호 (Twilio): 월 $1.15 + 통화료
- HIPAA: +$1,000/mo (애드온)
실질 분당 비용: $0.07-0.10/min 월 10,000분 사용 시: $700-1,000 (HIPAA 미포함)
3. Retell AI — $0.07/min
구조: 올인원 분당 과금
Retell은 Bland와 마찬가지로 올인원입니다. 분당 $0.07에 모든 것이 포함됩니다.
- 기본 가격: $0.07/min
- STT: 포함
- LLM: 포함
- TTS: 포함
- 전화번호: 포함
- HIPAA: 기본 포함
월 10,000분 사용 시: $700
4. CloudTalk — 구독 + $0.35/min
구조: 월 구독료 + 분당 과금
CloudTalk은 전통적인 콜센터 SaaS에 AI를 얹은 모델입니다. 구독형이라 기본 월 비용이 있고, 여기에 분당 과금이 추가됩니다.
- 월 구독: $25-50/user
- 분당 비용: ~$0.35/min (국가별 상이)
- AI 기능: 추가 요금
- 전화번호: 포함
3명 팀 + 월 10,000분 사용 시: ~$3,575-3,650
전통적인 콜센터 솔루션답게 가격이 확 뜁니다. 하지만 CRM 통합, 콜 라우팅, 대시보드 등 콜센터에 필요한 기능이 기본 포함이라 단순 분당 가격만으로는 비교가 어렵습니다.
5. Vocode — $0.05/min
구조: 오픈소스 + 호스팅 비용
Vocode는 오픈소스 음성 AI 프레임워크입니다. 자체 호스팅하면 인프라 비용만 내면 되고, 매니지드 서비스는 분당 약 $0.05입니다.
- 매니지드: ~$0.05/min
- 셀프 호스팅: 인프라 비용만 (EC2, GPU 등)
- STT/LLM/TTS: 별도 (직접 연결)
자유도가 가장 높지만, 직접 인프라를 관리해야 하는 부담이 있습니다. DevOps 역량이 있는 팀에 적합합니다.
6. Synthflow — $0.08/min
구조: 올인원 분당 과금
- 기본 가격: $0.08/min
- 월 최소 플랜: $29/mo (350분 포함)
- STT/LLM/TTS: 포함
- 전화번호: 포함
월 10,000분 사용 시: $800
7. Air AI — 비공개 (에이전시 모델)
Air AI는 가격을 공개하지 않고, 에이전시 모델로 운영합니다. 설정 비용 + 분당 과금이지만, 구체적 가격은 영업팀 문의가 필요합니다. 업계 추정치로는 분당 $0.10-0.20 수준입니다.
가격 비교 요약표
| 플랫폼 | 표시 가격 | 실질 비용/min | 월 10K분 비용 | 특징 |
|---|---|---|---|---|
| Vapi | $0.05 | $0.07-0.10 | $700-1,000 | 컴포넌트 자유 조합 |
| Vocode | $0.05 | $0.05-0.08 | $500-800 | 오픈소스 |
| Retell | $0.07 | $0.07 | $700 | 올인원, 비주얼 빌더 |
| Synthflow | $0.08 | $0.08 | $800 | 올인원 |
| Bland | $0.09 | $0.09 | $900 | 올인원, 노코드 |
| CloudTalk | $0.35 | $0.35+ | $3,500+ | 콜센터 SaaS |
| Air AI | 비공개 | $0.10-0.20 | $1,000-2,000 | 에이전시 모델 |
숨겨진 비용 항목들
표시 가격만 보면 안 되는 이유가 있습니다. 실제 운영 시 발생하는 숨겨진 비용을 정리해보겠습니다.
1. LLM 비용
대부분의 음성 AI 파이프라인은 LLM을 사용합니다. 올인원 플랫폼이 아닌 경우, LLM 비용이 별도로 붙습니다.
| 모델 | 분당 비용 (추정) |
|---|---|
| GPT-4o | $0.02-0.06/min |
| GPT-4o-mini | $0.006-0.01/min |
| Claude 3.5 Sonnet | $0.01-0.03/min |
| Llama 3 (자체 호스팅) | $0.005-0.01/min |
대화가 길어질수록 컨텍스트 토큰이 쌓여서 비용이 증가하는 점도 주의하세요. 5분 통화와 20분 통화의 분당 LLM 비용은 다릅니다.
2. STT(Speech-to-Text) 비용
음성을 텍스트로 바꾸는 비용입니다. 올인원이 아닌 플랫폼에서는 별도입니다.
| 서비스 | 분당 비용 |
|---|---|
| Deepgram | $0.0043/min |
| Google Speech-to-Text | $0.006/min |
| AssemblyAI | $0.015/min |
| Whisper (자체 호스팅) | ~$0.003/min |
Deepgram이 가장 가성비가 좋습니다. 속도도 빠르고 정확도도 높아서 대부분의 음성 AI 플랫폼이 기본으로 사용합니다.
AssemblyAI는 Deepgram보다 3배 이상 비싸지만, 특정 언어나 억양에서 더 나은 정확도를 보이는 경우가 있습니다.
3. TTS(Text-to-Speech) 비용
| 서비스 | 분당 비용 |
|---|---|
| ElevenLabs | $0.008-0.015/min |
| PlayHT | $0.006-0.01/min |
| Google TTS | $0.004/min |
| OpenAI TTS | $0.015/min |
자연스러운 음성일수록 비쌉니다. ElevenLabs가 음질은 최고지만 가격도 높습니다.
4. 전화번호 비용
| 항목 | 비용 |
|---|---|
| 미국 번호 (Twilio) | $1.15/mo + $0.014/min |
| 영국 번호 | $1.50/mo + $0.02/min |
| 한국 070 번호 | 별도 문의 (과기정통부 인가 사업자 필요) |
| 톨프리 번호 (800) | $2.15/mo + $0.022/min |
5. HIPAA/보안 추가 비용
| 플랫폼 | HIPAA 비용 |
|---|---|
| Retell | 기본 포함 |
| Bland | 기본 포함 |
| Vapi | $1,000/mo |
| CloudTalk | Enterprise 플랜 필요 |
Vapi의 HIPAA 비용은 특히 스타트업에게 부담이 큽니다. 의료 분야라면 Retell이나 Bland가 비용 면에서 유리합니다. 한국에서는 한국인터넷진흥원(KISA)의 개인정보보호 관련 가이드라인도 함께 확인해야 합니다.
ClawOps 가격은?
한국 시장에서 음성 AI를 운영할 때 ClawOps의 포지셔닝을 살펴보겠습니다.
ClawOps는 음성 AI 플랫폼 자체가 아니라, 한국 통신 인프라 브릿지입니다. 글로벌 플랫폼(Retell, Vapi 등)과 한국 전화망을 연결해주는 역할을 합니다.
무료 Trial로 카드등록 없이 바로 시작할 수 있습니다. Trial은 전화회선 1개, 발신 10분, SMS 10건이 무료입니다.
가격 구조는 claw-ops.com에서 확인할 수 있습니다. 핵심은:
- 한국 070 번호 발급 및 관리
- SIP 트렁크 연결
- 한국 통신사 라우팅 최적화
글로벌 플랫폼 비용 + ClawOps 인프라 비용이 총 비용이 됩니다. 한국에서 해외 번호로 전화하면 고객 응답률이 바닥이니, 070 번호 비용은 사실상 필수 투자입니다. 한국 시장에서의 대안을 더 자세히 비교하려면 Twilio 한국 대안 비교를 참고하세요.
ROI 계산: 음성 AI가 돈이 되는가
가격만 보지 말고 ROI를 계산해보겠습니다. 전형적인 인바운드 고객 응대 시나리오로 예를 들어보겠습니다.
시나리오: 월 5,000건 인바운드 콜 처리
현재 (사람 상담원):
- 상담원 3명 × 월 350만원 = 1,050만원/월
- 평균 통화 시간: 4분
- 처리 가능 콜: 하루 약 50건/인 × 22일 = 3,300건
- 나머지 1,700건: 미응답 → 매출 손실
음성 AI 도입 후:
- AI 처리: 5,000건 × 4분 = 20,000분
- Retell 기준: 20,000 × $0.07 = $1,400 ≈ 약 190만원/월
- ClawOps 인프라: 약 50만원/월 (추정)
- 상담원 1명 유지 (복잡한 케이스): 350만원/월
- 총 비용: 약 590만원/월
절감액: 460만원/월 = 연 5,520만원
거기에 24시간 응대가 가능해지면서 이전에 놓치던 1,700건의 일부를 추가 확보할 수 있습니다. 전환율 5%에 건당 평균 매출 10만원으로 잡으면:
추가 매출: 1,700 × 5% × 10만원 = 850만원/월
비용 절감 + 추가 매출을 합치면, 첫 해 ROI는 3배 이상입니다.
ROI 계산 시 주의점
- AI가 처리 못하는 콜 비율: 보통 10-20%는 사람에게 전달해야 합니다
- 도입 비용: 초기 설정, 프롬프트 엔지니어링, 연동 개발에 1-2개월 소요
- 학습 곡선: 프롬프트 최적화에 시간이 걸립니다. 처음부터 완벽하지 않습니다
- 고객 만족도: 잘 구현하면 사람보다 나을 수 있지만, 어설프면 역효과입니다
결론: 분당 비용보다 총 비용을 보세요
음성 AI 플랫폼을 고를 때 분당 가격만 비교하면 함정에 빠집니다. 중요한 건:
- 실질 총 비용: STT, LLM, TTS, 전화번호, 보안 추가 비용까지 포함한 진짜 비용
- 숨겨진 비용: HIPAA 애드온, 전화번호 비용, 오버에이지 요금
- ROI: 비용 절감 + 추가 매출을 합산한 투자 수익률
- 시장 적합성: 한국 시장이라면 070 번호 지원이 필수
가장 싼 플랫폼이 가장 좋은 플랫폼은 아닙니다. 내 유즈케이스에 맞는 실질 총 비용이 가장 낮은 플랫폼이 최선입니다. 직접 구축할지 SaaS를 쓸지 고민된다면 AI 콜센터 Build vs Buy 비교도 함께 읽어보세요.
관련 글 더 보기
Twilio 한국 대안 총정리: 한국 번호로 전화·문자 보내는 API 플랫폼 비교
Twilio를 한국에서 쓸 수 없다면? 한국 전화번호를 지원하는 통신 API 플랫폼들을 기능, 가격, 번호 유형별로 비교합니다.
비교Bland AI vs Vapi vs Retell 심층 비교: 레이턴시, 가격, 한국어 지원까지
Bland AI, Vapi, Retell AI 세 플랫폼의 레이턴시, 가격, 한국어 지원을 심층 비교합니다.
비교AI 전화 에이전트 프레임워크 비교: 오픈소스부터 상용 플랫폼까지 한눈에
AI 전화 에이전트를 만들 수 있는 프레임워크를 오픈소스(Pipecat, Vocode)부터 상용 플랫폼(Vapi, Retell)까지 비교합니다.
비교CLOVA AiCall vs API 자체 구축: 네이버 솔루션, 직접 만드는 것과 뭐가 다를까?
네이버 CLOVA AiCall과 ClawOps 같은 API를 활용한 자체 구축 방식을 기능, 비용, 유연성 측면에서 비교합니다.
비교AI 콜센터 Build vs Buy: API로 직접 만들까, SaaS를 도입할까?
AI 콜센터를 자체 구축(Build)할지 SaaS를 도입(Buy)할지 비용, 유연성, 운영 부담 측면에서 비교합니다.