AI 전화 에이전트 프롬프트 엔지니어링: 통화 품질을 결정하는 프롬프트 설계법
AI 전화 에이전트 프롬프트 엔지니어링: 통화 품질을 결정하는 프롬프트 설계법

챗봇 프롬프트 작성해본 사람이면, 전화 에이전트 프롬프트도 비슷할 거라고 생각합니다. 저도 처음엔 그랬습니다.
그런데 막상 AI 전화 에이전트를 만들어보면 완전히 다른 세계입니다. 채팅은 사용자가 천천히 읽고 다시 물어볼 수 있지만, 전화는 실시간입니다. 3초만 침묵해도 상대방이 "여보세요?" 합니다. 응답이 길면 끊어버리고, 짧으면 무성의해 보입니다. 텍스트에서 잘 먹히던 프롬프트가 음성에선 완전히 다른 결과를 만듭니다.
이 글에서는 실제로 AI 전화 에이전트를 운영하면서 검증한 프롬프트 설계 기법을 정리합니다.
전화 프롬프트가 챗봇과 다른 이유
실시간 응답 제약
챗봇은 5초 걸려도 "입력 중..." 표시면 됩니다. 전화는 다릅니다. 음성 AI 레이턴시 최적화에서 다뤘듯이, 응답까지 500ms를 넘기면 대화 흐름이 끊깁니다. 프롬프트 자체가 짧고 빠른 응답을 유도하도록 설계되어야 합니다.
턴테이킹과 인터럽트
전화 대화에서는 상대방이 말하는 도중에 끼어들 수 있고, AI도 말하는 중에 끊길 수 있습니다. "상대방이 말을 끊으면 즉시 멈추고 들어라", "한 번에 2문장 이상 말하지 마라" 같은 턴 제어 지시가 프롬프트에 반드시 포함되어야 합니다.
음성 전용 포맷팅
마크다운, 이모지, 번호 목록 — 전부 쓸모없습니다. 전화에서는 모든 정보가 음성으로 전달되므로, "첫째, 둘째" 같은 구어체 열거나 "잠시만요, 확인해보겠습니다" 같은 필러 표현이 필요합니다.
시스템 프롬프트 기본 구조
역할 정의와 범위 제한
시스템 프롬프트의 첫 블록에서 에이전트의 역할과 할 수 있는 것/없는 것을 명확히 정의합니다.
당신은 [회사명]의 전화 상담 에이전트입니다.
- 할 수 있는 것: 예약 확인, 영업시간 안내, FAQ 응답
- 할 수 없는 것: 결제 처리, 개인정보 변경, 의료 상담
- 할 수 없는 요청을 받으면: "담당자를 연결해드리겠습니다"로 전환
범위를 벗어난 질문에 LLM이 환각(hallucination)으로 답변하는 걸 방지하는 게 핵심입니다. AI 전화 에이전트와 챗봇의 차이에서도 강조했듯이, 전화 에이전트는 "모르면 모른다"가 특히 중요합니다.
응답 길이와 톤 지시
- 한 번에 최대 2문장으로 응답하세요
- 경어체를 사용하되 딱딱하지 않게 말하세요
- 전문 용어 대신 쉬운 표현을 사용하세요
- 숫자는 천천히, 또박또박 말하세요 (전화번호, 금액 등)
TTS가 읽기 좋은 텍스트를 생성하도록 유도하는 것이 핵심입니다. 괄호, 특수문자, URL 같은 건 프롬프트에서 명시적으로 금지해야 합니다.
페르소나 설계
목소리 톤과 성격
전화 에이전트의 페르소나는 업종에 따라 완전히 달라야 합니다. 병원 AI 전화 예약에서는 차분하고 신뢰감 있는 톤이 필요하고, 아웃바운드 영업 전화에서는 활기차고 친근한 톤이 효과적입니다.
페르소나 프롬프트 예시:
톤: 친절하지만 효율적. 호텔 프론트 데스크 직원처럼.
말투: "~입니다", "~드리겠습니다" 체계적 경어체.
금지: 과도한 사과, 불필요한 공감 표현, 웃음소리 묘사.
상황별 톤 전환
불만 고객에게는 공감 모드로, 단순 문의에는 효율 모드로 전환하는 지시를 넣습니다. "고객이 화가 난 것 같으면 속도를 늦추고 먼저 공감 표현을 하세요" 같은 조건부 지시가 효과적입니다.
예외 상황 처리 프롬프트
침묵, 잡음, 인식 실패
전화에서 가장 흔한 예외는 STT 인식 실패입니다. 한국어 STT/TTS 비교에서 다뤘듯이 한국어 음성 인식은 아직 완벽하지 않습니다. 프롬프트에 이런 상황을 명시해야 합니다.
- 상대방 말을 인식하지 못했으면: "죄송합니다, 다시 한번 말씀해주시겠어요?"
- 3초 이상 침묵이면: "혹시 더 궁금하신 점 있으신가요?"
- 3회 연속 인식 실패: "통화 상태가 좋지 않은 것 같습니다. 담당자를 연결해드릴까요?"
에스컬레이션 트리거
모든 전화를 AI가 처리할 수는 없습니다. "담당자 연결해주세요", 법적 민감 질문, 감정이 격해진 고객 — 이런 경우 사람에게 넘기는 조건을 프롬프트에 명확히 정의해야 합니다.
프롬프트 테스트와 반복 개선
A/B 테스트 프레임워크
프롬프트 변경이 실제 통화 품질에 미치는 영향은 직접 테스트해봐야 압니다. 동일한 시나리오에 두 가지 프롬프트를 적용하고, 통화 완료율, 평균 통화 시간, 고객 만족도를 비교합니다. AI 전화 시스템 아키텍처에서 설명한 웹훅 시스템으로 통화 데이터를 수집하면 정량적 비교가 가능합니다.
프롬프트 버전 관리
프롬프트도 코드처럼 버전 관리해야 합니다. 변경 이력, 적용 일시, 성과 지표를 함께 기록하면 어떤 변경이 효과가 있었는지 추적할 수 있습니다.
결론
AI 전화 에이전트의 품질은 결국 프롬프트에서 결정됩니다. 챗봇과 달리 실시간 음성 대화라는 제약 안에서, 짧고 명확하며 예외를 잘 처리하는 프롬프트를 설계해야 합니다.
ClawOps는 전화 인프라(SIP, 070 번호, 통화 연결)를 API로 제공하므로, 개발자는 인프라 걱정 없이 프롬프트 최적화에 집중할 수 있습니다. 무료 Trial로 직접 프롬프트를 테스트해보세요.
참고 링크
관련 글 더 보기
AI 전화 에이전트 성과 측정 KPI 10가지: 무엇을 추적해야 하나
AI 전화 에이전트의 성과를 측정하는 핵심 KPI 10가지. 통화 완료율, 응답 레이턴시, CSAT부터 비용 효율까지 실전 지표와 측정 방법을 정리합니다.
가이드AI 상담원 만들기: 채팅봇 말고 진짜 전화 상담원
채팅봇과 AI 전화 상담원의 차이점을 비교하고, 실시간 음성 대화가 가능한 AI 전화 상담원을 구축하는 방법을 안내합니다.
가이드AI 전화 에이전트용 LLM 비교: GPT vs Claude vs Gemini
AI 전화 에이전트에 어떤 LLM을 써야 할까? GPT-4o, Claude, Gemini의 응답 속도, 한국어 품질, 가격, 음성 API 지원을 전화 에이전트 관점에서 비교합니다.
가이드WebRTC + SIP 게이트웨이: 브라우저에서 바로 전화 걸기
WebRTC와 SIP 게이트웨이를 연동하여 브라우저에서 070 전화를 거는 방법. 한국 SIP 환경에서의 WebRTC 구현, SRTP 변환, NAT 처리까지 실전 가이드를 제공합니다.
가이드AI 음성봇 시나리오 설계 7단계: 자연스러운 전화 대화 만들기
AI 음성봇의 대화 시나리오를 설계하는 7단계 가이드. 목적 정의, 대화 흐름 설계, 예외 처리, 에스컬레이션까지 실전 시나리오 설계법을 정리합니다.