ElevenLabs(일레븐랩스)의 Prime Voice(프라임 보이스) AI는 텍스트를 자연스럽고 생동감 있는 음성으로 변환하는 서비스입니다. 이 기술은 다양한 음성 선택 옵션과 세부 조정 기능을 제공하여 맞춤형 음성 콘텐츠를 제작할 수 있게 해줍니다. Prime Voice(프라임 보이스) AI는 콘텐츠 제작, 교육, 고객 서비스 등 다양한 분야에서 활용 가능합니다.
1. 회원 가입 및 로그인
- 회원 가입: 🔍 ElevenLabs 웹사이트에 방문하여 회원 가입을 합니다. 이름, 이메일 주소, 비밀번호를 입력하고 계정을 만듭니다. 구글 계정으로도 로그인 가능합니다.
- 로그인: 이미 계정이 있는 경우, 이메일 주소와 비밀번호를 입력하여 로그인합니다.
- 설문 조사: First name, 알게된 계기, 직업 등 간단한 설문 조사를 합니다.
- 서비스 가격: 월/연간 구독 서비스가 있으며, 무료로 서비스 경험(5,000 Texts) 가능합니다.
(Free: $0/mo, Starter: $5/mo, Creator: $11/mo, Pro: $99/mo, Scale: $330/mo)
2. 텍스트 입력
- 새 프로젝트 시작: 로그인 후 대시보드에서 “Projects” 버튼을 클릭합니다.
장문의 콘텐츠와 전체 문서 변환(long-form content and full document conversions)일 경우에만 선택합니다. - 텍스트 입력: 변환하고자 하는 텍스트를 입력합니다. 텍스트를 복사해서 붙여넣을 수도 있고, 직접 입력할 수도 있습니다.
🔍 프로젝트 기능 소개 (클릭하여 펼쳐보기..)
ElevenLabs의 Projects는 오디오북을 신속하게 제작할 수 있는 엔드투엔드 워크플로우를 제공합니다. 텍스트 파일(ePub, PDF, txt 파일 등)을 업로드하거나 URL을 통해 텍스트를 불러와서, 버튼 클릭 한 번으로 오디오로 변환할 수 있습니다. 각기 다른 텍스트 조각에 다양한 음성을 쉽게 할당할 수 있으며, 필요한 경우 오디오의 특정 부분을 재생성하여 흐름이나 억양을 방해하지 않고 수정할 수 있습니다.
또한, 작업을 여러 부분으로 나누어 한 조각씩 집중할 수 있으며, 진행 상황을 저장하고 나중에 이어서 작업할 수 있습니다. Projects는 전문적인 음성 클로닝, 음성 라이브러리 및 다국어 모델과 통합되어, 미리 녹음된 음성, 커뮤니티 음성, 사용자 자신의 음성을 사용하여 여러 언어로 긴 형식의 콘텐츠를 생성할 수 있습니다.
3. 음성 선택 (Voices)
- 음성 선택(Voices): 다양한 음성 옵션이 제공됩니다. 각 음성의 샘플을 들어보고 원하는 음성을 선택합니다.
- 커스터마이징(Setting): 선택한 음성을 세부적으로 조정할 수 있습니다. 예를 들어, 음성 톤, 속도, 감정 표현 등을 설정할 수 있습니다.
4. 설정 조정 (미세 조정)
- 언어 선택: 다국어 지원 기능을 통해 다양한 언어의 텍스트를 음성으로 변환할 수 있습니다.
- 세부 설정: 음성의 속도, 톤, 볼륨, 감정 표현(기쁨, 슬픔, 중립 등)을 조정할 수 있습니다.
감정을 강조하는 구체적인 문구를 삽입함으로써 조정됩니다. 예를 들어, “he shouted,” “she cried”와 같은 문구를 사용하여 감정을 표현할 수 있습니다. - 음성 디자인 (Voice design): 사용자가 성별, 나이, 억양 등 기본적인 음성 특성을 선택하여 완전히 새로운 합성 음성을 생성할 수 있게 합니다.
메뉴 위치: Create > Voices > Add a new voice > Voice Design
5. 변환 실행
- 변환 시작: 모든 설정을 마친 후, “Generate” 버튼을 클릭합니다.
- 실시간 미리 듣기: 변환된 음성을 실시간으로 미리 들어볼 수 있습니다. 필요한 경우 설정을 다시 조정하고 변환을 반복할 수 있습니다.
👇 제작 샘플 (직접 평가해 보세요!)
6. 파일 다운로드
- 파일 저장: 변환이 완료되면 음성 파일을 다운로드할 수 있습니다. MP3, WAV 등 다양한 형식으로 저장할 수 있습니다.
- 공유 및 배포: 생성된 음성 파일을 다양한 플랫폼에 공유하거나 배포할 수 있습니다. 예를 들어, 팟캐스트, 유튜브, 소셜 미디어 등에 활용할 수 있습니다.
👇 Projects 기능 소개
추가 기능
API 사용
개발자라면 ElevenLabs의 API를 사용하여 자신의 애플리케이션이나 웹사이트에 음성 합성 기능을 통합할 수 있습니다.
다국어 지원
다양한 언어로 텍스트를 음성으로 변환할 수 있어 글로벌 프로젝트에 유용합니다.
음성 녹음 스튜디오 (Voiceover Studio) 메뉴
사용자가 비디오에 여러 캐릭터의 목소리와 사운드 효과를 추가할 수 있게 합니다. 이 도구는 다음과 같은 기능을 제공합니다.
- 대화 작성 및 편집
- 사운드 효과 추가
- 인터랙티브 콘텐츠 제작
사용자 맞춤 음성 생성 (Voice cloning)
유료 기능이며, 사용자 맞춤형 음성을 생성하여 더욱 개인화된 서비스를 제공할 수 있습니다.
- 자신의 목소리나 원하는 특정 목소리를 약 30초 이상 녹음합니다.
- 음성 샘플은 MP3 형식으로, 192kbps 이상의 비트레이트를 사용하는 것이 좋습니다.
- 메인 메뉴의 “Create”에서 “Voices” 서브 메뉴로 들어가 “MY VOICES”탭(기본 선택되어 있음)을 선택합니다.
- “Add Voice” 버튼을 클릭하여 새로운 음성을 추가합니다.
- “Instant Voice Cloning” 또는 “Professional Voice Cloning” 옵션을 선택합니다.
- 업로드된 음성 샘플을 기반으로 AI가 음성을 분석합니다.
- 음성 파일을 업로드하고, 필요한 경우 음성의 특성을 설명하는 필드를 작성합니다.
- AI는 음성의 톤, 속도, 감정 표현 등을 학습하여 고유한 음성 프로필을 생성합니다.
음성 분리기 (Voice isolator) 메뉴
특정 음성을 배경 소음이나 다른 음성으로부터 분리하여 고립시키는 기술입니다. 아래 샘플 비디오를 시청하시면 놀라운 효과를 체감하실 수 있습니다.
👇 음성 분리기 (직접 평가해 보세요!)
Audio Native 메뉴
ElevenLabs에서 제공하는 임베디드 오디오 플레이어로, 블로그나 뉴스 사이트와 같은 웹 콘텐츠에 자동으로 인간 같은 내레이션을 추가하는 기능을 제공합니다. 이 도구는 사용자 맞춤형 설정을 통해 음성 선택, 플레이어의 외관, 발음 사전 등을 커스터마이징할 수 있습니다.
ElevenLabs의 Prime Voice AI는 텍스트를 자연스럽고 생동감 있는 음성으로 변환하는 Text-to-Speech(TTS) 플랫폼입니다. 다양한 음성 옵션과 세부 조정 기능을 통해 맞춤형 음성 콘텐츠 제작에 활용해 보시기 바랍니다.