콘텐츠 툴박스

6. AI 음성 생성기 <Eleven Labs> TTS & 목소리 복제까지

민아몬드 2024. 10. 30. 14:40
반응형

안녕하세요 아몬드입니다 XD

여러분은 목소리를 녹음할 일이 많이 있으신가요?

저는 3년 전에 처음 온라인 강의를 준비할 때, 집에서 녹음한 소리에 자꾸 노이즈가 껴서

몇번씩 재녹음하느라 고생했던 기억이 있는데요😅

요즘은 이런 녹음을 AI로 간단하게 대체할 수 있더라고요?!

 

바로, TTS(텍스트 음성 변환) 덕분이죠!

 

TTS는 사용자가 입력한 텍스트를 자연스러운 음성으로 변환해주는 기술로,

고급 AI 알고리즘을 사용하여 인간과 구분하기 어려울 정도로 자연스러운 음성을 생성해준답니다.

 

요즘 이 TTS 기술을 이용해서 음성을 만들어주는 툴들이 많은데,

오늘은 그중에서도 선두주자격이라고 할 수 있는 <Eleven Labs> 를 소개해드리려고 해요!

 

 

Eleven Labs 는 최첨단 AI 기술을 활용한 음성 합성 및 클로닝 플랫폼이에요.

목소리 생성을 위한 다양한 기능을 가지고 있는데요, 아래에서 Eleven Labs의 기능들을 하나씩 살펴볼게요!

 


 

(1) Text to Speech

가장 기본이자 중요한 기능이죠? 텍스트를 입력하면 이걸 읽어주는 기능이랍니다. 

 

 

특히 영상을 만들 때 유용할텐데요, 대본을 직접 읽으면서 녹음할 필요없이 AI만으로 음성을 뚝딱 만들어낼 수 있어요.

제가 강의를 찍을 때 이런 기능이 있었다면 참 좋았을텐데요🙃

 


 

 

(2) 방대한 음성 라이브러리

텍스트를 읽어주는 것도 좋지만, 어떤 목소리로 읽어줄 지 정하는 것도 중요한 일일거에요.

일레븐랩스에는 약 120개의 사전제작된 목소리가 있어서

나이대, 성별, 성격 등 원하는 타입의 목소리를 골라 사용할 수 있답니다.

 

 

 


 

(3) 자유로운 커스터마이징

120개의 목소리를 골라서 사용하는 것을 넘어서, 이걸 조금 더 세부적으로 조정하는 것도 가능해요.

 

 

Settings 메뉴에서 Stability(안정성), Similarity(유사성), Style Exaggeration(스타일 과장) 등의 팩터를 조정할 수 있습니다.

이렇게 함으로써 많이 쓰이는 기본 목소리보다 좀더 개인화된 목소리를 사용할 수 있는거지요 :-)

 


 

(4) 29개 이상 언어 지원

게다가 일레븐랩스에서는 전세계 29개국 이상의 언어를 지원합니다. 이런게 바로 글로벌 툴의 장점이겠죠?

 

 

Eleven Multilingual 모델에서는 29개국 언어를,

Eleven Turbo 모델에서는 32개국 언어를 지원하는데요-

따로 언어를 선택할 필요없이, 원하는 언어로 텍스트를 입력하기만 하면 되더라고요! (편리편리)

 


 

 

(5) 음성 복제(클로닝)

말도 많고 탈도 많은 그 기능! 바로 음성 복제 기능이 일레븐랩스에 있습니다.

 

 

만들어진 AI 목소리를 고르는 대신, 내 목소리 파일을 올려서 사용하는 기능이죠-

가끔 뉴스에서 이 기술을 악용하는 케이스들이 종종 나오는데🥲

 

본래의 목적대로 '내 목소리' 를 이용한다면

매번 녹음할 필요없이 음성을 만들 수 있다는 엄청난 장점이 있답니다.

유튜브나 인스타그램을 하다보면 이걸 활용하는 분들이 벌써 꽤 보이더라고요!

 


 

(6) 외국어 자동 더빙

마지막으로 소개해드릴 기능은 영상의 음성을 원하는 언어로 자동더빙해주는 기능입니다.

 

 

예를 들면, 한국어로 말하는 영상을 올리고 나서 이걸 영어, 스페인어, 일본어 등의 언어로 더빙할 수 있는 기능이에요.

글로벌하게 놀고싶은(?) 기업이나 크리에이터분들에게 정말 유용할 것 같아요.

 


 

Eleven Labs 가격정책

Eleven Labs 는 무료 플랜을 포함해서 총 6가지의 구독 플랜을 가지고 있어요.

 

 

 

(1) 무료 플랜

  • 월 10,000자 (약 10분) 사용 가능
  • 기본적인 텍스트 음성 변환 기능 제공
  • 상업적 사용 불가
  • 3개의 사용자 정의 음성 생성 가능

(2) Starter 플랜 ($5/월)

  • 월 30,000자 (약 30분) 사용 가능
  • 상업적 사용 라이선스 포함
  • 최대 10개의 사용자 정의 음성 생성 가능
  • 인스턴트 음성 클로닝 기능

(3) Creator 플랜 ($22/월)

  • 월 100,000자 (약 100분) 사용 가능
  • 프로페셔널 음성 클로닝 기능
  • 더 높은 품질의 오디오 출력 (192 kbps)
  • 다중 화자 프로젝트 생성 가능

(4) Pro 플랜 ($99/월)

  • 월 500,000자 (약 500분) 사용 가능
  • 44.1 kHz PCM 오디오 출력 (API 통해)
  • 사용량 분석 대시보드 제공

 

(5) Scale 플랜 ($330/월)

  • 월 2,000,000자 (약 2,000분) 사용 가능
  • 우선 지원 서비스

(6) Business 플랜 ($1320/월)

  • 월 11,000,000자 (약 11,000분) 사용 가능
  • 3개의 프로페셔널 음성 클론 제공
  • 터보 모델 사용 가능 (연간 결제 시 $50/백만 자)

 

무료 플랜에서도 꽤나 많은 크레딧이 주어지니,

필요하신 분들은 일단 사용해보시고 구독을 결정해보시면 좋을 것 같습니다.

 

👉Eleven Labs 바로가기

 


👩‍💻함께 읽으면 좋은 포스팅

 

[콘텐츠 툴박스] - 5. 퀄리티 좋은 무료 AI 이미지 생성기 추천 기능 3가지

 

5. 퀄리티 좋은 무료 AI 이미지 생성기 <Leonardo AI> 추천 기능 3가지

안녕하세요 아몬드입니다 *_*요즘은 AI 이미지 생성기 춘추전국시대 라고 해도 과언이 아닐정도로다양한 이미지 생성기들이 등장하고 있는데요,오늘 소개해드릴 툴은 무료이면서도 고퀄 이미지

minamond.tistory.com

 

[콘텐츠 툴박스] - 2. AI로 PPT 만드는 가장 좋은 방법 추천 Gamma + Canva

 

2. AI로 PPT 만드는 가장 좋은 방법 추천 Gamma + Canva

안녕하세요! 아몬드입니다 XD 요즘은 거의 모든 걸 AI로 해낼 수 있죠? ^^;특히 업무를 할 때 AI를 활용하면 시간과 노력을 크게 줄일 수 있겠더라고요!그중에서 오늘 소개해드릴 내용은 AI로 PPT를

minamond.tistory.com

 

반응형