블로그

뉴스 및 업데이트

키츠 대 우버덕: 최고의 AI 음성 생성기

Uberduck와 Kits AI를 비교: 두 도구를 탐구하고 창의적인 프로세스에 맞는 AI 오디오 플랫폼을 찾아보세요.

작성자

키츠 팀

게시됨

2024년 3월 18일

링크 복사

복사됨

AI 생성 목소리는 지난 한 해 동안 급속도로 성장했습니다. TikTok, Reels, YouTube Shorts를 스크롤할 때 들리는 많은 내레이션은 실제로 인공지능이 생성한 것입니다. 하지만 이는 시작에 불과합니다. 영화 제작자, 팟캐스터, 스트리머 등이 작업에 AI 보컬을 사용하고 있습니다.

AI 목소리 사용이 증가함에 따라 시장에 출시된 AI 보컬 플랫폼의 수도 늘어났습니다. Uberduck처럼 음성에 집중하는 플랫폼이 있는가 하면, Kits처럼 노래와 음악에 집중하는 플랫폼도 있습니다. 각 플랫폼은 다양한 유형의 크리에이터에게 맞춤화된 기능과 커스터마이징 옵션을 제공합니다.

Kits와 Uberduck을 비교하여 여러분의 프로젝트에 어떤 플랫폼이 더 적합한지 알아보겠습니다.

Kits AI: 노래 및 음악용 AI 목소리 생성기

AI 목소리 변환

AI 보컬 도구의 가장 일반적인 용도 중 하나는 변환으로, 녹음된 소리를 새로운 목소리로 합성하는 것입니다. Kits의 목소리 대 목소리 변환 도구는 싱어가 자신의 목소리를 완전히 다른 목소리로 변형할 수 있도록 해주는 최초의 도구입니다.

AI 보컬은 어떻게 만드나요?

AI 보컬 생성을 시작하려면 보이스 체인저를 선택하기만 하면 됩니다.

오디오 파일을 업로드하거나 Kits 웹 앱에 직접 녹음한 후 '변환(Convert)'을 누르세요. 여기서는 Soul Male (영어, Neo) 목소리를 사용하고 있습니다.

Conversion page on Kits AI with the Male Neo Soul model selected

몇 초만 지나면 노래에 완전히 새로운 보컬이 입혀집니다! 전문 보컬리스트의 스튜디오 녹음본이라고 해도 믿을 정도로 훌륭한 결과물이 나옵니다.

Kits AI는 변환을 미세 조정할 수 있는 고급 제어 기능도 제공합니다:

더 나은 결과를 위해 녹음에서 반주(MR), 리버브 및 딜레이, 그리고/또는 코러스 보컬을 제거합니다.
피치 시프트(Pitch Shift): 음고를 최대 24반음까지 높이거나 낮춥니다.
변환 강도(Conversion Strength): 생성물에 더 많은 억양과 조음을 추가하지만, 수치가 높으면 예상치 못한 결과가 발생할 수 있습니다.
볼륨 블렌드(Volume Blend): 입력 볼륨과 모델 간의 균형을 조절합니다. 값이 낮을수록 오리지널 다이내믹이 더 많이 살아납니다.
전처리 효과(Pre-Processing Effects): 생성 전에 노이즈, 럼블, 거친 소리를 제거하고 볼륨을 부드럽게 조정하거나 EQ를 적용합니다.
후처리 효과(Post-Processing Effects): 결과물에 컴프레서, 코러스, 리버브 및/또는 딜레이를 적용합니다.

Kits AI 목소리 클로닝

Kits의 가장 미래지향적인 기능은 목소리 학습(Voice Training)입니다 (이 기능은 다른 많은 보컬 도구에는 없습니다). 오디오 파일을 업로드하기만 하면 Kits가 AI 모델을 학습시켜 싱어의 목소리를 완벽하게 커스텀 복제한 목소리를 만들어 냅니다. 이 새로운 목소리는 모든 변환에서 기본 제공 목소리나 블렌딩된 목소리 대신 사용할 수 있습니다.

Open page of the Kits AI voice cloning page

Kits는 최상의 결과를 위해 약 10분의 업로드를 권장하지만 최대 1시간 분량까지 허용합니다. (참고로 Uberduck은 업로드 제한 시간이 1분입니다.) 그런 다음 이름과 사진을 추가하고 새로운 목소리를 학습시키세요! 이제 오디오 클립, 내레이션 콘텐츠 등에 나만의 목소리를 변환이나 텍스트 음성 변환(TTS)용으로 사용할 수 있습니다.

Kits AI 저작권 프리 목소리 라이브러리

Kits는 목소리 라이브러리에서 50개 이상의 목소리를 제공합니다. 각 목소리는 Afrobeats Male (English, Melodic) 또는 Pop Female (English, Bedroom)과 같이 성별과 장르에 따라 이름이 지정되어 있습니다. 목소리 대 목소리 변환 라이브러리를 음역대, 성별, 장르별로 분류하여 볼 수 있습니다. 다른 언어와 월드 뮤직 스타일에 특화된 특수 목소리도 있습니다.

또한 Kits는 기타, 베이스, 색소폰, 첼로를 포함한 몇 가지 기본 악기도 제공합니다. 멜로디를 노래하는 자신을 녹음한 다음, 이를 악기 목소리로 변환하여 빠르게 반주를 만들어 보세요.

Selection page of the Kits AI voice library

사운드를 한층 더 커스터마이징하려면 보이스 블렌더(Voice Blender)를 통해 두 가지 다른 목소리를 조합할 수 있습니다. 블렌딩 비율(Blend Ratio) 슬라이더를 조절하여 균형을 맞추세요.

Kits voice blender page with two voices selected

Kits AI의 텍스트 음성 변환(Text-To-Speech)

Kits는 텍스트를 문장으로 변환해 주는 간단한 텍스트 음성 변환(TTS) 기능도 제공합니다. 텍스트를 입력하고 음역대를 선택한 뒤 음성을 생성하세요. 50개 이상의 기본 목소리는 물론, 블렌딩 및 학습된 목소리도 사용할 수 있습니다. Kits는 14 개 언어로 텍스트 음성 변환을 지원합니다. Uberduck과 달리 언어별 전용 목소리를 사용할 필요가 없으며, 라이브러리 전체의 목소리를 어떤 언어에도 적용할 수 있습니다.

Voice conversion page with the male synth pop model selected

Uberduck AI 더빙 및 랩

Uberduck의 텍스트 음성 변환(Text-To-Speech)

Uberduck 역시 간단한 텍스트 음성 변환 기능을 제공합니다. 목소리를 선택하고 말하고자 하는 내용을 붙여넣은 뒤 생성하면 됩니다. 72개 언어로 227개의 목소리를 제공합니다. 다만, 언어를 정렬하는 방식이 제한적이고 각 성우의 목소리를 미리 듣지 않고서는 차이점을 파악하기 어렵습니다. 추가로 커스터마이징할 수 있는 TTS 옵션도 제공되지 않습니다.

Uberduck AI 목소리 변환

Kits와 마찬가지로 Uberduck도 목소리 변환 도구를 제공합니다.

Uberduck의 텍스트 음성 변환 목소리 라이브러리는 꽤 방대하지만, 변환에 사용할 수 있는 목소리는 15개에 불과합니다. 이 중 대부분은 남성 목소리입니다.

변환을 위해 다른 목소리 녹음본을 업로드할 수는 있지만, 이 기능은 Kits의 목소리 학습(Voice Training)에 비해 훨씬 제한적입니다. 또한 업로드하는 오디오 클립은 1분 미만이어야 합니다. Uberduck에서 목소리 변환 시 제공하는 유일한 커스터마이징 옵션은 피치 시프트입니다.

Uberduck 랩 송 생성기

Uberduck은 한 가지 음악적 기능을 제공하는데, 바로 랩 생성기(Rap Generator)입니다. 주제를 입력하면 AI가 가사 네 줄을 작성하고, 생성된 목소리가 이를 기반으로 랩을 합니다. 이는 콘텐츠 크리에이터를 겨냥한 Kits의 도구에 비해 기능이 다소 제한적이고 덜 전문적이지만, 재미 삼아 해보기엔 좋습니다.

시작하려면 제공되는 5개의 비트 중 하나를 선택하세요. 반주 없이 커스텀 BPM의 아카펠라를 선택할 수도 있습니다.

그 다음, 가사로 담고 싶은 내용에 대해 짧은 설명을 적으세요. 무료 요금제에서는 네 줄로 제한되지만, AI가 이 주제를 바탕으로 라임(Rhyme)이 맞는 가사를 생성해 줍니다.

Creating your own lyrics page for the rap generator

(직접 쓴 가사를 붙여넣을 수도 있습니다.)

Pasted lyrics added to the AI rap generator

이 기능에서는 영어와 스페인어 각각 남녀 1명씩, 총 4개의 사전에 제작된 목소리만 선택할 수 있습니다. 복제할 목소리 파일을 업로드할 수도 있습니다. 설정이 완료되면 랩이 생성됩니다. 반주가 포함된 오디오 또는 반주가 없는 오디오를 다운로드할 수 있으며, 간단한 가사 비디오도 함께 다운로드할 수 있습니다.

무료 요금제에서는 AI 랩 기록 기능을 사용할 수 없으므로, 결제하지 않으면 이전 세대 작업물을 보거나 편집할 수 없습니다.

Kits AI vs. Uberduck: API

두 플랫폼이 모두 제공하는 독특한 기능 중 하나는 API 액세스입니다. 이를 통해 고급 사용자와 프로그래머는 다른 애플리케이션에 AI 목소리 생성 기능을 내장할 수 있습니다. 두 API 플랜 모두 오픈소스는 아닙니다.

Kits API는 무료로 사용할 수 있으나, 사용량이 늘어날 경우 상위 요금제를 구매해야 할 수 있습니다.

Uberduck의 경우, API 액세스는 유료 요금제 이용자만 사용할 수 있습니다.

Kits AI vs. Uberduck: 가격 가격 비교

Kits와 Uberduck 모두 기본 기능은 무료로 제공하지만, 대량 사용자는 구독이 필요합니다.

Kits는 가장 저렴한 유료 등급에 대해 월 $9.99를 청구합니다. 여기에는 커스텀 목소리 슬롯 2개와 더 고음질의 .wav 다운로드를 제공하는 목소리 학습 및 블렌딩 기능이 포함됩니다. 가장 중요한 점은 월 30분의 다운로드 시간이 포함되어 있다는 것인데, 이는 Uberduck의 유사 등급 요금제보다 5배나 많은 수치입니다. 더 높은 등급에는 무제한 다운로드 시간과 더 많은 목소리 슬롯이 제공됩니다.

Uberduck은 $9.99 요금의 단 하나의 유료 등급만 보유하고 있습니다. 여기에는 비공개 목소리, AI 랩 기록 사용 권한과 같은 프리미엄 기능과 함께 API 액세스 및 더 낮은 지연 시간이 포함됩니다. 단, 월 3600회의 렌더링 크레딧만 제공되며, 이는 오디오 약 6분 분량에 해당합니다.

나에게 가장 적합한 AI 도구 찾기

Kits는 음악용으로, Uberduck은 음성용으로 제작되었지만, 두 AI 보컬 도구 사이에는 텍스트 음성 변환, 목소리 변환, 랩 보컬과 같은 몇 가지 중복되는 기능이 있습니다. 대부분의 경우 Kits는 뮤지션과 프로듀서에게 적합한 더 풍부한 기능 세트, 더 크고 고품질의 목소리 라이브러리, 그리고 뛰어난 커스터마이징을 제공합니다. Uberduck은 랩 생성기(Rap Generator)를 통해 생성형 음악 기능을 제공하는 유일한 도구이지만, 이는 전문적인 음악 도구라기보다는 오디오 콘텐츠 제작이나 애니메이션을 위한 오락성 기능에 가깝습니다.

요약하자면, 콘텐츠에 AI 보컬을 추가하는 데는 Kits가 더 선호되는 편이며, 특히 싱어, 뮤지션, 프로듀서에게 유용합니다.

제목

시작하세요, 무료로.

스튜디오 품질의 AI 오디오 도구로 음성 제작 워크플로를 간소화하세요.

시작하기