03/19/2024

Kits and Descript: 오디오 크리에이터를 위한 AI 도구

AI 오디오 플랫폼인 Kits AI와 Descript에 대해 더 알아보고 오디오 제작 워크플로우에 가장 적합한 도구를 찾아보세요.

설명서 및 키트 비교 그래픽
설명서 및 키트 비교 그래픽
설명서 및 키트 비교 그래픽

목차

제목

제목

무료로 시작하세요. 신용카드가 필요하지 않습니다.

무료 요금제로 Kits가 보컬 및 오디오 워크플로우를 간소화하는 데 어떻게 도움을 줄 수 있는지 확인하세요. 다음 단계를 준비할 때, 유료 요금제는 매월 $9.99부터 시작합니다.

무료로 시작하세요. 신용카드가 필요하지 않습니다.

무료 요금제로 Kits가 보컬 및 오디오 워크플로우를 간소화하는 데 어떻게 도움을 줄 수 있는지 확인하세요. 다음 단계를 준비할 때, 유료 요금제는 매월 $9.99부터 시작합니다.

무료로 시작하세요. 신용카드가 필요하지 않습니다.

무료 요금제로 Kits가 보컬 및 오디오 워크플로우를 간소화하는 데 어떻게 도움을 줄 수 있는지 확인하세요. 다음 단계를 준비할 때, 유료 요금제는 매월 $9.99부터 시작합니다.

인공 지능 혁명의 지난 몇 년 동안, 많은 관심이 시각 예술가를 위해 AI가 무엇을 할 수 있는가에 집중되어 왔습니다. 수십억 명의 사람들이 Dall-E, Midjourney, Photoshop의 Generative Fill 도구와 같은 도구를 사용하여 AI로 이미지를 작성해 보았습니다.

하지만 오디오 프로젝트에 대한 유사한 도구가 있는 것을 알고 계셨습니까? 음악가, 프로듀서, 팟 캐스터, 스트리머, 비디오 편집자 등은 AI를 사용하여 작업의 모든 단계를 향상시킬 수 있습니다.

이 기사에서는 가장 인기 있는 두 개의 AI 오디오 도구, Kits(음악을 위한 AI 음성 플랫폼)와 Descript(AI 기반 오디오 편집기 팟캐스트)를 살펴보겠습니다.

보컬용 Kits AI 도구

Kits는 고품질 오디오를 생성하기 위해 AI를 사용하는 강력한 음악 제작 도구입니다. Kits를 사용하면 한 목소리를 다른 목소리로 변환하거나 가수의 목소리를 복제할 수 있습니다. 창의적인 기회는 무한합니다. 

목소리 변환

Kits는 완전히 다른 목소리로 가수의 목소리를 변경하는 데 중점을 둔 도구로 구축되었습니다. 다른 AI 도구들은 이것을 음성에 대해 수행하지만, Kits는 가수용으로 처음으로 제공하는 도구입니다. 그 결과물은 전문적인 녹음실에서 녹음된 전문적인 가수들로 통과할 정도로 좋아서, 프로듀서들에게 매우 다재다능한 도구입니다.

파일을 업로드하거나 YouTube 비디오 링크를 직접 웹 앱에서 녹음하면 몇 초 안에 곡이 새로운 가수의 곡이 될 것입니다!

고급 제어를 사용하여 변환을 세밀하게 조정할 수 있습니다:

  • 노래의 도구 음악, 반향 및 딜레이, 백업 보컬을 제거하여 녹음 결과물을 더 좋게 만들 수 있습니다.

  • 음높이 변환: 24 반음정까지 음 높이를 높이거나 낮출 수 있습니다.

  • 변환 강도: 생성에 강조와 명료함을 추가하지만, 높은 수준에서 예상치 못한 결과를 초래할 수 있습니다. 

  • 볼륨 블렌딩: 입력 볼륨과 모델 사이의 균형을 조절합니다. 낮은 값은 원본 역학을 더 많이 공개합니다.

  • 사전 처리 효과: 생성 전에 소음, 낮은 주파수 컷, 거침, 음량을 부드럽게 조절하고/또는 오토튠을 자동으로 걸어낼 수 있습니다.

  • 사후 처리 효과: 결과에 컴프레서, 후렴, 반향 및/또는 딜레이를 적용합니다. 

보컬 교육 안내서

Kits의 가장 미래 지향적인 기능은 보컬 교육입니다. 오디오 파일을 업로드하거나 YouTube 비디오 링크를 붙여넣기만 하면, Kits는 가수의 목소리를 완벽하게 복제하는 AI 모델을 교육합니다. 이 새로운 목소리는 향후 모든 변환(아래 참조)을 위한 재고 또는 혼합 목소리 대신 사용될 수 있습니다. 

Kits는 가수를 위한 최고의 보컬 교육 도구를 제공합니다. 다른 AI 도구들은 Descript를 비롯하여 음성에 대해 이를 제공하지만, Descript는 이 기능을 주로 실수를 수정하거나 간단한 텍스트 음성 생성에 사용합니다. Kits는 교육된 목소리 모델을 변환에 쉽게 사용할 수 있도록 하기 때문에 큰 장점을 가지고 있습니다.

Kits voice cloning page with files uploaded

Voice를 교육하려면 어떤 녹음 형식이라도 Kits에서 허용됩니다. 최상의 결과를 위해 10분을 권장하지만 최대 1시간까지 허용됩니다. (비교를 위해 Descript는 음성 템플릿으로 사용할 특정 스크립트를 읽어야 합니다.) 그 후, 이름과 사진을 추가한 다음 새로운 목소리를 교육하십시오! 향후 사용을 위해 보존될 것입니다.

Voice 라이브러리

Voice 라이브러리에서 Kits는 50개 이상의 아티스트 목소리를 제공합니다. 각각이 성별 및 장르(예: 남성 아프로 비트 또는 여성 침실 팝)로 명명되어 있습니다. 라이브러리는 음역대, 성별 및 장르로 정렬할 수 있으며, 다른 언어 및 세계 음악 스타일을 위한 목소리도 있습니다. 모두 완전히 무료로, 원하는 대로 사용할 수 있습니다. 

Open tab of the voice library page with no model selected

소리를 추가로 사용자 정의하기 위해 Voice Blender를 사용할 수 있습니다. 블렌드 비율 슬라이더는 새로운 모델을 교육하는 데 각 목소리의 얼마나 많은 부분을 사용할지 제어합니다.

Kits AI voice blender tool with 2 models selected

또한 Kits는 기악을 제공하여 기타, 베이스, 색소폰, 첼로를 포함합니다. 이를 통해 쉽게 자신이 부르거나 험하거나 소리를 내게 노래할 수 있어 쉽게 연주음성으로 전환할 수 있습니다.

텍스트 음성 변환

Kits는 내레이션, 보이스 오버, 기타 말하기 콘텐츠에 대한 14개 언어의 텍스트 음성 변환 기능도 제공합니다. Kits의 Voice 라이브러리는 노래를 위해 조정되었기 때문에 다른 AI보다 자연스러운 결과가 나타납니다. 대본을 입력한 후 음역대를 선택하고 음성을 생성합니다. 전체 Voice 라이브러리, 추가로 교육된 목소리, Trained 목소리를 모두 사용할 수 있습니다. 

Voice conversion page with the male synth pop model selected in the text to speech tab

AI 오디오 강화 도구

보컬 제거 

Kits의 다른 AI 드라이브 음악 도구 중 하나는 보컬 제거입니다. 노래 또는 YouTube 링크를 업로드하고 보컬 제거로 가사를 독립적으로 분리합니다. 고급 설정을 통해 보컬 백업을 제거하고 되롱, 에코 및 소음 감소를 전환할 수 있습니다. AI가 내장되어 있어서, Kits의 Vocal Remover는 유사한 소리가 겹쳐 있을 때도 정확하게 보컬을 추출하는 데 일반적인 소프트웨어보다 더 잘 수행합니다.

Kits AI vocal remover page

AI 마스터링 

마스터링은 음악 제작 과정의 마지막 단계입니다. 압축률, 제한, 등을 적용하여 최종 소리를 완벽하게 만들고 각각의 트랙이 서로 잘 작동하도록 하는 것입니다. 이것은 과거에 가장 어렵고 비싼 제작 요소 중 하나였지만, Kits AI는 신규 프로듀서들에게도 초 단위 내에 트랙을 마스터링할 수 있도록 해 줍니다.

 Kits는 여섯 가지 사전 제작된 마스터링 프리셋을 제공합니다:

  • 명랑하고 선명한

  • 베이스 집중

  • 펀치 & 공기

  • 질좋고 가늘

  • 테이프 접착

  • 아날로그 따뜻함

사용자 친화적인 과정 때문에 몇 초 안에 사용하여 최고의 결과를 확인할 수 있습니다. 참조 트랙을 업로드하여 Kits가 모델로 사용할 소리를 생성할 수 있습니다.

Kits AI Mastering page with a track input

Kits는 시장에서 가장 강력한 AI 가수 도구뿐만 아니라 현대 음악 프로듀서에게 필수적인 도구입니다. AI를 사용하여 보컬 제작의 각 단계를 향상시켜 더 적은 시간, 더 적은 돈, 그리고 더 많은 창의성으로 더 나은 보컬을 생산할 수 있도록 합니다.

Descript: AI 팟캐스트 편집기

Descript 는 풍부한 AI 오디오 기능 스위트로 둘러쌓인 텍스트 기반 팟캐스트 편집기로, 현재 사용 가능한 가장 강력한 도구 중 하나입니다. (Descript는 비디오 콘텐츠 도구도 제공하지만 여기에 대해서는 다루지 않겠습니다.) 

기다려보세요, 텍스트 기반 오디오 편집기? 네, Descript는 오디오를 자동으로 텍스트로 변환하여 편집할 수 있도록 하며, 변경 사항은 오디오에 반영됩니다. 긴 기록은 몇 초만에 전사되어 안전하게 클라우드에 저장되며 각 스피커는 자동으로 레이블이 붙습니다. 또한, 22개 언어로 작동합니다. 고유한 사용자 경험으로부터 독특한 AI 오디오 도구가 있는데 여기에는 비디오 편집용 다양한 기능이 있습니다:

AI 음성

Kits와 마찬가지로 Descript에는 텍스트 음성 변환에 사용할 수 있는 기본 음성이 포함되어 있습니다. 21개가 있으며, 음성에 대한 태그로 설명됩니다: 남성 또는 여성, 더 어린이, 성인 또는 노인, 그리고 강세 및 스타일 등이 있습니다. 

Descript AI voice selection page

또한 키츠의 Voice Training과 유사한 음성 복제 기능이 있습니다. 흥미로운 점은 Descript는 본인의 목소리만 복제할 수 있다는 것입니다. 이를 확인하기 위해 특별한 스크립트를 읽어서 본인을 복제할 필요가 있습니다. 본인의 목소리를 텍스트 음성 및 향후 본인의 발언을 위한 오버더브로 저장할 수 있습니다. 

Script generated by Descript's voice cloning feature

재생성 위해 녹음한 재생성

재생성은 선택한 녹음 전사에서 미니 음성 복제를 생성(위에 기술된 장기적인 프로세스 없이)하고, 녹음 전사의 선택된 텍스트 조각을 다시 생성합니다. 이를 통해 AI 없이는 불가능한 오디오 편집이 가능해집니다. 이 기능이 Descript의 가장 강력한 기능일 수도 있습니다. 

예를 들어, 집에서 녹음 중인데 초인종이 울린다면 어떨까요? 보통 이 순간을 자르는 것은 시간이 오래 걸리고, 듣는 사람들이 눈에 띄지 않게 깨끗하게 하기 어려울지도 모릅니다. 그러나 Descript에서는 전사에서 해당 순간을 찾아 하이라이트로 표시하고, 대체로 바꾸기 → 재생성을 클릭하면 AI가 순환에 넣을 수 있다.

그리고 만약 당신이 동료에게 문을 열라고 부르면 어떨까요? 전사에서 잡다한 단어를 쉽게 지울 수 있지만, 듣는 사람들이 들을 수 있는 뚜렷한 연결을 남겨둘 것입니다. 이 불일치한 부분을 재생성 주

당신을 위한 추천 블로그 글