Treinamento e Personalização da Voz de Canto de IA

Saiba mais sobre como personalizar e ajustar suas vozes para criar vocais únicos e marcantes com um guia do produtor e engenheiro de som por trás da nossa biblioteca de vozes.

AI Singing Voice Training and Customization

Escrito por

A Equipe do Kits

Publicado em

6 de novembro de 2024

Copiar link

Copiado

Uma das minhas principais funções na Kits é garantir que os nossos modelos livres de royalties sejam treinados com conjuntos de dados sólidos e inspiradores que não apenas soem bem, mas que sejam inspiradores para o trabalho de criação. Algumas partes desse processo são puramente técnicas, enquanto outras envolvem escolhas criativas que moldam o caráter do modelo. Hoje, vou detalhar como otimizar seus próprios dados de treinamento e tomar algumas decisões criativas intencionais para adicionar uma personalidade única aos seus modelos de voz.

Nas últimas semanas, meus artigos abordaram meu processo de criação de algumas das nossas vozes mais baseadas em personagens e as técnicas exclusivas que utilizei. Seja cantando através de um amplificador de guitarra para o meu modelo Rock Male (English, Overdriven) ou usando um microfone de fita para capturar um dos monitores do meu estúdio para o Jazz Female (English, Vintage, Soprano), as formas de criar um conjunto de dados de destaque são verdadeiramente infinitas.

A Base

Uma base sólida é a parte mais crucial na criação de qualquer modelo de voz. Independentemente de quaisquer atributos especiais que eu queira adicionar, sempre começo com uma captura vocal limpa. Isso significa remover ruídos de fundo — ar-condicionado, zumbido de geladeira, o que quer que esteja à espreita — que podem degradar o som do seu modelo e criar problemas no futuro. Digamos que você gravou um ótimo conjunto de dados de 30 minutos, mas, ao reproduzir, ouve um zumbido baixo que mal era perceptível na sala. Já passei por isso! Eu me perdi em um take, apenas para mais tarde perceber um amplificador zumbindo como louco ou o aquecedor funcionando ao fundo. Confira nosso guia sobre como gravar vocais de alta qualidade você mesmo se estiver começando do zero.

Uma ferramenta como o iZotope RX facilita a correção de zumbidos e ruídos consistentes. Basta abrir o módulo Spectral De-noise do RX, selecionar uma seção do seu áudio que contenha apenas o ruído de fundo, clicar em "Learn" e reproduzir o áudio. O RX analisará e ajustará automaticamente a redução de ruído. Você pode querer ajustá-lo ainda mais alterando os faders de Threshold e Reduction, mas o RX simplifica a remoção desses artefatos irritantes.

O Nível de Ganho Importa

Definir um nível de ganho adequado também é fundamental. Ao criar modelos, busco um nível constante de -12dB, com picos não superiores a -6dB. Isso permite que o áudio permaneça dinâmico, ao mesmo tempo em que oferece ao aprendizado de máquina (machine learning) o volume ideal para treinar com eficácia. Costumo ver envios que estão com o volume excessivamente baixo ou saturando no vermelho. A saturação digital não oferece aquela distorção agradável que você gostaria de ter em um vocal de rock — ela é apenas áspera, e os algoritmos de aprendizado de máquina também não são fãs.

Criando Caráter

Embora um conjunto de dados limpo e sólido seja geralmente a melhor base, permitindo que você manipule as coisas depois de importadas para sua DAW, às vezes é divertido registrar um pouco de caráter diretamente em seus dados de treinamento. Qualquer som que você enviar com um efeito aplicado carregará automaticamente essa característica em seu modelo — sem a necessidade de mágica na DAW mais tarde. Isso pode ser perfeito para criadores de conteúdo que desejam ter acesso a uma vibração vocal específica, como um efeito de rádio ou walkie-talkie que enfatiza as frequências médias-altas e adiciona um pouco de aspereza. Aplique isso a todo o seu conjunto de dados e você terá um modelo de referência que soa instantaneamente como se estivesse vindo de um rádio.

Ou talvez seja hora de tirar a poeira daquele velho pedal de distorção no canto! Passar o seu conjunto de dados por ele pode adicionar um nível totalmente novo de caráter vocal.

Muitas vezes gosto de passar vocais por um amplificador de guitarra — aumentando o overdrive e ajustando-o a gosto. Por que não arrebentar com a sua parede de som Marshall e ver quanto tempo leva para os seus vizinhos chamarem a polícia!

No entanto, talvez você prefira evitar reclamações de barulho e experimentar um desses pequenos Marshalls movidos a bateria. (Nota mental: esses microamplificadores são tesouros de estúdio — não os subestime!)

Outro truque? Um pedal de wah. Manter um wah pressionado em uma posição fixa em certos pontos pode produzir uma ampla gama de efeitos de filtragem. Não há necessidade de inventar muito aqui; um Dunlop CryBaby padrão funciona perfeitamente.

E para uma vibração lo-fi autêntica sem precisar de um gravador de rolo de fita, experimente um gravador de fita cassete. Este aqui possui um microfone embutido e uma porta USB 2.0. Usar o microfone embutido para gravar do seu alto-falante para a fita cassete pode produzir um som quente e lindamente degradado. Talvez eu precise garantir um desses para mim — perfeito para experimentar!

Conclusão

No fim das contas, fazer música deve ser divertido e, para mim, isso significa desafiar limites e encontrar novos sons. Não se preocupe se a sua primeira tentativa de envio não sair exatamente como você queria — cada take faz parte do processo, guiando o seu próximo passo. A Kits.AI está aqui para ajudar você a criar algo inspirador e único. Então vá em frente — o céu é o limite!

Sumário

Título

Comece, grátis.

Otimize seu fluxo de produção vocal com ferramentas de áudio em qualidade de estúdio baseadas em IA.

Começar