Kits vs. Uberduck: Os Melhores Geradores de Voz de IA
Escrito por
A Equipe Kits
Publicado em
18 de março de 2024
Vozes geradas por IA explodiram no ano passado. Quando você está rolando no TikTok, Reels ou YouTube Shorts, muitas das narrações que você ouve são, na verdade, geradas por inteligência artificial. Mas isso é apenas o começo: cineastas, podcasters, streamers e mais estão usando vocais de IA em seus trabalhos.
Conforme o uso de vozes de IA cresceu, também cresceu o número de plataformas de voz de IA no mercado. Algumas, como Uberduck, focam em fala, enquanto outras, como Kits, focam em canto e música. Cada uma oferece recursos e opções de personalização sob medida para diferentes tipos de criadores.
Vamos comparar Kits e Uberduck para ver qual faz mais sentido para seus projetos.
Kits AI: Geradores de Voz AI Para Canto e Música
Conversão de Voz AI
Um dos usos mais comuns para ferramentas vocais de IA é a conversão, em que uma gravação é sintetizada em uma nova voz. A ferramenta de conversão de voz para voz da Kits é a primeira a fazer isso para cantores transformarem sua própria voz em algo completamente diferente.
Como faço vocais de IA?
Para começar a criar vocais de IA, basta selecionar um alterador de voz

Faça upload de um arquivo de áudio ou grave algo diretamente no aplicativo web da Kits e pressione Converter. Aqui, estamos usando a voz Male Neo Soul.

Em alguns segundos, sua música terá um novo cantor! Os resultados soam bem o suficiente para passar por uma gravação de estúdio de um vocalista profissional.

A Kits AI também oferece controles avançados para ajustar finamente a conversão:
Remova instrumentais, reverberação e atraso e/ou vocais de apoio da sua gravação para melhores resultados.
Mudança de Tom: Aumente ou diminua o tom em até 24 semitons.
Força de Conversão: Adiciona mais sotaque e articulação à geração, mas pode causar resultados inesperados em níveis altos.
Mistura de Volume: Controle o equilíbrio entre o volume de entrada e o modelo. Valores mais baixos revelam mais da dinâmica original.
Efeitos de Pré-Processamento: Corte ruído, estrondo e aspereza, suavize o volume e/ou faça EQ antes da geração.
Efeitos de Pós-Processamento: Aplique compressor, coral, reverberação e/ou atraso ao resultado.
Clonagem de Voz Kits AI
O recurso mais futurista da Kits é o Treinamento de Voz (que falta em muitas outras ferramentas vocais). Basta fazer upload de um arquivo de áudio, e a Kits treina um modelo de IA para criar uma cópia de voz personalizada perfeita da voz do cantor. Esta nova voz pode ser usada em vez de uma voz de estoque ou Misturada para qualquer conversão.

A Kits recomenda uploads de cerca de 10 minutos para melhores resultados, mas aceita até uma hora. (Para comparação, a Uberduck limita uploads a um minuto.) A partir daí, basta adicionar um nome e uma foto, depois treinar sua nova voz! Agora você pode usar sua própria voz para qualquer conversão ou texto para fala para seus clipes de áudio, conteúdo narrativo e mais.
Biblioteca de Vozes Isentas de Direitos Autorais da Kits AI
A Kits oferece mais de 50 vozes em sua Biblioteca de Vozes. Cada uma é nomeada pelo seu gênero e gênero musical, como Male Afro Beat ou Female Bedroom Pop. Você pode classificar a biblioteca de conversão de voz para voz por alcance de tom, gênero e estilo musical. Há até vozes específicas para outros idiomas e estilos musicais mundiais.
Além disso, a Kits oferece alguns instrumentos de estoque, incluindo guitarra, baixo, saxofone e violoncelo. Basta gravar-se cantando uma melodia e depois convertê-la em uma voz instrumental para criar rapidamente instrumentais.

Para personalizar ainda mais seu som, você pode combinar duas vozes diferentes com o Misturador de Voz. Ajuste o controle deslizante de Proporção de Mistura para ajustar o equilíbrio.

Texto para Fala na Kits AI
A Kits também oferece uma função simples de texto para fala para converter texto em palavras faladas. Insira seu texto escrito, selecione uma faixa de tom e gere a fala. Todas as mais de 50 vozes de estoque podem ser usadas, assim como vozes Misturadas e Treinadas. Kits suporta texto para fala em 14 idiomas. Ao contrário do Uberduck, você não precisa usar uma voz específica para o idioma; toda a Biblioteca funciona com qualquer idioma.

Uberduck AI Dublagem e Rap
Texto para Fala no Uberduck
Uberduck também oferece uma função simples de texto para fala. Escolha uma voz, cole o que você quer que ela diga, e gere. São oferecidas 227 vozes em 72 idiomas. No entanto, há maneiras limitadas de classificar as línguas e é difícil entender suas diferenças sem prever cada dublador. Também não há opções adicionais de voz TTS personalizáveis disponíveis.

Conversão de Voz AI no Uberduck
Assim como a Kits, a Uberduck oferece uma ferramenta de conversão de voz.
Embora a biblioteca de vozes de texto para fala da Uberduck seja bastante grande, apenas quinze vozes estão disponíveis para conversões. Estas são majoritariamente masculinas.
Embora você possa fazer upload de outra gravação de voz para usar na conversão, esse recurso é muito mais limitado do que o Treinamento de Voz na Kits. Além disso, o trecho carregado deve ter menos de um minuto. A única personalização disponível para conversão de voz no Uberduck é alteração de tonalidade.

Gerador de Música de Rap do Uberduck
A Uberduck oferece um recurso musical: o Gerador de Rap. Insira um tópico, e o texto de IA preencherá quatro linhas e fará uma voz gerada rap. Esta é uma ferramenta mais limitada e menos profissional do que o que a Kits oferece voltada para criadores de conteúdo, mas é divertida de brincar.
Para começar, escolha uma das cinco batidas disponíveis. Você também pode escolher acapella sem faixa de apoio em um BPM personalizado.

Depois, escreva uma breve descrição sobre o que você quer que as letras sejam. A IA gerará rimas a partir deste tópico, embora você esteja limitado a apenas quatro linhas com o plano gratuito.

(Você também pode colar suas próprias letras.)

Há apenas quatro vozes pré-fabricadas para escolher deste recurso: uma masculina e uma feminina, cada uma para inglês e espanhol. Você também pode fazer upload de um arquivo de voz para clonar. A partir daí, o rap será gerado. Você pode baixar áudio com ou sem faixa de apoio, bem como um vídeo de letra simples.

Note que o histórico de rap de IA não está disponível no plano gratuito, então você não pode ver ou editar gerações anteriores sem pagar.
Kits AI vs. Uberduck: API
Um recurso único que ambas as plataformas oferecem é o acesso à API. Isso permite que usuários avançados e programadores integrem a geração de voz AI em outros aplicativos. Nenhum dos planos de API é de código aberto.
A API da Kits é gratuita, embora você possa precisar adquirir planos superiores para acomodar o aumento do uso.
Na Uberduck, o acesso à API está disponível apenas para aqueles no plano pago.
Kits AI vs. Uberduck: Preços
Tanto a Kits quanto a Uberduck são gratuitas para usar para recursos básicos, mas usuários avançados precisarão de uma assinatura.
A Kits cobra $9.99 por mês por seu nível pago mais baixo. Isso inclui Treinamento de Voz e Mistura com dois slots de voz personalizados e downloads de .wav de maior qualidade. Mais importante, inclui 30 minutos de download por mês, cinco vezes mais do que o nível semelhante na Uberduck. Níveis superiores incluem tempo de download ilimitado e ainda mais slots de voz.

A Uberduck tem apenas um nível pago, que também custa $9.99. Isso inclui acesso a recursos premium, como vozes privadas e histórico de rap de IA, além de acesso à API e menor latência. Só vem com 3600 créditos de renderização por mês, equivalente a 6 minutos de áudio.

Encontrando a Melhor Ferramenta de IA para Você
Enquanto a Kits é construída para música e a Uberduck é construída para fala, há algum overlap entre essas duas ferramentas vocais de IA: texto para fala, conversão de voz e vocais de rap. Na maioria dos casos, a Kits oferece um conjunto de recursos mais rico, uma biblioteca de vozes maior e de alta qualidade e mais personalização adequada para músicos e produtores. A Uberduck é a única a oferecer um recurso de música generativa com seu Gerador de Rap, mas isso é mais uma novidade para criação de conteúdo de áudio e animações do que uma ferramenta de música profissional.
Em resumo, a Kits é a maneira preferida de adicionar vocais gerados por IA ao seu conteúdo, particularmente para cantores, músicos e produtores.

