03/19/2024

Kits y Descript: Herramientas de IA para Creadores de Audio

Obtenga más información sobre las plataformas de audio AI Kits AI y Descript y encuentre la mejor herramienta para su flujo de trabajo de creación de audio.

Gráfico de comparación de descripciones y kits
Gráfico de comparación de descripciones y kits
Gráfico de comparación de descripciones y kits

Table of contents

Title

Title

Comienza gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes pagados comienzan en $9.99 / mes.

Comienza gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes pagados comienzan en $9.99 / mes.

Comienza gratis. No se requiere tarjeta de crédito.

Nuestro plan gratuito te permite ver cómo Kits puede ayudar a optimizar tu flujo de trabajo vocal y de audio. Cuando estés listo para dar el siguiente paso, los planes pagados comienzan en $9.99 / mes.

En los últimos años de la revolución de la inteligencia artificial, mucha atención se ha centrado en lo que la IA puede hacer por los artistas visuales. Miles de millones de personas han experimentado con herramientas como Dall-E, Midjourney y la herramienta de relleno generativo de Photoshop para crear imágenes con IA.

¿Pero sabías que hay herramientas similares para proyectos de audio? Músicos, productores, podcasters, streamers, editores de video y más pueden utilizar la IA para mejorar cada paso de su flujo de trabajo.

En este artículo, echaremos un vistazo a dos de las herramientas de audio IA más populares: Kits, una plataforma vocal IA para la música, y Descript, un editor de audio impulsado por IA para podcasts.

Herramientas de IA de Kits para Voces

Kits es una poderosa herramienta de producción musical que utiliza la IA para crear audio de alta calidad. Con Kits, puedes convertir una cantante en otra y clonar la voz de un cantante. Las oportunidades creativas son infinitas. 

Conversión de Voz

Kits se basa en Convertir, que cambia la voz de un cantante por completo a otra. Mientras que otras herramientas de IA hacen esto para el habla, Kits es el primero en ofrecerlo para el canto. Los resultados son tan buenos que pueden pasar por cantantes profesionales grabados en un estudio de alta gama, convirtiéndolo en una herramienta sumamente versátil para productores.

Solo tienes que subir un archivo, enlace de video de YouTube, o grabar directamente en la aplicación web. ¡En pocos segundos, tu melodía tendrá un nuevo cantante!

Puedes ajustar la Conversión con controles avanzados:

  • Eliminar instrumentales, reverberación y retardo, y/o coros de tu grabación para obtener mejores resultados.

  • Cambio de Tono: Sube o baja el tono hasta 24 semitonos.

  • Fuerza de Conversión: Añade más acento y articulación a la generación, pero puede producir resultados inesperados en niveles altos. 

  • Mezcla de Volumen: Controla el equilibrio entre el volumen de entrada y el modelo. Los valores más bajos revelan más de la dinámica original.

  • Efectos de Pre-Procesamiento: Corta ruido, zumbido y asperezas, suaviza el volumen y/o aplica autoafinación antes de la generación.

  • Efectos de Posprocesamiento: Aplica compresor, coro, reverberación y/o retardo al resultado. 

Tutorial de Entrenamiento de Voz

La característica más futurista de Kits es Entrenamiento de Voz. Solo tienes que subir un archivo de audio o pegar un enlace de video de YouTube, y Kits entrenará un modelo de IA para crear un clon perfecto de la voz del cantante. Esta nueva Voz se puede utilizar en lugar de una voz convencional o mezclada para cualquier conversión (más sobre esto más adelante). 

Kits ofrece la mejor herramienta de Entrenamiento de Voz disponible para cantantes. Otras herramientas de IA la ofrecen para el habla, incluido Descript, del cual hablaremos en detalle más adelante. Sin embargo, Descript utiliza esta función principalmente para corregir errores o generaciones simples de texto a voz. Kits te permite usar de manera sencilla el modelo de voz entrenado para conversiones, lo que es una gran ventaja.

Kits voice cloning page with files uploaded

Para entrenar la voz, Kits permite cualquier formato de audio grabado. Recomienda 10 minutos para obtener los mejores resultados, pero acepta hasta una hora. (En comparación, Descript te exige leer un guion específico para usarlo como plantilla de voz.) A partir de ahí, solo tienes que añadir un nombre y una foto, ¡y entrenar tu nueva voz! Se guardará en tu Biblioteca de Voces para uso futuro.

Biblioteca de Voces

Kits ofrece más de 50 Voces de Artistas en su Biblioteca de Voces. Cada una lleva el nombre de su género y género, como Afro Beat Masculino o Pop de Dormitorio Femenino. Puedes ordenar la Biblioteca por rango de tono, género y género, e incluso hay voces para otros idiomas y estilos de música mundial. Todas son completamente libres de regalías, así que puedes usarlas como quieras. 

Open tab of the voice library page with no model selected

Para personalizar aún más tu sonido, puedes combinar dos Voces con el Mixer de Voces. El control deslizante de Mezcla de Voces controla cuánto de cada voz se usará para entrenar el nuevo modelo.

Kits AI voice blender tool with 2 models selected

Además, Kits ofrece instrumentos, incluyendo guitarra, bajo, saxofón y violonchelo. Esto te permite crear instrumentales sin esfuerzo: solo graba rápidamente tu canto o tarareo, luego conviértelo en una voz instrumental.

Texto a Voz

Kits también ofrece una función de texto a voz en 14 idiomas, para narración, locuciones y otro contenido hablado. Dado que la Biblioteca de Voces de Kits está calibrada para el canto, los resultados tienden a ser más naturales que otros AIs. Ingresa tu guion, selecciona un rango de tono y genera el habla. Se puede utilizar toda la Biblioteca de Voces, además de voces mezcladas y entrenadas. 

Voice conversion page with the male synth pop model selected in the text to speech tab

Mejoradores de Audio IA

Eliminador de Voz 

Otra herramienta musical impulsada por IA en Kits es el Eliminador de Voz. Sube una canción o enlace de YouTube y el Eliminador de Voz separa las vocales de los instrumentos y otros ruidos de fondo. Los ajustes avanzados te permiten eliminar coros de fondo y alternar reverberación, eco y reducción de ruido. Con IA integrada, el Eliminador de Voces de Kits tiende a hacer un mejor trabajo que el software tradicional en extraer con precisión las voces incluso cuando se superponen sonidos similares.

Kits AI vocal remover page

Masterización IA 

La masterización es la fase final del flujo de trabajo de producción musical. Se aplican compresión, limitación, ecualización y más para perfeccionar el sonido final y asegurarse de que las pistas individuales funcionen bien juntas. Históricamente, esta ha sido uno de los elementos más difíciles y costosos de la producción, pero la IA de Kits permite que incluso nuevos productores mastericen pistas en segundos.

Kits ofrece seis preajustes de masterización predefinidos:

  • Ligero y Brillante

  • Bajo Pesado

  • Punch & Air

  • Frondoso

  • Pegamento de Cinta

  • Calidez Analógica

Dado que el proceso fácil de usar solo tarda segundos, puedes experimentar para ver cuál funciona mejor. También puedes subir una pista de referencia, cuyo sonido Kits usará como modelo.

Kits AI Mastering page with a track input

Kits no es solo la herramienta de canto IA más potente del mercado, sino una herramienta esencial para los modernos productores de música. Utiliza la IA para mejorar cada etapa de la producción vocal, lo que te permite producir mejores voces con menos tiempo, menos dinero y más creatividad.

Descript: Editor de Podcast IA

Descript es una de las herramientas más potentes disponibles en la actualidad para podcasters, con una amplia gama de funciones de audio IA integradas en un editor de podcast basado en texto. (Descript también ofrece algunas herramientas de contenido de video, pero no entraremos en eso aquí.) 

Espera, ¿editor de audio basado en texto? Sí, Descript transcribe automáticamente tu audio para que puedas editarlo como un documento, con tus cambios reflejados en el audio. Las grabaciones largas se transcriben en segundos y se almacenan de forma segura en la nube y cada locutor se etiqueta automáticamente. Además, funciona en 22 idiomas. Además de esta experiencia de usuario única, hay una amplia gama de otras herramientas de audio IA para la edición de video:

Voces de IA

Al igual que Kits, Descript incluye voces predefinidas que se pueden utilizar para el texto a voz. En total hay 21 con etiquetas para describir su voz: Masculina o Femenina, Joven, Adulta o Mayor, además de acentos y estilos. 

Descript AI voice selection page

Descript también tiene una función de clonación de voz similar al Entrenamiento de Voz en Kits. Curiosamente, Descript solo te permite clonar tu propia voz. Para verificarlo, debes grabarte leyendo un guion especial como plantilla. Tu voz se puede guardar para usarla en el texto a voz, así como en futuras Overdubs de tu propia voz. 

Script generated by Descript's voice cloning feature

Regenerar Cualquier Transcripción

Regenerar básicamente crea un mini clon de voz (sin el proceso largo descrito anteriormente), luego regenera un fragmento seleccionado del texto en la transcripción de la grabación. Esto permite ediciones de audio que serían imposibles sin IA, y podría ser la característica más potente de Descript. 

Por ejemplo, digamos que estás grabando en casa y suena el timbre. Normalmente, cortar este momento llevaría tiempo y hacerlo tan limpiamente que los oyentes no lo noten podría ser imposible. Pero con Descript, solo tienes que localizar el momento en la transcripción, resaltarlo y hacer clic en Reemplazar Con → Regenerar. La locución generada por IA se insertará sin problemas sobre esa sección de la grabación original.

Y si llamas a tu compañero de habitación para que conteste la puerta? Puedes eliminar fácilmente las palabras fuera de tema de la transcripción, pero dejará una desconexión obvia que los oyentes pueden escuchar. Solo regenera la frase alrededor de la edición y la voz de IA coincidirá automáticamente en tono e inflexión para ocultarlo perfectamente.

Overdub

Debajo de Regenerar en el menú Reemplazar Con está Overdub. En lugar de usar la voz de IA para suavizar ediciones, Overdub la utiliza para insertar nuevas palabras en el podcast. Si pronuncias mal una palabra, deslizas una línea, o simplemente no te explicas tan bien como deberías, puedes cortar instantáneamente la parte no deseada y reemplazarla con un overdub de IA. 

Dado que Descript identifica automáticamente distintos locutores, el overdub coincidirá automáticamente con el locutor correcto. Además, el nuevo audio coincidirá con la calidad del micrófono, el ruido de fondo y la inflexión de la grabación circundante. 

Descript's Overdub feature

Cualidad de Estudio

Con un clic, los algoritmos de Cualidad de Estudio dejan que cualquier grabación suene profesional. Solo tienes que alternar el interruptor bajo Efectos de Audio, y la Cualidad de Estudio separa las voces del ruido de fondo para mejorar ambos. El control deslizante de Intensidad controla cuán fuertemente se aplica el efecto. La voz se mejorará, así que incluso una grabación rápida hecha con iPhone sonará como si se hubiera hecho con un micrófono de alta calidad. Perfecciona tu archivo de video y elimina el ruido de fondo, siseo y eco de la habitación en simples pasos intuitivos. 

Eliminación de Palabras de Relleno

Cada podcaster ha experimentado esto: grabas un episodio y piensas que lo hiciste genial. Pero al escucharlo, tu discurso está plagado de