Kits y Descript: Herramientas de IA para Creadores de Audio

Obtenga más información sobre las plataformas de audio AI Kits AI y Descript y encuentre la mejor herramienta para su flujo de trabajo de creación de audio.

Kits y Descript: Herramientas de IA para creadores de audio

Escrito por

El equipo de Kits

Publicado el

19 de marzo de 2024

Copiar enlace

Copiado

En los últimos años de la revolución de la inteligencia artificial, se ha prestado mucha atención a lo que la IA puede hacer por los artistas visuales. Miles de millones de personas han experimentado con herramientas como Dall-E, Midjourney y la herramienta de Relleno Generativo de Photoshop para crear imágenes con IA.

¿Pero sabías que hay herramientas similares para proyectos de audio? Músicos, productores, podcasters, streamers, editores de video y más pueden usar IA para mejorar cada paso de su flujo de trabajo.

En este artículo, veremos dos de las herramientas de audio con IA más populares: Kits, una plataforma vocal con IA para música, y Descript, un editor de audio impulsado por IA para podcasts.

Herramientas de Kits IA para Voces

Kits es una herramienta poderosa de producción musical que utiliza IA para crear audio de alta calidad. Con Kits, puedes convertir un cantante en otro y clonar la voz de un cantante. Las oportunidades creativas son infinitas. 

Conversión de Voz

Kits se basa en Convert, que transforma la voz de un cantante en una completamente diferente. Mientras que otras herramientas de IA hacen esto para el discurso, Kits es el primero en ofrecerlo para el canto. Los resultados son tan buenos que pueden pasar como cantantes profesionales grabados en un estudio de alta gama, lo que lo convierte en una herramienta extremadamente versátil para los productores.

Solo sube un archivo o graba directamente en la aplicación web. ¡En pocos segundos, tu canción tendrá un nuevo cantante!

Puedes ajustar la Conversión con controles avanzados:

  • Eliminar instrumentales, reverberación y retraso, y/o voces de fondo de tu grabación para obtener mejores resultados.

  • Desplazamiento de Tono: Aumenta o disminuye el tono hasta 24 semitonos.

  • Fuerza de Conversión: Agrega más acento y articulación a la generación, pero puede causar resultados inesperados a altos niveles. 

  • Mezcla de Volumen: Controla el equilibrio entre el volumen de entrada y el modelo. Los valores más bajos revelan más de la dinámica original.

  • Efectos de Pre-Procesamiento: Corta el ruido, el estruendo y la dureza, suaviza el volumen y/o EQ antes de la generación.

  • Efectos de Post-Procesamiento: Aplica compresor, coro, reverberación y/o retraso al resultado. 

Tutorial de Entrenamiento de Voz

La característica más futurista de Kits es el Entrenamiento de Voz. Solo sube un archivo de audio y Kits entrena un modelo de IA para crear un clon perfecto de la voz del cantante. Esta nueva Voz se puede usar en lugar de una voz de stock o Mezclada para cualquier conversión (más sobre eso abajo). 

Kits ofrece la mejor herramienta de Clonación de Voz disponible para cantantes. Otras herramientas de IA lo ofrecen para el discurso, incluido Descript, del cual hablaremos en detalle más adelante. Sin embargo, Descript usa esta función principalmente para corregir errores o simples generaciones de texto a discurso. Kits te permite usar sin esfuerzo el modelo de voz entrenado para conversiones, lo que es una gran ventaja.

Kits voice cloning page with files uploaded

Para entrenar la voz, Kits permite cualquier formato de audio grabado. Recomienda 10 minutos para obtener los mejores resultados, pero acepta hasta una hora. (En comparación, Descript te requiere leer un guion específico para usarlo como plantilla de voz). Desde allí, solo agrega un nombre y una foto, ¡y entrena tu nueva voz! Se guardará en tu Biblioteca de Voces para uso futuro.

Biblioteca de Voces

Kits ofrece más de 150+ Voces de Artistas en su Biblioteca de Voces. Cada una está nombrada según su género y género musical, como Afro Beat Masculino o Pop para Dormitorio Femenino. Puedes ordenar la Biblioteca por rango de tono, género y género musical, e incluso hay voces para otros idiomas y estilos de música mundial. Todas son completamente libres de regalías, así que puedes usarlas como quieras. 

Open tab of the voice library page with no model selected

Para personalizar aún más tu sonido, puedes combinar dos Voces con el Mezclador de Voces. El deslizador de Proporción de Mezcla controla cuánto de cada voz usar en el entrenamiento del nuevo modelo.

Kits AI voice blender tool with 2 models selected

Además, Kits ofrece instrumentos, incluidos guitarra, bajo, saxofón y violonchelo. Esto te permite crear instrumentales sin esfuerzo: solo graba rápidamente una parte cantando o tarareando, y luego conviértela en una voz de instrumento.

Texto a Discurso

Kits también ofrece una función de texto a discurso en 14 idiomas, para narraciones, doblajes y otros contenidos hablados. Ya que la Biblioteca de Voces de Kits está calibrada para el canto, los resultados tienden a ser más naturales que otras IAs. Ingresa tu guion, selecciona un rango de tono y genera el discurso. Se puede usar toda la Biblioteca de Voces, además de Voces Mezcladas y Entrenadas. 

Voice conversion page with the male synth pop model selected in the text to speech tab

Mejoradores de Audio IA

Removedor de Voces 

Otra herramienta musical impulsada por IA en Kits es el Removedor de Voces. Subes una canción y el Removedor de Voces separa las voces del instrumental y otros ruidos de fondo. Los ajustes avanzados te permiten eliminar voces de fondo, y alternar la reverberación, el eco y la reducción de ruido. Con IA integrada, el Removedor de Voces de Kits tiende a hacer un mejor trabajo que el software tradicional al extraer voces con precisión incluso cuando los sonidos similares se superponen.

Kits AI vocal remover page

Masterización IA 

La masterización es la fase final del flujo de trabajo de producción musical. Se aplican compresión, limitación, EQ y más para perfeccionar el sonido final y asegurarse de que las pistas individuales funcionen bien juntas. Esto históricamente ha sido uno de los elementos más difíciles y costosos de la producción, pero Kits IA permite incluso a nuevos productores masterizar pistas en segundos.

 Kits ofrece seis preajustes de masterización ya hechos:

  • Ligero y Brillante

  • Pesado de Bajo

  • Punch & Aire

  • Exuberante

  • Adhesivo de Cinta

  • Calidez Analógica

Dado que el proceso fácil de usar toma solo segundos, puedes experimentar para ver cuál funciona mejor. También puedes subir una pista de referencia, cuyo sonido Kits usará como modelo.

Kits AI Mastering page with a track input

Kits no solo es la herramienta de canto con IA más poderosa en el mercado, sino una herramienta esencial para los productores modernos de música. Utiliza IA para mejorar cada etapa de la producción vocal, permitiéndote producir mejores voces en menos tiempo, menos dinero y más creatividad.

Descript: Editor de Podcast IA

Descript es una de las herramientas más poderosas disponibles hoy para podcasters, con una rica suite de funciones de audio IA construidas en torno a un editor de podcasts basado en texto. (Descript también ofrece algunas herramientas de contenido de video, pero no entraremos en ellas aquí). 

¿Espera, editor de audio basado en texto? Sí, Descript transcribe automáticamente tu audio para que puedas editarlo como un documento, con tus cambios reflejados en el audio. Las grabaciones largas se transcriben en segundos y se almacenan de manera segura en la nube y cada hablante se etiqueta automáticamente. Además, funciona en 22 idiomas. Encima de esta experiencia única de usuario hay una amplia gama de otras herramientas de audio IA para edición de video:

Voces IA

Al igual que Kits, Descript incluye voces de stock que se pueden usar para texto a discurso. Hay 21 en total con etiquetas para describir su voz: Masculino o Femenino, Joven, Adulto, o Mayor, además de acentos y estilos. 

Descript AI voice selection page

Descript también tiene una característica de clonación de voz similar al Entrenamiento de Voz en Kits. Curiosamente, Descript solo te permite clonar tu propia voz. Para verificar esto, debes grabarte a ti mismo leyendo un guion especial como plantilla. Tu voz se puede guardar para usar en texto a discurso, así como sobredubs futuros de tu propio discurso. 

Script generated by Descript's voice cloning feature

Regenerar Cualquier Transcripción

Regenerar esencialmente crea un mini clon de voz (sin el proceso más largo descrito anteriormente), luego regenera un fragmento seleccionado de texto en la transcripción de grabación. Esto permite ediciones de audio que serían imposibles sin IA -- y podría ser la característica más poderosa de Descript. 

Por ejemplo, digamos que estás grabando en casa y suena el timbre. Normalmente, cortar este momento sería laborioso, y hacerlo lo suficientemente limpio para que los oyentes no lo noten podría ser imposible. Pero con Descript, solo ubica el momento en la transcripción, resáltalo, y haz clic en Reemplazar con → Regenerar. El discurso generado por IA se rellenará perfectamente en esa sección de la grabación original.

¿Y si llamas a tu compañero de piso para que atienda la puerta? Puedes fácilmente eliminar las palabras fuera de tema del guion, pero dejarás una desconexión obvia que los oyentes pueden escuchar. Solo Regenera la frase alrededor del corte y la voz de IA coincidirá con el tono y la entonación para ocultarlo perfectamente.

Overdub

Debajo de Regenerar en el menú Reemplazar con está Overdub. En lugar de usar la voz de IA para suavizar las ediciones, Overdub la usa para insertar nuevas palabras en el podcast. Si pronuncias mal una palabra, cometes un error o simplemente no te articulas tan bien como deberías, puedes cortar instantáneamente la parte no deseada y reemplazarla con un overdub de IA. 

Dado que Descript identifica automáticamente a los diferentes hablantes, el overdub coincidirá automáticamente con el hablante correcto. Además, el nuevo audio coincidirá con la calidad del micrófono, el ruido de fondo y la entonación de la grabación circundante. 

Descript's Overdub feature

Sonido de Estudio

Con un solo clic, los algoritmos de Sonido de Estudio hacen que cualquier grabación suene profesional. Simplemente activa el interruptor bajo Efectos de Audio, y Sonido de Estudio separa las voces del ruido de fondo para mejorar ambos. El deslizador de Intensidad controla qué tan fuerte se aplica el efecto. La voz será mejorada, por lo que incluso una grabación rápida de iPhone sonará como un micrófono de alta calidad. Perfecciona tu archivo de video y elimina el ruido de fondo, el siseo y el eco de habitación en pasos simples e intuitivos. 

Eliminación de Palabras de Relleno

Todo podcaster ha experimentado esto: grabas un episodio y crees que lo aplastaste. Pero cuando lo escuchas, tu discurso está plagado de “como”, “eh”, pausas y otras palabras de relleno. Estas pequeñas cosas pueden, desafortunadamente, tener un gran impacto en cómo te perciben.

La Eliminación de Palabras de Relleno está incorporada en Descript, y como el resto de sus funciones, es increíblemente simple de usar. Cuando tu audio se transcribe, las palabras de relleno se subrayan automáticamente. Haz clic en el icono de estrella, luego usa la herramienta de edición para “Eliminar palabras de relleno” y “Acortar huecos de palabras” para limpiar tu discurso. 

Sample filler word remover function

Encontrando la Mejor Herramienta de IA para Ti

Kits y Descript están a la vanguardia de la producción de audio habilitada por IA. Sus herramientas funcionan de manera simple y elegante para mejorar tu flujo de trabajo existente. Herramientas poderosas con precios poderosos como Conversión de Voz y Entrenamiento de Voz de Kits y el editor basado en texto de Descript abren posibilidades reactivas que nunca han existido antes. Además, características como Removedor de Voces y Masterización IA en Kits y Regenerar y Eliminación de Palabras de Relleno en Descript eliminan los aspectos más laboriosos y tediosos de la producción de audio. ¿Cómo harán las herramientas de audio IA de que seas un mejor creador?

Tabla de Contenidos

Título

Empieza, gratis.

Optimiza tu flujo de producción vocal con herramientas de audio AI de calidad de estudio

Entradas de blog recomendadas para ti