Cómo Kits AI obtiene conjuntos de datos de entrenamiento de IA de forma ética
Escrito por
El equipo de Kits
Publicado el
11 de abril de 2024
Kits es una organización enfocada en músicos y vocalistas. Entendemos el debate matizado entre artistas y herramientas de IA que usan su imagen o informan su proceso creativo, y lo valioso que es apoyar a los artistas en el proceso de construir nuestra tecnología. Seguimos de cerca el trabajo de Artist Rights Alliance que insta a las empresas tecnológicas a dejar de usar IA que infringe los derechos de los artistas, y apoyamos con orgullo la misión del ARA de priorizar la ética y queremos compartir cómo y por qué nuestras prácticas de obtención de datos apoyan el trabajo de músicos y creativos.

Cómo se crean los modelos de voz
Hablemos rápidamente sobre cómo funcionan los modelos de voz de IA. Cada voz de IA en Kits es un modelo AI único y afinado. Para imitar una voz real, el modelo se entrena con conjuntos de datos de audio de referencia. Idealmente, este conjunto de datos comprende 30 minutos de voces en alta calidad. Cada modelo de Kits utiliza un conjunto de datos vocales, lo que da como resultado un modelo de voz lo más cercano posible al original.
Nuestra Biblioteca de Voz IA en Kits está creciendo continuamente, y para cada modelo obtenemos conjuntos de datos vocales de canto de alta calidad para entrenar nuestros modelos. Es fácil hacer esto de manera irresponsable y encontrar conjuntos de datos que no han sido aprobados por los artistas ni los apoyan de ninguna manera. Entonces, ¿cómo abordamos esto de manera responsable?
Muchas plataformas de voz IA simplemente extraen voces de la web y se apresuran a entrenar modelos, apuntando a la cantidad pura. Este enfoque no solo es poco ético, sino que también pone a los usuarios finales en un riesgo significativo.
Si un usuario convierte con un modelo de voz no conforme, cualquier cosa que creen podría enfrentarse a violaciones de derechos de autor y avisos de eliminación. Esto significa que las voces de los artistas se utilizan sin consentimiento y cualquier obra creada con esos modelos también está en riesgo.
Cómo Kits obtiene nuestros datos de entrenamiento, éticamente
Los modelos de Kits se entrenan exclusivamente con datos vocales para los cuales adquirimos todos los derechos. Comenzamos contactando a vocalistas de sesión y socios de estudio interesados en proporcionar conjuntos de datos vocales. Educamos a los proveedores sobre el entrenamiento de modelos de IA y creamos contratos para compensarlos y adquirir legítimamente sus conjuntos de datos vocales para priorizar un enfoque ético en la obtención de datos.
Del lado del proveedor, este acuerdo asegura que los vocalistas entiendan los matices de la tecnología de Voz IA y reciban compensación por cualquier voz que proporcionen. Del lado de Kits, esto asegura que cualquier modelo que uses de la Biblioteca de Kits ha sido obtenido de manera justa y tú como usuario final mantienes todos los derechos sobre cualquier trabajo creado con ese modelo ahora y en el futuro.

Empezamos Kits para mostrar a los artistas y a la industria musical cómo la tecnología de Voz IA puede usarse para el bien, y aún hay mucho trabajo por hacer. En los próximos meses, compartiremos más sobre cómo estamos desarrollando herramientas innovadoras para ayudar a poner a los artistas en el asiento del conductor de su propia propiedad intelectual e informar el futuro de la tecnología de voz IA.
¿Eres un artista buscando compartir tu voz con el mundo de forma segura, ética y con compensación? ¡Nos encantaría saber de ti! Por favor, contáctanos en outreach@kits.ai.
Atentamente,
El Equipo de Kits

