23 अगस्त 2024
एआई ध्वनियों का उपयोग करते समय बचने वाली सामान्य गलतियाँ
सैम कर्नी
परिचय
आपकी संगीत में एआई वोकल्स को शामिल करना संगीतकारों और निर्माताओं के लिए एक रोमांचक और नवाचारी टूल है, जो कृत्रिम बुद्धिमत्ता में बढ़ताइयों के धन्यवाद को। जैसे ही कोई नई प्रौद्योगिकी होती है, इसे सर्वश्रेष्ठ परिणाम प्राप्त करने के लिए कुछ संशोधनों की आवश्यकता होती है। Kits.AI पर, हम डेटा सेट्स को प्रसंस्करण करते हैं ताकि सटीक और वास्तविक एआई वोकल मॉडल प्रशिक्षण के लिए आदर्श सेटअप बना सकें। समय के साथ, मैंने देखा है कि एआई द्वारा उत्पन्न वोकल की प्रदर्शन क्षमता को प्रभावित कर सकने वाली सामान्य गलतियों को। इस लेख में, मैं इन खतरों पर प्रकाश डालूँगा और आपको बताऊंगा कि आपके एआई वोकल मॉडल को कैसे अनुकूलित करना है।
स्तर और गतिविधि
मानव वाणी अनूठी होती है, उसी तरह से एक उंगली की निशानी की तरह, जिसमें इसका अपना ध्वनि होता है और भावनात्मक नुआंस होता है। गायन सामान्य रूप से भावनात्मक अभिव्यक्ति का एक उच्चस्तर होता है और स्वाभाविक रूप से आवाज में विभिन्नता होती है। जब वोकल रिकॉर्ड किए जाते हैं, तो इन भिन्नताओं को अक्सर माइक्रोफोन तकनीक और कंप्रेसर का उपयोग करके नियंत्रित किया जाता है। अनुभवी सत्र गायक अक्सर अपनी दूरी को समाप्त करके “स्वयं-कंप्रेस” करते हैं जब उच्च ध्वनिविभाग होते हैं। हालांकि, इस तकनीक के साथ भी, सामान्य रूप से संतुलित मिश्रण बनाए रखने के लिए अतिरिक्त कंप्रेसन की आवश्यकता होती है।
जैसे ही प्राकृतिक कंप्रेसन गीतों के लाभकारक होती है, वैसे ही इस तरह की प्रगतिशील सॉफ्टवेयर का उपयोग करते समय वोकल क्लोनिंग के मामले में भी इसकी प्रशिक्षण प्रक्रिया को बेहतर बनाने के लिए कंट्रोल किए गए डायनेमिक रेंज वाले वोकल ट्रैक्स से बेहतर परिणाम मिलते हैं। मेरी व्यक्तिगत तकनीक प्रशिक्षण के लिए एक वोकल को अपने DAW में आयात करना है और क्लिप गेन का उपयोग करके कुछ अत्यधिक ध्वनिक विभागों को संतुलित करने के लिए करना है पहले ही किसी अतिरिक्त कंप्रेशन को लागू करने से पहले। यह सुनिश्चित करता है कि कंप्रेसर असामाजिक ध्वनियों को लाने के बिना सही तरीके से काम करता है।
नीचे दी गई छवि में, शीर्ष ट्रैक में मूल डेटा सेट दिखाया गया है, जबकि नीचे वाली ट्रैक ने मेरे स्तर की समायोजन संशोधन दिखाया है:
इस दृष्टि को अपनाकर, केवल एक हल्की छुआछू भी आवश्यक है। मेरी सिफारिश है कि 3-5 डीबी से अधिक गेन को कम किया जाए।
सर्वोत्तम परिणामों के लिए, औसत आवाज के स्तर का लक्ष्य-12 डीबी और शीर्ष बिंदु -6 डीबी से अधिक नहीं होना चाहिए। यह मशीन लर्निंग के लिए एक महान आधार प्रदान करता है और अधिक वास्तविक एआई वोइस मॉडल्स बनाता है।
तीक्ष्णता को कम करने के लिए डेस करें
“एस,” “टी,” और “ज़” जैसी ब्यालिऔंट्स द्वारा प्रकट कठिन पदोंचन को कम करने के लिए डेसर, जैसे फैबफिल्टर्स प्रो-डीएस, आवश्यक है। यह सुनिश्चित करता है कि आपका एआई ध्वनि मॉडल इन कठिन तत्वों को प्रतिलिपि करने के लिए प्रशिक्षित नहीं होता है, जिससे इसका परिणाम सहज और अधिक पेशेवर बनता है।
इक्वलायज़ेशन: स्पेक्ट्रम को संतुलित करना
समता (इक्वलायज़ेशन) गायन रिकॉर्डिंग के ध्वनि को आकार देने में एक महत्वपूर्ण भूमिका निभाती है। हालांकि संकेतक सूत्रों की विशेष इक्वलायज़ेशन सेटिंग संगीतीय सामग्री के आधार पर भिन्न हो सकती है, एक अच्छी तरह से संतुलित इक्वलायज़ेशन आपके एआई वोइस मॉडल की गुणवत्ता में सुधार कर सकती है और आपके एआई ध्वनि मॉडल के लिए एक महान स्टार्टिंग पॉइंट प्रदान कर सकती है।
एक हाई-पास फ़िल्टर के साथ शुरू करें ताकि ध्वनि ध्वनि सांस्कृतिकता में योगदान नहीं करने वाले किसी भी अत्यावश्यक निचले संकेतकों को हटाया जा सके। हालांकि, 100 हर्ट्ज़ से ऊपर जाने पर सावधानी बरतें, क्योंकि इससे आवश्यक ध्वनि पदार्थ हट सकते हैं।
स्पेक्ट्रम के उस अन्य कोने में, हमें उपयोगकर्ताओं के द्वारा शुरू की जाने वाली कठिन उच्च-अंत संकेतकों से सतर्क रहना चाहिए। हर कोई किसी भी कीमत परीक्षण करने वाले अधिक सामर्थ्यशाली माइक्रोफोन से नहीं गाता है (शामिल मेरी भी तरह से)। एक लो-पास फिल्टर इन संकेतकों को वशीभू करने में सहायक हो सकता है, सामान्यतः 20 किलोहर्ट्ज़ और उससे ऊपर।
जैसे ही पलटेक ईक्यूपी-1A जैसे ईक्वाइलाइज़र का उपयोग करना, जिसे इसके मलाईहारी और ऋणात्मक चरित्र के लिए जाना जाता है, निचली ध्वनि बारिश और ऊँची ध्वनि को हल्का करने के लिए एक महान विकल्प हो सकता है।
तान कोरेक्शन: कब और कैसे उसका उपयोग करें
तान कोरेक्शन उपकरण, जैसे अंटारेस ऑटो-ट्यून के मुफ्त संस्करण, आधुनिक संगीत उत्पादन में एक प्रभाव के रूप में अक्सर उपयोग किए जाते हैं। हालांकि, जब एक एआई वोइस मॉडल को प्रशिक्षण दिया जाता है, तो मैं सिफारिश करता हूँ कि वोकल को प्राकृतिक रूप से रखा जाए और तान कोरेक्शन को प्रयोग