ओपनएआई प्रोजेक्ट से परिचित सूत्रों के अनुसार, कंपनी चुपचाप एक जेनरेटिव म्यूजिक टूल बना रही है जो टेक्स्ट और ऑडियो प्रॉम्प्ट से गाने बनाता है। यह कदम चैटजीपीटी निर्माता को स्थापित खिलाड़ियों के साथ टकराव की राह पर ले जाता है सुनो और Google तेजी से बढ़ते AI संगीत क्षेत्र में, संभावित रूप से OpenAI की मल्टीमॉडल AI महत्वाकांक्षाओं में एक और आयाम जोड़ रहा है।
ओपनएआई जेनेरिक एआई पर अपना अगला बड़ा दांव लगा रहा है, और इस बार यह आपकी प्लेलिस्ट को लक्षित कर रहा है। चैटजीपीटी के पीछे की कंपनी एक म्यूजिक जेनरेशन टूल विकसित कर रही है जो क्रिएटर्स के वीडियो में साउंडट्रैक जोड़ने और म्यूजिक कंपोजिशन बनाने के तरीके को बदल सकता है, सूत्र बताते हैं सूचना.
टूल मूल संगीत उत्पन्न करने के लिए पाठ विवरण और ऑडियो संकेत लेकर काम करता है – सोचें “खाना पकाने के वीडियो के लिए उत्साहित जैज़ गिटार बनाएं” या “इस मौजूदा वोकल ट्रैक में स्ट्रिंग संगत जोड़ें।” यह उस प्रकार की कार्यक्षमता है जो बना सकती है सुनोएआई संगीत पीढ़ी में वर्तमान नेता, अपनी बाजार स्थिति को लेकर बहुत घबराया हुआ है।
प्रशिक्षण डेटा के प्रति OpenAI का दृष्टिकोण विशेष रूप से दिलचस्प है। कंपनी ने संगीत स्कोर को एनोटेट करने के लिए प्रतिष्ठित जूलियार्ड स्कूल के छात्रों के साथ साझेदारी की है, जो एआई संगीत क्षेत्र में सबसे परिष्कृत प्रशिक्षण डेटासेट में से एक हो सकता है। यह अन्य तौर-तरीकों के साथ ओपनएआई की रणनीति को प्रतिबिंबित करता है – बेहतर आउटपुट बनाने के लिए उच्च गुणवत्ता वाले प्रशिक्षण डेटा में भारी निवेश करें।
ओपनएआई के व्यापक मल्टीमॉडल पुश को देखते हुए समय समझ में आता है। कंपनी ने हाल ही में लॉन्च किया है सोराइसका टेक्स्ट-टू-वीडियो जनरेटर, और देशी संगीत पीढ़ी होने से एक शक्तिशाली सामग्री निर्माण सूट तैयार होगा। कल्पना कीजिए: “उत्साहित पृष्ठभूमि संगीत के साथ 30-सेकंड का उत्पाद डेमो वीडियो बनाएं” और एक ही बार में दृश्य और ऑडियो दोनों प्राप्त करें।
लेकिन OpenAI यहां शून्य से शुरू नहीं कर रहा है। कंपनी ने वास्तव में वर्षों पहले जेनेरिक म्यूजिक मॉडल बनाए थे, इससे पहले कि चैटजीपीटी ने इसे घरेलू नाम बना दिया था। उन शुरुआती प्रयोगों को पाठ और छवि निर्माण की सफलताओं ने ढक दिया है, लेकिन उन्होंने मूल्यवान आधार प्रदान किया है। अभी हाल ही में, OpenAI किया गया है परिष्कृत ऑडियो मॉडल विकसित करना वाक् संश्लेषण और पहचान पर ध्यान केंद्रित किया गया।
प्रतिस्पर्धी परिदृश्य तेजी से गर्म हो रहा है। गूगल अपने स्वयं के संगीत निर्माण प्रयोग हैं, जबकि कंपनियाँ पसंद करती हैं एआई-जनरेटेड संगीत के इर्द-गिर्द पूरा कारोबार खड़ा किया है। सुनो पहले से ही सरल पाठ संकेतों के बोल के साथ पूर्ण गाने बना सकता है, और उसने जन्मदिन के गीतों से लेकर वायरल टिकटॉक ट्रैक तक सब कुछ बनाकर लाखों उपयोगकर्ताओं को आकर्षित किया है।








