- ■
रोबोटिक्स अनुप्रयोगों के लिए सामान्य विश्व मॉडल विकसित करने के लिए अलीबाबा शेंगशु (जिसे विदु के नाम से भी जाना जाता है) के लिए $290 मिलियन सीरीज़ बी का नेतृत्व करता है।
- ■
निवेश का रुझान भौतिक एआई की ओर है क्योंकि उद्योग वास्तविक दुनिया के कार्यों के लिए पाठ-आधारित एलएलएम की सीमाओं को पहचानता है
- ■
विश्व मॉडल का उद्देश्य रोबोटों को भौतिकी, स्थानिक संबंधों और भौतिक वातावरण में कारण-और-प्रभाव को समझने में मदद करना है
- ■
डील पारंपरिक क्लाउड कंप्यूटिंग से परे एआई इंफ्रास्ट्रक्चर में अलीबाबा क्लाउड के आक्रामक प्रयास का प्रतिनिधित्व करती है
अलीबाबा ने एक बड़ी शर्त रखी है कि एआई का भविष्य बेहतर चैटबॉट्स के बारे में नहीं है – यह उन मशीनों के बारे में है जो भौतिक दुनिया को समझती हैं। चीनी तकनीकी दिग्गज ने शेंगशू में 290 मिलियन डॉलर के निवेश का नेतृत्व किया, एक स्टार्टअप जिसे वह ‘सामान्य विश्व मॉडल’ कहता है, जिसे अगली पीढ़ी के व्यावहारिक रोबोटों को शक्ति देने के लिए डिज़ाइन किया गया है। यह सौदा एआई विकास में एक उल्लेखनीय बदलाव का संकेत देता है क्योंकि उद्योग बढ़ते सबूतों का सामना कर रहा है कि बड़े भाषा मॉडल अकेले प्रौद्योगिकी के सबसे महत्वाकांक्षी वादों को पूरा नहीं करेंगे।
अलीबाबा कृत्रिम बुद्धिमत्ता आगे किस ओर जा रही है, इसके बारे में एक साहसिक बयान दे रहा है। कंपनी के क्लाउड डिवीजन ने चीनी एआई स्टार्टअप शेंगशू के लिए 290 मिलियन डॉलर के फंडिंग राउंड का नेतृत्व किया है, जो टेक्स्ट-भविष्यवाणी प्लेबुक को पूरी तरह से कुछ और अधिक महत्वाकांक्षी के पक्ष में छोड़ रहा है: मशीनों को यह समझने के लिए सिखाना कि भौतिक दुनिया वास्तव में कैसे काम करती है।
द्वारा रिपोर्ट किया गया निवेश सीएनबीसीतब आता है जब एआई उद्योग एक मूलभूत समस्या से जूझ रहा है। बड़े भाषा मॉडल कोड लिख सकते हैं और दस्तावेजों को सारांशित कर सकते हैं, लेकिन वे उन कार्यों में बेहद खराब हैं जिनके लिए भौतिकी, स्थानिक तर्क, या वस्तुओं की बातचीत को समझने की आवश्यकता होती है। यह रोबोटिक्स, स्वायत्त वाहनों और औद्योगिक स्वचालन के लिए एक डीलब्रेकर है – ऐसे अनुप्रयोग जो संभावित बाजार मूल्य में खरबों का प्रतिनिधित्व करते हैं।
शेंगशू का उत्तर वह है जिसे शोधकर्ता “विश्व मॉडल” कहते हैं – एआई सिस्टम को यह भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है कि किए गए कार्यों के आधार पर भौतिक वातावरण कैसे बदल जाएगा। किसी वाक्य में अगले शब्द की भविष्यवाणी करने के बजाय, ये मॉडल वास्तविकता के अगले फ्रेम की भविष्यवाणी करते हैं। यदि रोबोट का हाथ कप को धक्का देता है, तो मॉडल समझ जाता है कि यह पलट जाएगा, दूर नहीं तैरेगा। पारंपरिक एलएलएम के लिए उस तरह की सामान्य ज्ञान भौतिकी को समझ पाना लगभग असंभव साबित हुआ है।
स्टार्टअप, जो विदु नाम से भी संचालित होता है, अपने सामान्य विश्व मॉडल प्लेटफॉर्म को बढ़ाने के लिए पूंजी का उपयोग करने की योजना बना रहा है। कंपनी के पिछले बयानों के अनुसार, प्रौद्योगिकी का उद्देश्य रोबोटों के लिए मूलभूत बुनियादी ढांचे के रूप में काम करना है जो निरंतर मानव पर्यवेक्षण के बिना असंरचित वातावरण – गोदामों, घरों, निर्माण स्थलों – में काम कर सकते हैं।
अलीबाबा क्लाउड की भागीदारी सिर्फ वित्तीय नहीं है। साझेदारी शेंगशू को बड़े पैमाने पर कम्प्यूटेशनल संसाधनों और चीन के तेजी से बढ़ते विनिर्माण क्षेत्र में एक वितरण चैनल तक पहुंच प्रदान करती है, जहां श्रम की कमी रोबोटिक्स को अपनाने में तेजी ला रही है। अलीबाबा के लिए, यह प्रतिस्पर्धियों की तरह एक रणनीतिक बचाव है ओपनएआई और गूगल टेक्स्ट, छवियों और वीडियो को मिश्रित करने वाले मल्टीमॉडल मॉडल को दोगुना करें।
यह समय एलएलएम अधिकतमवाद के बारे में व्यापक उद्योग संदेह को दर्शाता है। जबकि कंपनियां पसंद करती हैं ओपनएआई भाषा मॉडल को बढ़ाना जारी रखें, एक बढ़ते गुट का मानना है कि कृत्रिम सामान्य बुद्धि के मार्ग के लिए भौतिक वास्तविकता में एआई को आधार बनाना आवश्यक है। यहीं पर विश्व मॉडल आते हैं – उन्हें कारण और प्रभाव दिखाने वाले वीडियो डेटा पर प्रशिक्षित किया जाता है, भाषा के बजाय अवलोकन के माध्यम से भौतिकी के नियमों को सीखा जाता है।
कई अच्छी तरह से वित्त पोषित प्रयास समानांतर रूप से दौड़ रहे हैं। टेस्ला ने अपने सेल्फ-ड्राइविंग सिस्टम को अरबों मील के वीडियो पर प्रशिक्षित विश्व मॉडल के रूप में वर्णित किया है। एआई शोधकर्ता यान लेकुन ने वर्षों से तर्क दिया है कि विश्व मॉडल, एलएलएम नहीं, मानव-स्तर एआई के लिए आवश्यक महत्वपूर्ण सफलता का प्रतिनिधित्व करते हैं। अब पूंजी समान दांव लगाने वाले स्टार्टअप्स में प्रवाहित हो रही है।
$290 मिलियन के राउंड का मूल्य शेंगशु का सामान्य सीरीज बी सौदों से काफी अधिक है, हालांकि सटीक मूल्यांकन का खुलासा नहीं किया गया था। यह प्रीमियम विश्व मॉडल के निर्माण की तकनीकी कठिनाई और यदि प्रौद्योगिकी प्रदान करती है तो बड़े पैमाने पर बाजार के अवसर दोनों को दर्शाती है। मैकिन्से का अनुमान है कि भौतिक एआई 2030 तक वार्षिक आर्थिक मूल्य में $4 ट्रिलियन को अनलॉक कर सकता है, मुख्य रूप से विनिर्माण और लॉजिस्टिक्स स्वचालन के माध्यम से।
लेकिन चुनौतियाँ महत्वपूर्ण बनी हुई हैं। विश्व मॉडलों को भारी मात्रा में उच्च गुणवत्ता वाले वीडियो प्रशिक्षण डेटा और कम्प्यूटेशनल शक्ति की आवश्यकता होती है जो बड़े भाषा मॉडल प्रशिक्षण को भी बौना बना देती है। उन्हें अनगिनत भौतिक परिदृश्यों में सामान्यीकरण करने की भी आवश्यकता है – एक गोदाम लेआउट में प्रशिक्षित रोबोट को दूसरे में बिना दोबारा प्रशिक्षण के काम करना चाहिए। शेंगशू को यह साबित करने की आवश्यकता होगी कि उसका दृष्टिकोण नियंत्रित डेमो से आगे बढ़ सकता है।
अलीबाबाका दांव तेजी से विभाजित होते वैश्विक एआई परिदृश्य को भी उजागर करता है। जहां अमेरिकी कंपनियां फाउंडेशन मॉडल पर हावी हैं, वहीं चीनी कंपनियां स्पष्ट वाणिज्यिक रास्तों के साथ आक्रामक रूप से एप्लाइड एआई को वित्तपोषित कर रही हैं। रोबोटिक्स पर शेंगशु का ध्यान विनिर्माण को स्वचालित करने और विदेशी प्रौद्योगिकी पर निर्भरता कम करने की चीन की राष्ट्रीय रणनीति के साथ पूरी तरह से मेल खाता है।
निवेश तब आता है जब एलएलएम नेता भी सीमाएं स्वीकार करते हैं। ओपनएआई सीईओ सैम अल्टमैन ने हाल ही में कहा कि शुद्ध स्केलिंग से रिटर्न में कमी आ सकती है मेटा ने चुपचाप संसाधनों को सन्निहित एआई अनुसंधान की ओर स्थानांतरित कर दिया है। सवाल यह नहीं है कि क्या विश्व मॉडल मायने रखते हैं – सवाल यह है कि क्या उन्हें भारी पूंजी आवश्यकताओं को पूरा करने के लिए पर्याप्त रूप से विश्वसनीय रूप से बनाया जा सकता है।
अभी के लिए, अलीबाबा एक बड़ा दांव लगा रहा है कि उत्तर हाँ है। 290 मिलियन डॉलर का निवेश शेंगशू रनवे को यह साबित करने के लिए देता है कि एआई की अगली सफलता बेहतर पाठ भविष्यवाणी से नहीं आएगी, बल्कि उन मशीनों से होगी जो अंततः उस भौतिक दुनिया को समझती हैं जिसे मनुष्य हर दिन नेविगेट करते हैं।
शेंगशु पर अलीबाबा का 290 मिलियन डॉलर का दांव सिर्फ एक और एआई फंडिंग दौर से कहीं अधिक का प्रतिनिधित्व करता है – यह एक संकेत है कि उद्योग का गुरुत्वाकर्षण केंद्र भाषा से भौतिक समझ की ओर स्थानांतरित हो रहा है। एलएलएम की क्षमता में पठार के रूप में, एआई बनाने की दौड़ जारी है जो गन्दी, अप्रत्याशित वास्तविक दुनिया को नेविगेट कर सकती है। यह देखा जाना बाकी है कि विश्व मॉडल उस वादे को पूरा करते हैं या नहीं, लेकिन क्षेत्र में आने वाली पूंजी से पता चलता है कि सबसे चतुर निवेशक मानते हैं कि हम एआई विकास के एक नए चरण में प्रवेश कर रहे हैं। अब सवाल यह है कि क्या शेंगशु जैसे स्टार्टअप संदेह की अगली लहर आने से पहले प्रचार को उचित ठहराने के लिए पर्याप्त तेज़ी से कार्यान्वित कर सकते हैं।









