NVIDIA अभी-अभी सीपीयू बाजार में अपना पहला गंभीर खेल शुरू किया है, और यह एआई में सबसे लोकप्रिय खंड को लक्षित कर रहा है। कंपनी ने अपने वेरा सीपीयू की डिलीवरी शुरू की anthropic, ओपनएआईस्पेसएक्सएआई, और ओरेकल क्लाउड इंफ्रास्ट्रक्चर इस सप्ताह, अपने GPU प्रभुत्व से परे एक रणनीतिक विस्तार को चिह्नित करते हुए। एआई एजेंट वर्कलोड के लिए विशेष रूप से निर्मित, वेरा एनवीडिया के दावे का संकेत देता है कि स्वायत्त एआई सिस्टम को आज के प्रशिक्षण-केंद्रित हार्डवेयर की तुलना में मौलिक रूप से अलग सिलिकॉन की आवश्यकता होती है।
NVIDIA एआई एजेंट बुनियादी ढांचे के बाजार पर कब्ज़ा करने के लिए प्रतिस्पर्धियों का इंतज़ार नहीं किया जा रहा है। चिप दिग्गज ने इस सप्ताह एआई उद्योग के सबसे प्रभावशाली खिलाड़ियों को अपना पहला वेरा सीपीयू वितरित करना शुरू किया, हाइपरस्केल और हाई-परफॉर्मेंस कंप्यूटिंग के उपाध्यक्ष इयान बक ने व्यक्तिगत रूप से इकाइयों को छोड़ दिया। anthropic सैन फ्रांसिस्को में, ओपनएआई मिशन बे में, और स्पेसएक्सएआई शुक्रवार को पालो ऑल्टो में। ओरेकल क्लाउड इंफ्रास्ट्रक्चर के अनुसार, सांता क्लारा में सोमवार को उनका प्राप्त हुआ एनवीडिया की घोषणा.
सफेद दस्ताने वाला उपचार यह संकेत देता है कि यह प्रक्षेपण कितना रणनीतिक है। जबकि एनवीडिया ने अपने एच100 और आगामी ब्लैकवेल जीपीयू के साथ एआई प्रशिक्षण पर अपना दबदबा कायम रखा है, सीपीयू बाजार मजबूती से बना हुआ है इंटेल और एएमडीका क्षेत्र. वेरा उस कार्यभार को लक्षित करके उस समीकरण को बदल देता है जिसके लिए पदधारी अनुकूलन नहीं कर रहे थे: एआई एजेंट जिन्हें तेजी से निर्णय लेने, मेमोरी को कुशलतापूर्वक प्रबंधित करने और एक साथ कई कार्यों का समन्वय करने की आवश्यकता होती है।
ग्राहक सूची आपको सब कुछ बताती है कि एआई बाज़ार किस ओर जा रहा है। एंथ्रोपिक के क्लाउड और ओपनएआई के जीपीटी मॉडल पहले से ही पावरिंग एजेंट फ्रेमवर्क हैं जो स्वायत्त रूप से वेब ब्राउज़ करते हैं, कोड लिखते हैं और जटिल वर्कफ़्लो प्रबंधित करते हैं। स्पेसएक्सएआई, एलोन मस्क का नवीनतम एआई उद्यम, आगे बढ़ने के लिए दौड़ रहा है। इन तीनों को बुनियादी ढांचे की आवश्यकता है जो न्यूनतम विलंबता के साथ बड़े पैमाने पर अनुमान को संभाल सके, न कि केवल क्रूर-बल प्रशिक्षण थ्रूपुट को। यहीं पर सीपीयू आर्किटेक्चर मायने रखता है।
एनवीडिया इस कदम के बारे में महीनों से जानकारी दे रहा है। इसके दौरान जीटीसी सम्मेलन इस साल की शुरुआत में, सीईओ जेन्सेन हुआंग ने इस बात पर जोर दिया कि एजेंट वर्कलोड बड़े भाषा मॉडल के प्रशिक्षण की तुलना में “मौलिक रूप से अलग कंप्यूटिंग पैटर्न” का प्रतिनिधित्व करते हैं। एजेंट बड़े पैमाने पर मैट्रिक्स गुणन की तुलना में तर्क करने, संदर्भ पुनर्प्राप्त करने और टूल कॉल निष्पादित करने में अधिक समय व्यतीत करते हैं। Intel के Xeon लाइनअप या AMD के EPYC के पारंपरिक सर्वर CPU इन पैटर्न को ध्यान में रखकर नहीं बनाए गए थे।
वेरा की वास्तुकला कथित तौर पर कच्चे कोर गिनती पर मेमोरी बैंडविड्थ और कम-विलंबता इंटरकनेक्ट पर जोर देती है। यह तब समझ में आता है जब आपका प्राथमिक काम GPU त्वरक के बीच डेटा को बंद करना, वेक्टर डेटाबेस से जानकारी प्राप्त करना और मल्टी-स्टेप एजेंट कार्यों के नियंत्रण प्रवाह को प्रबंधित करना है। यह आपके विशिष्ट डेटाबेस या वेब सर्वर कार्यभार से भिन्न अनुकूलन लक्ष्य है।
ओरेकल डिलीवरी भी समान रूप से बता रही है। क्लाउड प्रदाता अपने एआई बुनियादी ढांचे की पेशकशों को अलग करने के लिए संघर्ष कर रहे हैं, और ओरेकल आक्रामक रूप से एआई स्टार्टअप्स को प्रोत्साहित कर रहा है प्रतिस्पर्धी मूल्य निर्धारण और कस्टम कॉन्फ़िगरेशन के साथ। वेरा तक शीघ्र पहुंच प्राप्त करने से उन्हें संभावित बढ़त मिलती है एडब्ल्यूएस, गूगल क्लाउडऔर माइक्रोसॉफ्ट एज़्योर उभरते एजेंट-ए-ए-सर्विस बाज़ार में।
यह एक सीधी चुनौती का भी प्रतिनिधित्व करता है AMD का इंस्टिंक्ट MI300Aजिसने विशेष रूप से एआई वर्कलोड के लिए सीपीयू और जीपीयू कोर को एक पैकेज पर संयोजित किया। एनवीडिया अब दोनों आयामों में प्रतिस्पर्धा कर रहा है, संभावित रूप से पूर्ण, लंबवत एकीकृत समाधान पेश करने के लिए वेरा को अपने अगली पीढ़ी के ब्लैकवेल जीपीयू के साथ बंडल कर रहा है। यह उन उद्यमों के लिए एक शक्तिशाली पिच है जो अपने संपूर्ण एआई स्टैक के लिए एक ही विक्रेता चाहते हैं।
एनवीडिया के लिए इससे बेहतर समय नहीं हो सकता। अधिकांश विश्लेषकों द्वारा छह महीने पहले की गई भविष्यवाणी की तुलना में एआई एजेंटों को अपनाने की गति तेजी से बढ़ रही है। कंपनियां अब केवल चैटबॉट्स के साथ प्रयोग नहीं कर रही हैं – वे ऐसे एजेंटों को तैनात कर रही हैं जो ग्राहक सेवा संभालते हैं, रिपोर्ट लिखते हैं, क्लाउड इंफ्रास्ट्रक्चर का प्रबंधन करते हैं और यहां तक कि कोड समीक्षा भी करते हैं। उन उत्पादन कार्यभारों को विश्वसनीय, कुशल बुनियादी ढांचे की आवश्यकता है, और उन्हें अभी इसकी आवश्यकता है।
लेकिन एनवीडिया को यहां असली प्रतिस्पर्धा का सामना करना पड़ता है। इंटेल का गौड़ी प्रोसेसर अनुमान कार्यभार के लिए बड़े पैमाने पर पहले से ही तैनात हैं, और कंपनी सख्त सीपीयू-त्वरक एकीकरण पर काम कर रही है। एएमडी अपने आरओसीएम सॉफ्टवेयर इकोसिस्टम पर भारी दांव लगा रहा है डेवलपर्स को एनवीडिया के CUDA लॉक-इन से दूर रखने के लिए। Google का TPU बुनियादी ढांचा अपनी स्वयं की AI सेवाओं की रीढ़ बनी हुई है और क्लाउड ग्राहकों के लिए उपलब्ध है।
आगे क्या होगा यह प्रदर्शन बेंचमार्क पर निर्भर करता है जो अभी तक प्रकाशित नहीं हुए हैं। क्या वेरा वास्तव में स्थापित विकल्पों की तुलना में एजेंट कार्यभार के लिए बेहतर मूल्य-प्रदर्शन प्रदान कर सकता है? ऑफ-द-शेल्फ ज़ीऑन या ईपीवाईसी प्रोसेसर का उपयोग करने की तुलना में यह एनवीडिया के जीपीयू लाइनअप के साथ कितनी अच्छी तरह एकीकृत है? और गंभीर रूप से, क्या एनवीडिया का सॉफ्टवेयर पारिस्थितिकी तंत्र वेरा को अनिवार्य बना देगा, या डेवलपर्स अधिक परिचित सीपीयू आर्किटेक्चर के साथ बने रहेंगे?
हाथ से वितरित इकाइयाँ संभवतः एकीकरण परीक्षण और बेंचमार्किंग के लिए पूर्व-उत्पादन नमूने हैं। यह उम्मीद न करें कि ये चिप्स अगले सप्ताह क्लाउड इंस्टेंस प्रकारों में दिखाई देंगे। लेकिन तथ्य यह है कि एनवीडिया सबसे उन्नत एआई एजेंट बनाने वाली कंपनियों को प्राथमिकता दे रही है, जिससे पता चलता है कि कंपनी क्या सोचती है कि बाजार किस ओर जा रहा है। अब प्रशिक्षण पर जीतना पर्याप्त नहीं है – असली पैसा अनुमानित बुनियादी ढांचे में है जो हजारों समवर्ती एजेंटों को कुशलतापूर्वक चला सकता है।
एनवीडिया का वेरा सीपीयू लॉन्च सिर्फ एक नई उत्पाद लाइन से कहीं अधिक का प्रतिनिधित्व करता है – यह एक रणनीतिक शर्त है कि एआई बुनियादी ढांचे को एजेंटों के लिए उद्देश्य से बनाया जाना चाहिए, न कि प्रशिक्षण हार्डवेयर से रेट्रोफिट किया जाना चाहिए। एजेंट विकास में सबसे आगे रहने वाली कंपनियों को लक्षित करके और ओरेकल जैसे क्लाउड प्रदाताओं के साथ साझेदारी करके, एनवीडिया खुद को पूर्ण स्टैक का मालिक बनाने की स्थिति में है क्योंकि उद्यम प्रायोगिक एआई से उत्पादन तैनाती की ओर बढ़ते हैं। अब सवाल यह है कि क्या इंटेल और एएमडी पर्याप्त तेजी से प्रतिक्रिया दे सकते हैं, या क्या एजेंट-अनुकूलित सिलिकॉन में एनवीडिया का पहला-प्रस्तावक लाभ इसके जीपीयू प्रभुत्व के रूप में टिकाऊ साबित होगा। एआई प्रयोगशालाओं और क्लाउड प्रदाताओं के लिए, वेरा का आगमन संकेत देता है कि बुनियादी ढांचा युद्ध एक नए चरण में प्रवेश कर रहा है – जहां अनुमान दक्षता और एजेंट समन्वय उतना ही मायने रखता है जितना कि कच्ची प्रशिक्षण शक्ति।









