एनवीडिया ब्लैकवेल पहले एजेंट एआई बेंचमार्क पर हावी है

NVIDIA बस एजेंटिक एआई इंफ्रास्ट्रक्चर के लिए मानक निर्धारित करें। कंपनी के ब्लैकवेल अल्ट्रा एनवीएल72 प्लेटफॉर्म ने एआई एजेंटों के लिए पहले उद्योग-मानक बेंचमार्क को कुचल दिया, पिछली पीढ़ी के सिस्टम की तुलना में प्रति मेगावाट 20 गुना अधिक एजेंट प्रदान किए। ऐसे उद्यमों के साथ जो जटिल कार्यों की योजना बना सकते हैं, तर्क कर सकते हैं और निष्पादित कर सकते हैं, स्वायत्त एआई सिस्टम को तैनात करने के लिए दौड़ रहे हैं, कृत्रिम विश्लेषण का यह बेंचमार्क उन्हें बुनियादी ढांचे के निर्णयों के लिए उनकी पहली सेब-से-सेब तुलना देता है – और एनवीडिया के प्रतिद्वंद्वियों को पकड़ने के लिए संघर्ष करना पड़ता है।

NVIDIA अभी-अभी उद्यमों को एजेंटिक एआई बुनियादी ढांचे को मापने के लिए उनका पहला वास्तविक पैमाना दिया गया है – और तुरंत इसमें शीर्ष पर पहुंच गया। चिप निर्माता का ब्लैकवेल अल्ट्रा NVL72 प्लेटफॉर्म AgentPerf से आगे है, जो एक नया बेंचमार्क है कृत्रिम विश्लेषण यह मापता है कि सिस्टम स्वायत्त बहु-चरणीय तर्क में सक्षम एआई एजेंटों को कितनी अच्छी तरह संभालते हैं।

नतीजे इससे बेहतर समय पर नहीं आ सके. जबकि एआई प्रचार चक्र में चैटबॉट्स और इमेज जेनरेटर का वर्चस्व है, उद्यम चुपचाप बजट को एजेंटिक एआई की ओर स्थानांतरित कर रहे हैं – सिस्टम जो न केवल संकेतों का जवाब देते हैं बल्कि रणनीतियों की योजना बना सकते हैं, टूल का उपयोग कर सकते हैं और मानव सहायता के बिना जटिल वर्कफ़्लो निष्पादित कर सकते हैं। एआई के बारे में सोचें जो आपके ईमेल को पढ़ने के बाद आपकी बैठकों को शेड्यूल करता है, विक्रेताओं के साथ बातचीत करता है, या परीक्षण वातावरण को स्पिन करके और समाधानों के माध्यम से पुनरावृत्ति करके कोड को डीबग करता है।

के अनुसार एनवीडिया का ब्लॉग पोस्टब्लैकवेल अल्ट्रा एनवीएल72 एनवीडिया के अपने पिछली पीढ़ी के हार्डवेयर की तुलना में प्रति मेगावाट 20 गुना अधिक एजेंट चलाता है। वह दक्षता छलांग मायने रखती है क्योंकि एजेंटिक एआई क्रूरतापूर्वक गणना-गहन है। एक चैटबॉट के विपरीत जो एक ही प्रतिक्रिया देता है, एजेंट दर्जनों या सैकड़ों अनुमान कॉल करते हैं क्योंकि वे समस्याओं, क्वेरी डेटाबेस के माध्यम से तर्क करते हैं और अपने दृष्टिकोण को परिष्कृत करते हैं।

बेंचमार्क वास्तविक दुनिया के उन परिदृश्यों का परीक्षण करता है जिनकी उद्यम वास्तव में परवाह करते हैं – ग्राहक सेवा एजेंट जो कई प्रणालियों में रिटर्न और शिकायतों को संभालते हैं, कोडिंग सहायक जो सॉफ्टवेयर लिखते और परीक्षण करते हैं, और व्यवसाय प्रक्रिया एजेंट जो विभागों के बीच समन्वय करते हैं। पिछले AI बेंचमार्क ने संकीर्ण कार्यों पर कच्ची गति या सटीकता को मापा, लेकिन AgentPerf एंड-टू-एंड प्रदर्शन का मूल्यांकन करता है क्योंकि एजेंट कई टूल और निर्णय बिंदुओं को जोड़ते हैं।

Pixel 10a, 20 यूरो से कम कीमत पर टैरिफ और भुगतान

यहां एनवीडिया का प्रभुत्व आश्चर्यजनक नहीं है, क्योंकि कंपनी एआई एक्सेलेरेटर बाजार के लगभग 90% हिस्से को नियंत्रित करती है, लेकिन अपने पिछले चिप्स की तुलना में 20 गुना दक्षता हासिल करने से पता चलता है कि कंपनी का प्रदर्शन कितना आक्रामक है। ब्लैकवेल आर्किटेक्चर, जिसने इस साल की शुरुआत में चुनिंदा ग्राहकों के लिए शिपिंग शुरू की थी, विशेष रूप से रैपिड-फायर अनुमान कॉल एजेंटिक वर्कफ़्लो की मांग के लिए डिज़ाइन किए गए वास्तुशिल्प सुधारों को पैक करता है।

जैसे क्लाउड प्रदाताओं के लिए अमेज़न वेब सेवाएँ, माइक्रोसॉफ्ट एज़्योरऔर गूगल क्लाउडये नतीजे अगले 18 महीनों के लिए बुनियादी ढांचे की योजना को आगे बढ़ाएंगे। तीनों ब्लैकवेल चिप्स का भंडार कर रहे हैं, और यह बेंचमार्क उन्हें उद्यम ग्राहकों के लिए एजेंटिक एआई क्षमताओं को पेश करने के लिए गोला-बारूद देता है, जो प्रौद्योगिकी के पैमाने के प्रमाण के इंतजार में किनारे पर बैठे हैं।

बिजली दक्षता कोण महत्वपूर्ण है. डेटा केंद्र पहले से ही एआई की ऊर्जा मांगों से जूझ रहे हैं, और एजेंट उस चुनौती को बढ़ा देते हैं क्योंकि वे कभी-कभार पूछे जाने वाले प्रश्नों का उत्तर देने के बजाय लगातार चलते रहते हैं। एनवीडिया की 20 गुना अधिक एजेंटों को एक ही पावर लिफाफे में रखने की क्षमता का मतलब है कि उद्यम अपने बिजली बिल या कार्बन फुटप्रिंट को बढ़ाए बिना एजेंट बेड़े को तैनात कर सकते हैं।

एजेंटपर्फ के पीछे की कंपनी आर्टिफिशियल एनालिसिस 2023 से डेवलपर्स के लिए एआई मॉडल के प्रदर्शन और मूल्य निर्धारण पर नज़र रख रही है। नया बेंचमार्क एक अंतर को भरता है क्योंकि उद्यम प्रूफ-ऑफ-कॉन्सेप्ट चैटबॉट से आगे बढ़कर प्रोडक्शन एजेंट तैनाती की ओर बढ़ते हैं। मानकीकृत मेट्रिक्स के बिना, बुनियादी ढांचे के विकल्पों की तुलना करते समय कंपनियां आंखें मूंद लेती थीं – अक्सर तैनाती के बाद ही पता चलता है कि सिस्टम एजेंट के कार्यभार को कुशलतापूर्वक संभाल नहीं सकता है।

समय व्यापक उद्योग बदलाव के अनुरूप है। ओपनएआई अपने नवीनतम मॉडलों में एजेंट क्षमताओं को आगे बढ़ा रहा है, anthropic उन्नत टूल उपयोग के साथ क्लाउड जारी किया, और माइक्रोसॉफ्ट अपने कोपायलट पारिस्थितिकी तंत्र में स्वायत्त एजेंटों को एम्बेड कर रहा है। उद्यमों को बुनियादी ढांचे की आवश्यकता होती है जो गति बनाए रख सके, और यह बेंचमार्क उन्हें विकल्पों के मूल्यांकन के लिए एक आम भाषा देता है।

परिणाम जो नहीं दिखाते वह है मूल्य निर्धारण। एनवीडिया ने यह खुलासा नहीं किया है कि ब्लैकवेल अल्ट्रा एनवीएल72 की कीमत क्या है, हालांकि उद्योग का अनुमान है कि पूर्ण सिस्टम की कीमत $300,000 से $500,000 है। वॉल्यूम पर खरीदारी करने वाले हाइपरस्केलर्स के लिए, 20x दक्षता लाभ संभवतः प्रीमियम को उचित ठहराता है। छोटे उद्यमों के लिए, सवाल यह बन जाता है कि क्या ऑन-प्रिमाइस बुनियादी ढांचे का निर्माण किया जाए या क्लाउड प्रदाताओं से क्षमता किराए पर ली जाए, जो अंततः दक्षता बचत के साथ आगे बढ़ेंगे।

स्पेसएक्स का विशाल आईपीओ: सभी नवीनतम समाचार

प्रतिस्पर्धी अभी भी खड़े नहीं हैं. एएमडी एआई वर्कलोड के लिए अपनी एमआई300 श्रृंखला पर जोर दे रहा है, जबकि सेरेब्रस और ग्रोक जैसे स्टार्टअप अनुमान के लिए अनुकूलित वैकल्पिक आर्किटेक्चर पेश कर रहे हैं। लेकिन एनवीडिया का सॉफ्टवेयर मोट – सीयूडीए इकोसिस्टम और अब एजेंट-विशिष्ट अनुकूलन – प्रतिद्वंद्वियों के लिए कच्चे हार्डवेयर स्पेक्स से मेल खाने पर भी उन्हें पकड़ना बेहद कठिन बना देता है।

एनवीडिया की बेंचमार्क जीत उसके प्रतिनिधित्व से कम मायने रखती है – उद्योग के पास अंततः बुनियादी ढांचे को मापने के लिए मानक हैं जो एआई के अगले विकास को शक्ति प्रदान करते हैं। जैसे-जैसे उद्यम प्रायोगिक चैटबॉट से ग्राहक सेवा, कोडिंग और व्यवसाय स्वचालन को संभालने वाले उत्पादन एजेंट की तैनाती में स्थानांतरित होते हैं, उन्हें बुनियादी ढांचे के निवेश को उचित ठहराने के लिए डेटा की आवश्यकता होती है। AgentPerf उन्हें वह आधार देता है, जबकि Nvidia की 20x दक्षता छलांग ऐसी गति निर्धारित करती है जिससे प्रतिद्वंद्वी मुकाबला करने के लिए संघर्ष करेंगे। वास्तविक प्रतिस्पर्धा अब शुरू होती है, क्योंकि एएमडी, स्टार्टअप और क्लाउड प्रदाता यह साबित करने के लिए दौड़ रहे हैं कि वे प्रतिस्पर्धी अर्थशास्त्र में तुलनीय एजेंट प्रदर्शन प्रदान कर सकते हैं। 2026 एआई बजट की योजना बनाने वाले उद्यमों के लिए, ये बेंचमार्क पढ़ना आवश्यक हो गया है।