लॉड इंस्टीट्यूट ने एआई की सबसे जटिल समस्याओं में से एक को लक्षित करते हुए, स्लिंगशॉट्स अनुदान का अपना पहला बैच जारी कर दिया है: वास्तव में यह कैसे मापें कि ये सिस्टम क्या कर सकते हैं। त्वरक कार्यक्रम एआई मूल्यांकन पर केंद्रित 15 परियोजनाओं का समर्थन कर रहा है, जो उस तरह की गणना शक्ति और इंजीनियरिंग सहायता प्रदान करता है जिसका अधिकांश अकादमिक शोधकर्ता केवल सपना देख सकते हैं।
लाउड इंस्टीट्यूट अभी-अभी अपने पहले स्लिंगशॉट्स कार्यक्रम के साथ एआई मूल्यांकन क्षेत्र में एक प्रमुख भूमिका निभाई है, और समय इससे अधिक महत्वपूर्ण नहीं हो सकता है। जैसे-जैसे हर क्षेत्र में एआई क्षमताएं बढ़ रही हैं, उद्योग एक बुनियादी सवाल से जूझ रहा है: आप वास्तव में कैसे मापेंगे कि ये सिस्टम क्या कर सकते हैं?
संस्थान ने की घोषणा 15 परियोजनाएं गुरुवार को, प्रत्येक एआई मूल्यांकन पहेली के विभिन्न टुकड़ों से निपट रहा है। पारंपरिक शैक्षणिक अनुदानों के विपरीत, जो शोधकर्ताओं को गणना संसाधनों के लिए संघर्ष करने के लिए मजबूर करते हैं, स्लिंगशॉट्स पूर्ण पैकेज प्रदान करता है – फंडिंग, बड़े पैमाने पर गणना शक्ति और समर्पित इंजीनियरिंग समर्थन जो अधिकांश विश्वविद्यालय प्रयोगशालाओं को ईर्ष्यालु बना देगा।
शिकार? प्राप्तकर्ताओं को कुछ ठोस देने की आवश्यकता है, चाहे वह स्टार्टअप हो, ओपन-सोर्स कोड हो, या कोई अन्य मूर्त कलाकृति हो। यह एक हाइब्रिड मॉडल है जो अकादमिक अनुसंधान और सिलिकॉन वैली की तेजी से आगे बढ़ने की मानसिकता के बीच अंतर को पाटता है।
एआई विकास का अनुसरण करने वाले किसी भी व्यक्ति के लिए समूह की कई परियोजनाओं की घंटी बजनी चाहिए। टर्मिनल बेंच अपने कमांड-लाइन कोडिंग बेंचमार्क के साथ वापस आ गया है, जबकि एआरसी-एजीआई परियोजना सार्थक एजीआई परीक्षण बनाने के लिए अपनी लंबे समय से चल रही खोज जारी रखी है।
लेकिन वास्तव में दिलचस्प कार्रवाई नए तरीकों के साथ हो रही है। फॉर्मूला कोड, कैलटेक और यूटी ऑस्टिन शोधकर्ताओं के बीच एक सहयोग, विशेष रूप से एआई एजेंटों के कोड अनुकूलन कौशल के लिए मूल्यांकन का निर्माण कर रहा है। इस बीच, कोलंबिया का बिज़बेंच “व्हाइट-कॉलर एआई एजेंटों” के लिए व्यापक बेंचमार्क बनाना चाहता है – वह प्रकार जो जल्द ही आपकी व्यय रिपोर्ट या ग्राहक ईमेल को संभाल सकता है।
स्टार पावर सिर्फ परियोजनाओं से परे फैली हुई है। SWE-बेंच सह-संस्थापक जॉन बोडा यांग कोडक्लैश का नेतृत्व कर रहे हैं, जो एक गतिशील प्रतिस्पर्धा-आधारित ढांचा है जो एआई कोड मूल्यांकन में उनकी पिछली सफलता पर आधारित है। यांग उस चीज़ के बारे में चिंतित हैं जिसके कारण पूरे उद्योग को रात में जागना पड़ेगा: बेंचमार्क साझा वैज्ञानिक मानकों के बजाय मालिकाना कंपनी उपकरण बन रहे हैं।
यांग ने बताया, “मुझे लगता है कि लोग मुख्य तृतीय-पक्ष बेंचमार्क पर मूल्यांकन करना जारी रखते हैं जिससे प्रगति होती है।” टेकक्रंच. “मैं ऐसे भविष्य को लेकर थोड़ा चिंतित हूं जहां बेंचमार्क सिर्फ कंपनियों के लिए विशिष्ट हो जाएंगे।”








