लॉड इंस्टीट्यूट ने एआई मूल्यांकन के लिए स्लिंगशॉट्स अनुदान लॉन्च किया

लॉड इंस्टीट्यूट ने एआई की सबसे जटिल समस्याओं में से एक को लक्षित करते हुए, स्लिंगशॉट्स अनुदान का अपना पहला बैच जारी कर दिया है: वास्तव में यह कैसे मापें कि ये सिस्टम क्या कर सकते हैं। त्वरक कार्यक्रम एआई मूल्यांकन पर केंद्रित 15 परियोजनाओं का समर्थन कर रहा है, जो उस तरह की गणना शक्ति और इंजीनियरिंग सहायता प्रदान करता है जिसका अधिकांश अकादमिक शोधकर्ता केवल सपना देख सकते हैं।

लाउड इंस्टीट्यूट अभी-अभी अपने पहले स्लिंगशॉट्स कार्यक्रम के साथ एआई मूल्यांकन क्षेत्र में एक प्रमुख भूमिका निभाई है, और समय इससे अधिक महत्वपूर्ण नहीं हो सकता है। जैसे-जैसे हर क्षेत्र में एआई क्षमताएं बढ़ रही हैं, उद्योग एक बुनियादी सवाल से जूझ रहा है: आप वास्तव में कैसे मापेंगे कि ये सिस्टम क्या कर सकते हैं?

संस्थान ने की घोषणा 15 परियोजनाएं गुरुवार को, प्रत्येक एआई मूल्यांकन पहेली के विभिन्न टुकड़ों से निपट रहा है। पारंपरिक शैक्षणिक अनुदानों के विपरीत, जो शोधकर्ताओं को गणना संसाधनों के लिए संघर्ष करने के लिए मजबूर करते हैं, स्लिंगशॉट्स पूर्ण पैकेज प्रदान करता है – फंडिंग, बड़े पैमाने पर गणना शक्ति और समर्पित इंजीनियरिंग समर्थन जो अधिकांश विश्वविद्यालय प्रयोगशालाओं को ईर्ष्यालु बना देगा।

अदालत में मेटा की ऐतिहासिक हानि की कीमत $375 मिलियन से अधिक हो सकती है

शिकार? प्राप्तकर्ताओं को कुछ ठोस देने की आवश्यकता है, चाहे वह स्टार्टअप हो, ओपन-सोर्स कोड हो, या कोई अन्य मूर्त कलाकृति हो। यह एक हाइब्रिड मॉडल है जो अकादमिक अनुसंधान और सिलिकॉन वैली की तेजी से आगे बढ़ने की मानसिकता के बीच अंतर को पाटता है।

एआई विकास का अनुसरण करने वाले किसी भी व्यक्ति के लिए समूह की कई परियोजनाओं की घंटी बजनी चाहिए। टर्मिनल बेंच अपने कमांड-लाइन कोडिंग बेंचमार्क के साथ वापस आ गया है, जबकि एआरसी-एजीआई परियोजना सार्थक एजीआई परीक्षण बनाने के लिए अपनी लंबे समय से चल रही खोज जारी रखी है।

लेकिन वास्तव में दिलचस्प कार्रवाई नए तरीकों के साथ हो रही है। फॉर्मूला कोड, कैलटेक और यूटी ऑस्टिन शोधकर्ताओं के बीच एक सहयोग, विशेष रूप से एआई एजेंटों के कोड अनुकूलन कौशल के लिए मूल्यांकन का निर्माण कर रहा है। इस बीच, कोलंबिया का बिज़बेंच “व्हाइट-कॉलर एआई एजेंटों” के लिए व्यापक बेंचमार्क बनाना चाहता है – वह प्रकार जो जल्द ही आपकी व्यय रिपोर्ट या ग्राहक ईमेल को संभाल सकता है।

स्टार पावर सिर्फ परियोजनाओं से परे फैली हुई है। SWE-बेंच सह-संस्थापक जॉन बोडा यांग कोडक्लैश का नेतृत्व कर रहे हैं, जो एक गतिशील प्रतिस्पर्धा-आधारित ढांचा है जो एआई कोड मूल्यांकन में उनकी पिछली सफलता पर आधारित है। यांग उस चीज़ के बारे में चिंतित हैं जिसके कारण पूरे उद्योग को रात में जागना पड़ेगा: बेंचमार्क साझा वैज्ञानिक मानकों के बजाय मालिकाना कंपनी उपकरण बन रहे हैं।

अदालत में मेटा की ऐतिहासिक हानि की कीमत $375 मिलियन से अधिक हो सकती है

यांग ने बताया, “मुझे लगता है कि लोग मुख्य तृतीय-पक्ष बेंचमार्क पर मूल्यांकन करना जारी रखते हैं जिससे प्रगति होती है।” टेकक्रंच. “मैं ऐसे भविष्य को लेकर थोड़ा चिंतित हूं जहां बेंचमार्क सिर्फ कंपनियों के लिए विशिष्ट हो जाएंगे।”