रीइनफोर्समेंट लर्निंग के केंद्र में आने से Google ने NeurIPS में बढ़त हासिल की है

स्पोर्ट-स्ट्रीमिंग-डीएजेडएन और डीएफएल लाइवटीवी.एसएक्स गेम
  • सुदृढीकरण सीखना न्यूरआईपीएस 2025 में प्रमुख विषय के रूप में उभरा, उद्योग जगत के नेताओं ने इसे पारंपरिक स्केलिंग दृष्टिकोण पर ‘अगली सीमा’ घोषित किया।

  • गूगल कई उपस्थित लोगों के अनुसार, डीपमाइंड ‘अच्छा महसूस कर रहा है’, कंपनी स्वीकृत कागजात में अग्रणी है और नए शोध एजेंडा को आगे बढ़ा रही है

  • सम्मेलन अकादमिक मामले से बड़े पैमाने पर उद्योग भर्ती मैदान में विकसित हुआ है, जो केवल आमंत्रित क्रूज़ पार्टियों और मिशेलिन-तारांकित रात्रिभोज के साथ पूरा हुआ है।

  • उद्योग की सर्वसम्मति से पता चलता है कि ‘अनुसंधान के युग’ ने एआई उन्नति के लिए शुद्ध डेटा स्केलिंग पर ध्यान केंद्रित करने की जगह ले ली है

    यूके कंसोर्टियम संलयन ऊर्जा वितरित करेगा

गूगल अपना पल बिता रहा है. सैन डिएगो में इस साल के न्यूरआईपीएस सम्मेलन में, खोज दिग्गज एआई प्रयोगशालाओं के बीच स्पष्ट विजेता के रूप में उभरे, जबकि सुदृढीकरण सीखने ने भविष्य के बारे में बातचीत पर हावी रही। उद्योग की सबसे बड़ी शैक्षणिक सभा एक उच्च-स्तरीय नेटवर्किंग कार्यक्रम में तब्दील हो गई है, जहां एआई सफलताओं की अगली लहर पर क्रूज जहाजों पर कॉकटेल पर बहस होती है।

यह फैसला एआई के साल के सबसे बड़े सप्ताह में आया है। गूगल डीपमाइंड उच्च स्तर पर है, जबकि सुदृढीकरण सीखने ने आधिकारिक तौर पर न्यूरआईपीएस 2025 में पारंपरिक स्केलिंग दृष्टिकोण से स्पॉटलाइट चुरा लिया है। 1987 में एक विशुद्ध रूप से अकादमिक सम्मेलन के रूप में शुरू हुआ उद्योग के सबसे महत्वपूर्ण नेटवर्किंग युद्ध के मैदान में बदल गया है, जहां एआई का भविष्य अनुसंधान प्रस्तुतियों और नौका पार्टियों के बीच उलझा हुआ है। सैन डिएगो सम्मेलन के अंदर से कई स्रोत एक विभक्ति बिंदु पर एक उद्योग की तस्वीर चित्रित करते हैं गूगल प्रतिस्पर्धियों से आगे निकलना और विशेष मॉडल प्रशिक्षण की ओर एक मौलिक बदलाव गति पकड़ रहा है। ‘Google DeepMind अच्छा महसूस कर रहा है,’ के सह-संस्थापक थॉमस वुल्फ आलिंगन करता हुआ चेहराबताया द वर्ज के एलेक्स हीथ. जैसा कि उपस्थित लोगों ने बताया, यह भावना पूरे सप्ताह गूंजती रही गूगल का स्वीकृत कागजातों में प्रभुत्व और ‘सिर्फ बड़े ट्रांसफार्मर के बजाय निरंतर, दीर्घकालिक स्मृति’ की ओर उनका दबाव। लेकिन यह सुदृढीकरण सीखना है जिसने उद्योग की कल्पना पर कब्जा कर लिया है। एलएमएरिना के सीईओ अनास्तासियोस एंजेलोपोलोस ने घोषणा की, ‘आरएल आरएल आरएल आरएल दुनिया पर कब्ज़ा कर रहा है।’ शोधकर्ताओं, इंजीनियरों और संस्थापकों के बीच आम सहमति से पता चलता है कि उद्योग केवल पूर्व-प्रशिक्षण पर अधिक डेटा फेंकने के बजाय विशिष्ट उपयोग के मामलों के लिए मॉडल ट्यूनिंग के आसपास एकजुट हो रहा है। यह पिछले कुछ वर्षों में बड़े पैमाने पर हुए युद्धों से एक भूकंपीय बदलाव का प्रतिनिधित्व करता है। यह परिवर्तन उस चीज़ को दर्शाता है जिसे कई लोग ‘अनुसंधान का युग’ कह रहे हैं – यह शब्द किसके द्वारा गढ़ा गया है ओपनएआई सह-संस्थापक इल्या सुतस्केवर को व्यापक स्वीकृति मिली है। एआई के लिए एलन इंस्टीट्यूट के नाथन लैम्बर्ट ने बताया कि डीपसीक आर1 के बाद यह पहला न्यूरिप्स था और ‘खुले मॉडल परिवर्तन का एक वर्ष’ था, जो बंद-मॉडल प्रभुत्व से एक स्पष्ट प्रस्थान का प्रतीक था। जबकि गूगल जश्न मनाता है, अन्य प्रयोगशालाओं को मिश्रित भाग्य का सामना करना पड़ता है। एकाधिक उपस्थित लोगों ने सुझाव दिया ओपनएआई और एंथ्रोपिक मजबूत बने हुए हैं लेकिन प्रतिस्पर्धी परिदृश्य तेजी से बदल रहा है। लैंबर्ट ने कहा, ‘मिथुन और एंथ्रोपिक ओपनएआई की कीमत पर प्रबल हैं,’ हालांकि उन्होंने कहा कि एलोन मस्क की हाई-प्रोफाइल भागीदारी के बावजूद एक्सएआई ने बातचीत में मुश्किल से ही पंजीकरण कराया है। एक उद्योग तमाशे में सम्मेलन का परिवर्तन शायद इसके पार्टी सर्किट में सबसे अधिक स्पष्ट था। केवल-आमंत्रित मॉडल शिप क्रूज़ ने 200 शीर्ष शोधकर्ताओं, निवेशकों और एआई हस्तियों की मेजबानी की, जिसे आयोजकों ने ‘डांस फ्लोर के प्रति प्रतिबद्धता’ कहा जो एक सम्मेलन कार्यक्रम में अभूतपूर्व है। इस बीच, लॉड लाउंज ने जेफ डीन और योशुआ बेंगियो सहित दिग्गजों को आकर्षित किया