फिजिकल इंटेलिजेंस का π0.7 रोबोट ब्रेन अनकहे कार्यों में महारत हासिल करता है

■

फिजिकल इंटेलिजेंस ने π0.7 लॉन्च किया, एक फाउंडेशन मॉडल जो रोबोटों को विशिष्ट प्रशिक्षण के बिना शून्य-शॉट सीखने के माध्यम से कार्य करने में सक्षम बनाता है
■

यह मॉडल सामान्य प्रयोजन रोबोटिक्स एआई की दिशा में प्रगति का प्रतीक है, जो प्राकृतिक भाषा प्रसंस्करण में किए गए बड़े भाषा मॉडल के संक्रमण को प्रतिबिंबित करता है
■

फिजिकल इंटेलिजेंस रोबोटिक्स क्षेत्र में एक हॉट स्टार्टअप के रूप में उभरा है, जो सार्वभौमिक रोबोट इंटेलिजेंस के अपने दृष्टिकोण के लिए महत्वपूर्ण उद्यम पूंजी को आकर्षित कर रहा है
■

सफलता अनुकूलनीय रोबोट बनाकर विनिर्माण, लॉजिस्टिक्स और होम ऑटोमेशन को नया आकार दे सकती है, जिन्हें कार्य-विशिष्ट प्रोग्रामिंग की आवश्यकता नहीं होती है

भौतिक बुद्धिसिलिकॉन वैली में सबसे ज्यादा देखे जाने वाले रोबोटिक्स स्टार्टअप्स में से एक, ने हाल ही में π0.7 का अनावरण किया – एक फाउंडेशन मॉडल जो भौतिक कार्यों के माध्यम से तर्क कर सकता है जिसे निष्पादित करने के लिए इसे कभी भी स्पष्ट रूप से प्रशिक्षित नहीं किया गया था। यह सफलता दर्शाती है कि कंपनी रोबोटिक्स उद्योग की पवित्र कब्र की ओर “एक प्रारंभिक लेकिन सार्थक कदम” कहती है: एक सामान्य प्रयोजन वाला रोबोट मस्तिष्क जो किसी भी वातावरण के अनुकूल होने में सक्षम है। शीर्ष स्तरीय निवेशकों और एआई दिग्गजों की एक टीम के समर्थन से, फिजिकल इंटेलिजेंस यह शर्त लगा रहा है कि बड़े पैमाने पर पूर्व-प्रशिक्षण रोबोट के लिए वही कर सकता है जो उसने भाषा मॉडल के लिए किया था।

भारत में कॉल स्क्रीनिंग के 1 मिलियन उपयोगकर्ताओं तक पहुंचने के कारण समान एआई को 30 मिलियन डॉलर की आय हुई

भौतिक बुद्धि अभी-अभी एक साहसिक दावा किया है जो रोबोटिक्स उद्योग को नया आकार दे सकता है। सैन फ्रांसिस्को स्थित स्टार्टअप ने π0.7 की घोषणा की, एक फाउंडेशन मॉडल जिसे रोबोटों को कुछ ऐसा देने के लिए डिज़ाइन किया गया है जिसकी उनके पास ऐतिहासिक रूप से कमी रही है – चीजों को अपने दम पर समझने की क्षमता।

यह मॉडल रोबोट के सीखने के तरीके में एक बुनियादी बदलाव का प्रतिनिधित्व करता है। प्रत्येक कार्य के लिए विशिष्ट व्यवहारों की प्रोग्रामिंग के बजाय, π0.7 सामान्यीकृत भौतिक तर्क विकसित करने के लिए बड़े पैमाने पर डेटासेट पर पूर्व-प्रशिक्षण का उपयोग करता है। के अनुसार टेकक्रंचकंपनी इसे एक सामान्य-उद्देश्यीय रोबोट मस्तिष्क के निर्माण की दिशा में एक “प्रारंभिक लेकिन सार्थक कदम” के रूप में वर्णित करती है – वह प्रकार जो व्यापक रीप्रोग्रामिंग के बिना कारखानों, गोदामों या घरों के लिए अनुकूल हो सकता है।

यह दृष्टिकोण उस प्लेबुक से बहुत अधिक उधार लेता है जिसने बड़े भाषा मॉडल को सफल बनाया। जिस तरह जीपीटी और क्लाउड ने व्यापक पूर्व-प्रशिक्षण के माध्यम से विविध भाषा कार्यों को संभालना सीखा, फिजिकल इंटेलिजेंस का मानना है कि रोबोट उसी तरह सामान्य भौतिक बुद्धि विकसित कर सकते हैं। π0.7 पदनाम स्वयं फाउंडेशन मॉडल की संस्करण रणनीति को प्रतिध्वनित करता है, जो कंपनी के तेजी से पुनरावृत्त होने के इरादे का संकेत देता है।

समय इससे अधिक रणनीतिक नहीं हो सकता। रोबोटिक्स अन्य एआई अनुप्रयोगों से आंशिक रूप से पिछड़ गया है क्योंकि भौतिक कार्यों का अनुकरण करना कठिन है और वास्तविक दुनिया डेटा संग्रह की आवश्यकता होती है। अधिकांश औद्योगिक रोबोट आज भी कठोर, पूर्व-क्रमादेशित दिनचर्या पर काम करते हैं। वे दोहराए जाने वाले कार्यों में उत्कृष्टता प्राप्त करते हैं लेकिन जब वातावरण बदलता है या अप्रत्याशित परिस्थितियाँ उत्पन्न होती हैं तो उन्हें संघर्ष करना पड़ता है। सेब तोड़ने के लिए प्रशिक्षित रोबोट व्यापक पुनर्प्रशिक्षण के बिना अचानक पैकिंग बक्सों पर स्विच नहीं कर सकता।

भौतिक बुद्धि उस सीमा को तोड़ने का प्रयास कर रही है। जीरो-शॉट लर्निंग – स्पष्ट प्रशिक्षण उदाहरणों के बिना कार्य करने की क्षमता – प्राकृतिक भाषा प्रसंस्करण और कंप्यूटर दृष्टि में परिवर्तनकारी रही है। यदि π0.7 भौतिक हेरफेर के लिए समान क्षमताएं प्रदान कर सकता है, तो यह उन उद्योगों में रोबोटिक्स तैनाती में तेजी लाएगा जो वर्तमान में स्वचालन को बहुत अनम्य या महंगा पाते हैं।

कंपनी ने खुद को दो प्रमुख बाजारों के चौराहे पर स्थापित किया है: फाउंडेशन मॉडल और रोबोटिक्स ऑटोमेशन। जबकि प्रतिस्पर्धी पसंद करते हैं टेस्ला ह्यूमनॉइड रोबोट पर ध्यान केंद्रित करें और बोस्टन डायनेमिक्स जैसी कंपनियां गतिशीलता पर जोर देती हैं, फिजिकल इंटेलिजेंस यह शर्त लगा रही है कि मस्तिष्क शरीर से अधिक मायने रखता है। उनका मॉडल विभिन्न रोबोट प्लेटफार्मों पर काम करने के लिए डिज़ाइन किया गया है, जो इसे हार्डवेयर-विशिष्ट समाधानों की तुलना में संभावित रूप से अधिक बहुमुखी बनाता है।

निवेशकों का उत्साह बढ़ा है. फिजिकल इंटेलिजेंस ने प्रमुख उद्यम पूंजी फर्मों का समर्थन आकर्षित किया है, जिनका मानना है कि रोबोटिक्स बाजार अपने जीपीटी क्षण के लिए तैयार है। उपभोक्ता एआई कंपनियों की तुलना में स्टार्टअप अपेक्षाकृत चुपचाप काम करता है, लेकिन उद्योग के अंदरूनी सूत्र इसकी प्रगति पर बारीकी से नज़र रख रहे हैं। फाउंडेशन मॉडल को गणना और डेटा संग्रह के लिए भारी पूंजी की आवश्यकता होती है – विशेष रूप से रोबोटिक्स में, जहां प्रशिक्षण डेटा एकत्र करने का मतलब लाखों भौतिक इंटरैक्शन के माध्यम से वास्तविक रोबोट चलाना है।

तकनीकी चुनौतियाँ पर्याप्त हैं। भाषा मॉडल डिजिटल वातावरण में अलग-अलग टोकन के साथ काम करते हैं। रोबोट अपूर्ण सेंसर, अलग-अलग रोशनी और अनगिनत किनारे के मामलों के साथ निरंतर भौतिक स्थान में काम करते हैं। एक मॉडल नियंत्रित सेटिंग्स में वस्तुओं को पकड़ना सीख सकता है, लेकिन असामान्य आकार, फिसलन वाली सतहों या अव्यवस्थित वातावरण का सामना करने पर विफल हो जाता है। फिजिकल इंटेलिजेंस का दावा है कि π0.7 अप्रशिक्षित कार्यों को संभाल सकता है, यह बताता है कि उन्होंने इन सामान्यीकरण समस्याओं पर प्रगति की है, हालांकि वास्तविक दुनिया की मान्यता महत्वपूर्ण होगी।

बेजोस-समर्थित प्रोमेथियस $12B पर $41B मूल्यांकन पर पहुँच गया

फाउंडेशन मॉडल को पारंपरिक रोबोटिक्स एआई से जो अलग करता है वह है स्केल और लचीलापन। पिछले दृष्टिकोणों में विशिष्ट कार्यों के लिए सुदृढीकरण सीखने या अनुकरण सीखने का उपयोग किया जाता था। फाउंडेशन मॉडल का लक्ष्य व्यापक भौतिक समझ को पुन: प्रयोज्य ज्ञान में संपीड़ित करना है। यदि कोई रोबोट कपड़े धोने के दौरान कपड़े में हेरफेर करना सीखता है, तो उस समझ को विनिर्माण में लचीली सामग्री को संभालने में स्थानांतरित किया जाना चाहिए। यदि यह एक वातावरण में बाधाओं के आसपास नेविगेट करने में माहिर है, तो इसे उन कौशलों को अन्यत्र अपनाना चाहिए।

व्यावसायिक निहितार्थ महत्वपूर्ण हैं। विनिर्माण सुविधाएं विशिष्ट उत्पादन लाइनों के लिए औद्योगिक रोबोटों को एकीकृत और प्रोग्रामिंग करने में महीनों का समय लगाती हैं। गोदामों में इन्वेंट्री को चुनने, छांटने और स्थानांतरित करने के लिए विशेष बॉट्स की सेना तैनात की जाती है। एक सामान्य प्रयोजन वाला रोबोट मस्तिष्क तैनाती की समयसीमा को संपीड़ित कर सकता है और छोटे ऑपरेशनों के लिए स्वचालन को आर्थिक रूप से व्यवहार्य बना सकता है जो कस्टम रोबोटिक्स इंजीनियरिंग को उचित नहीं ठहरा सकता है।

प्रतिस्पर्धा बढ़ती जा रही है. गूगल रोबोटिक्स अनुसंधान टीमें समान समस्याओं पर काम कर रही हैं। वीरांगना गोदाम स्वचालन में सुधार के लिए बड़े पैमाने पर प्रोत्साहन दिया गया है। रोबोटिक्स पारिस्थितिकी तंत्र में स्टार्टअप एआई प्रगति के व्यावहारिक अनुप्रयोगों को प्रदर्शित करने के लिए दौड़ रहे हैं। फिजिकल इंटेलिजेंस की घोषणा से संकेत मिलता है कि उनका मानना है कि वे एक प्रदर्शन-योग्य मील के पत्थर तक पहुंच गए हैं, हालांकि कंपनी को यह साबित करने की आवश्यकता होगी कि π0.7 बड़े पैमाने पर गन्दी, अप्रत्याशित वास्तविक दुनिया की स्थितियों को संभाल सकता है।

“0.7” संस्करण संख्या बता रही है। यह सुझाव देता है कि फिजिकल इंटेलिजेंस इसे तैयार उत्पाद के बजाय प्रारंभिक पुनरावृत्ति के रूप में देखता है। रोबोटिक्स उद्योग ने बहुत से अतिप्रचारित डेमो देखे हैं जो विश्वसनीय तैनाती में तब्दील होने में विफल रहे। लेकिन कंपनी की रूपरेखा – इसे पूर्ण समाधान के बजाय एक सार्थक कदम कहना – इंगित करता है कि वे अभी भी महत्वपूर्ण प्रगति का दावा करते हुए अपेक्षाओं का प्रबंधन कर रहे हैं।

फिजिकल इंटेलिजेंस का π0.7 लॉन्च अनुकूलनीय रोबोट इंटेलिजेंस बनाने की दौड़ में एक महत्वपूर्ण क्षण है। यदि मॉडल वास्तविक दुनिया की स्थितियों में अपने शून्य-शॉट सीखने के वादे को पूरा करता है, तो यह उन उद्योगों में रोबोटिक्स को अपनाने में तेजी ला सकता है, जिन्होंने पारंपरिक स्वचालन को बहुत कठोर पाया है। लेकिन फाउंडेशन मॉडल केवल उतने ही अच्छे होते हैं जितना दबाव में उनका प्रदर्शन, और रोबोटिक्स शारीरिक चुनौतियाँ प्रस्तुत करता है जिनका भाषा मॉडल कभी सामना नहीं करते हैं। स्टार्टअप की सतर्क रूपरेखा – इसे तैयार उत्पाद के बजाय प्रारंभिक कदम के रूप में प्रस्तुत करना – सुझाव देता है कि वे नियंत्रित डेमो और गड़बड़ वास्तविकता के बीच के अंतर को समझते हैं। आगे क्या होगा यह तय करेगा कि क्या फिजिकल इंटेलिजेंस रोबोटिक्स का ओपनएआई बन जाएगा या एआई क्षमताओं के बारे में एक और चेतावनी देने वाली कहानी बन जाएगी। किसी भी तरह से, कंपनी ने उद्योग को यह बता दिया है कि सामान्य प्रयोजन वाले रोबोट दिमाग अब केवल सैद्धांतिक नहीं रह गए हैं।