गूगल डीपमाइंड अभी-अभी अंधे और कम दृष्टि वाले एथलीटों को कुछ ऐसा दिया गया जो उन्हें कभी नहीं मिला था: अकेले दौड़ने की आज़ादी। कंपनी का नया रनिंग गाइड एजेंट बाधाओं के आसपास धावकों को नेविगेट करने के लिए वास्तविक समय के कंप्यूटर विज़न और ऑडियो संकेतों का उपयोग करता है, जिससे मानव गाइड या टेथर्स की आवश्यकता समाप्त हो जाती है। वरिष्ठ निदेशक रॉबिन दुआ द्वारा आज घोषित, एआई एजेंट सहायक प्रौद्योगिकी में एक छलांग का प्रतिनिधित्व करता है, जो स्मार्टफोन को बुद्धिमान दौड़ने वाले साथियों में बदल देता है जो आगे का रास्ता देखते हैं और धावकों के कानों में दिशा-निर्देश बताते हैं।
गूगल यह शर्त लगाई जा रही है कि एआई वह कर सकता है जो दशकों की सहायक तकनीक पूरी तरह से नहीं कर पाई है – नेत्रहीन धावकों को सच्ची स्वतंत्रता प्रदान करना। कंपनी की डीपमाइंड डिवीजन ने आज रनिंग गाइड एजेंट लॉन्च किया, एक एआई सिस्टम जो स्मार्टफोन को उन एथलीटों के लिए देखने वाले साथी में बदल देता है जो अंधे हैं या कम दृष्टि वाले हैं।
समय संयोग नहीं है. जैसे-जैसे तकनीकी दिग्गज यह साबित करने की होड़ में हैं कि एआई एजेंट जटिल वास्तविक दुनिया के कार्यों को संभाल सकते हैं, गूगल एक उपयोग का मामला मिला जहां दांव बेहद व्यक्तिगत हैं और प्रौद्योगिकी अंतर स्पष्ट है। अधिकांश अंधे धावक आज टेथर्स से जुड़े मानव गाइडों पर भरोसा करते हैं, या वे इनडोर ट्रैक से चिपके रहते हैं जहां वे चक्कर गिन सकते हैं। रनिंग गाइड उस समीकरण को पूरी तरह से बदलने का वादा करता है।
यहां बताया गया है कि यह व्यवहार में कैसे काम करता है। एआई एजेंट धावक के स्मार्टफोन से लाइव कैमरा फीड प्रोसेस करता है, बाधाओं, मोड़ों और खतरों के लिए आगे के रास्ते का विश्लेषण करता है। जब यह किसी चीज को देखता है – कोई कर्ब, पैदल यात्री, अचानक मोड़ – तो यह बोन-कंडक्शन हेडफ़ोन या ईयरबड के माध्यम से तत्काल ऑडियो संकेत देता है। सिस्टम केवल बाधाओं के बारे में चेतावनी नहीं देता है; यह सक्रिय रूप से नेविगेट करता है, धावकों को बताता है कि कब बायीं ओर मुड़ना है, कब रास्ता साफ होना है, कब किसी चौराहे के लिए धीमा होना है।
रॉबिन दुआ ने कहा, “रनिंग गाइड एजेंट एक एआई एजेंट है जो बीएलवी एथलीटों को स्वतंत्र रूप से दौड़ने में मदद करने के लिए वास्तविक समय ऑडियो नेविगेशन और बाधा का पता लगाने की सुविधा प्रदान करता है।” गूगल का प्लेटफ़ॉर्म और डिवाइसेज़ के लिए एआई इनोवेशन एंड रिसर्च के वरिष्ठ निदेशक ने बताया आधिकारिक घोषणा. सीधा विवरण नीचे दी गई तकनीकी जटिलता को छुपाता है – कंप्यूटर विज़न मॉडल जो मिलीसेकंड में फ़्रेम को संसाधित करता है, प्राकृतिक भाषा प्रणाली जो स्थानिक डेटा को संवादी मार्गदर्शन में परिवर्तित करती है, और एज कंप्यूटिंग जो सुरक्षा के लिए विलंबता को काफी कम रखती है।
प्रोजेक्ट बनता है गूगल का मौजूदा एक्सेसिबिलिटी कार्य, जिसमें ऑब्जेक्ट पहचान के लिए लुकआउट और स्क्रीन रीडिंग के लिए टॉकबैक शामिल है। लेकिन रनिंग गाइड कुछ अलग का प्रतिनिधित्व करता है: एक स्वायत्त एजेंट जो अप्रत्याशित वातावरण में तुरंत निर्णय लेता है। यह अधिकांश उपभोक्ता एआई अनुप्रयोगों की तुलना में एक कठिन समस्या है, जहां गलतियों का मतलब खराब सिफारिशें हैं, न कि शारीरिक चोटें।
डीपमाइंड यह विस्तार से नहीं बताया गया कि कौन से विशिष्ट मॉडल रनिंग गाइड को शक्ति प्रदान करते हैं, लेकिन सिस्टम संभवतः मल्टीमॉडल एआई में कंपनी की प्रगति से प्रेरित है – मॉडल जो दृष्टि, भाषा और स्थानिक तर्क को मिश्रित करते हैं। चुनौती सिर्फ धावक के रास्ते में कूड़ेदान की पहचान करना नहीं है; यह गणना कर रहा है कि क्या उस बाधा के लिए दिशा परिवर्तन की आवश्यकता है, चेतावनी कितनी तत्काल होनी चाहिए, और लगातार अलर्ट के साथ एथलीट पर दबाव डाले बिना इसे कैसे संप्रेषित किया जाए।
अभिगम्यता कोण देता है गूगल एआई एजेंट युद्धों में एक कथात्मक बढ़त, लेकिन तकनीकी मान्यता अधिक मायने रखती है। यदि रनिंग गाइड विश्वसनीय रूप से काम करता है, तो यह साबित होता है कि एआई एजेंट अराजक वास्तविक दुनिया सेटिंग्स में सुरक्षा-महत्वपूर्ण कार्यों को संभाल सकते हैं। यह उस प्रकार की क्षमता है जो स्वायत्त वाहनों, रोबोट सहायकों और औद्योगिक स्वचालन – बाजारों में स्थानांतरित होती है गूगल से प्रतिस्पर्धा करता है माइक्रोसॉफ्ट, वीरांगनाऔर स्टार्टअप्स का झुंड।
एक नियामक आयाम भी है. सहायक प्रौद्योगिकियों को अक्सर सामान्य उपभोक्ता उत्पादों की तुलना में तेजी से अनुमोदन मार्ग मिलते हैं, और वे एआई सुरक्षा के बारे में चिंतित नीति निर्माताओं के साथ सद्भावना उत्पन्न करते हैं। गूगल खुद को एक एक्सेसिबिलिटी लीडर के रूप में स्थापित करने से आगे चलकर अधिक महत्वाकांक्षी एजेंट की तैनाती का रास्ता आसान हो सकता है।
घोषणा में उपलब्धता की समय-सीमा, मूल्य निर्धारण, या हार्डवेयर आवश्यकताएँ शामिल नहीं थीं – जो प्रारंभिक चरण के लिए विशिष्ट हैं गूगल ऐसी परियोजनाएँ जो महीनों या वर्षों तक अनुसंधान मोड में रह सकती हैं। कंपनी का एक्सेसिबिलिटी टूल्स के साथ मिश्रित ट्रैक रिकॉर्ड है; लाइव ट्रांस्क्राइब जैसे कुछ, मुख्यधारा की विशेषताएं बन गए, जबकि अन्य पायलट कार्यक्रमों में ही सिमट कर रह गए।
जो बात स्पष्ट है वह यह है गूगल डीपमाइंड वास्तविक दुनिया के एआई एजेंटों को अगले युद्धक्षेत्र के रूप में देखता है। जबकि प्रतिस्पर्धी चैटबॉट्स और कोडिंग सहायकों पर ध्यान केंद्रित करते हैं, गूगल भौतिक स्थान को नेविगेट करने, जटिल वातावरण की व्याख्या करने और मानव सुरक्षा को प्रभावित करने वाले निर्णय लेने के लिए मॉडलों को प्रशिक्षण दे रहा है। रनिंग गाइड नेत्रहीन एथलीटों के अपेक्षाकृत छोटे समुदाय की मदद कर सकता है, लेकिन सीखे गए सबक ट्रैक से कहीं आगे बढ़ेंगे।
एक्सेसिबिलिटी सुविधा से स्वायत्त नेविगेशन सिस्टम में बदलाव एआई के लिए बदलती अपेक्षाओं को भी दर्शाता है। कुछ साल पहले, बाधा का पता लगाना प्रभावशाली रहा होगा। अब, उपयोगकर्ता ऐसे एजेंटों से अपेक्षा करते हैं जो न केवल समस्याओं की पहचान करें बल्कि उन्हें मानवीय हस्तक्षेप के बिना सक्रिय रूप से हल करें। रनिंग गाइड उस लक्ष्य को छूता है – यह एक उपकरण नहीं है जिसे आप नियंत्रित करते हैं, यह एक साथी है जो मार्गदर्शन करता है।
अंधे और कम दृष्टि वाले समुदाय के लिए, वादा गहरा है। एथलेटिक्स में स्वतंत्रता का मतलब हमेशा अपने शेड्यूल पर प्रशिक्षण लेने, नए मार्गों का पता लगाने और समन्वयित गाइडों के बिना सीमाएं बढ़ाने की स्वतंत्रता है। यदि रनिंग गाइड उस वादे को विश्वसनीय ढंग से पूरा करता है, तो यह केवल पहुंच की जीत नहीं होगी – यह सबूत होगा कि एआई एजेंट मानव जीवन के सबसे गंदे, सबसे अप्रत्याशित हिस्सों को संभाल सकते हैं।
Google DeepMind का रनिंग गाइड एजेंट केवल एक एक्सेसिबिलिटी सुविधा नहीं है – यह उच्च जोखिम वाले भौतिक वातावरण में काम करने वाले AI एजेंटों के लिए एक प्रमाण बिंदु है। यदि सिस्टम अप्रत्याशित बाहरी मार्गों पर अंधे धावकों को सुरक्षित रख सकता है, तो यह स्वायत्त एआई निर्णय लेने को उन तरीकों से मान्य करता है जो चैटबॉट और छवि जनरेटर कभी नहीं कर सकते। असली परीक्षा तब होती है जब रनिंग गाइड अनुसंधान घोषणा से फुटपाथ पर दौड़ने वाले वास्तविक धावकों की ओर बढ़ता है, लेकिन महत्वाकांक्षा संकेत देती है कि Google एआई एजेंट की दौड़ को कहां देख रहा है: बादल से बाहर और गन्दी, अप्रत्याशित वास्तविक दुनिया में जहां गलतियों के परिणाम होते हैं और स्वतंत्रता का मतलब सब कुछ होता है।









