इस सप्ताह Google I/O डेवलपर सम्मेलन में, हमें Google के आगामी AI-पावर्ड ग्लास के साथ संक्षिप्त रूप से परिचित होने का अवसर मिला – नहीं केवल ऑडियो चश्मा कंपनी ने कहा है कि वह इस पतझड़ में शिपिंग शुरू कर देगी, बल्कि ऐसे चश्मे जो एक संयुक्त ऑडियो और विज़ुअल अनुभव प्रदान करते हैं।
पिछले साल के आयोजन में पहली बार घोषणा की गई थी, ये एंड्रॉइड एक्सआर चश्मा एक इन-लेंस डिस्प्ले प्रदान करते हैं जो वास्तविक दुनिया के शीर्ष पर आपके सामने उपयोगी जानकारी रखता है। इसमें ऐसे विजेट शामिल हैं जो मौसम, चलने की दिशा, उबेर पिकअप विवरण, लाइव अनुवाद और बहुत कुछ जैसी चीजें प्रदर्शित कर सकते हैं – यहां तक कि वे विजेट भी जिन्हें आपने एआई का उपयोग करके स्वयं डिजाइन किया है।

कंपनी ने बताया कि चश्मा आईओएस और एंड्रॉइड फोन दोनों के साथ जोड़ा जाएगा, दोनों केवल-ऑडियो प्रारूप में और भविष्य के डिस्प्ले संस्करण में।
डिस्प्ले के साथ आईवियर का मतलब इस साल के अंत में आने वाले ऑडियो ग्लास की पहली पीढ़ी से आगे का कदम है। चश्मे को स्वयं वॉर्बी पार्कर, जेंटल मॉन्स्टर और सैमसंग के साथ साझेदारी में विकसित किया गया था, जिसमें Google की तकनीक को उनके ब्रांड के डिजाइन सौंदर्यशास्त्र के साथ मिश्रित किया गया था।
इस बीच, जिन चश्मों का हमने परीक्षण किया, वे अभी भी एक प्रोटोटाइप थे, हालाँकि एक को इतना पॉलिश किया गया था कि अब उसका बाहरी परीक्षण किया जा सकता है। एक्सआर चश्मे का प्रदर्शन करने वाले प्रतिनिधियों ने बताया कि प्रोटोटाइप ने Google को विभिन्न शैलियों और आकारों से संबंधित कुछ कॉस्मेटिक विवरणों के बारे में चिंता करने की अनुमति नहीं दी है, इसलिए वह इसके बजाय डिस्प्ले तकनीक के साथ अधिक स्वतंत्र रूप से प्रयोग करने और बैटरी जीवन पर इसके प्रभावों पर ध्यान केंद्रित कर सकता है। इसका मतलब है कि ये चश्मे फिट, आकार, आयाम और विवरण पर ध्यान देने के मामले में चश्मे के किसी भी भविष्य के शिपिंग संस्करण से बहुत अलग हैं। बल्कि, यह चश्मे के “अंदर” के साथ प्रयोग करने में सक्षम होने जैसा है, जबकि अभी भी एक बुनियादी, आरामदायक फ्रेम में है।
चश्मे का शिपिंग संस्करण यह पता लगाने में सक्षम होगा कि चश्मा आपके सिर पर कब रखा गया है और उतार दिया गया है, लेकिन हमने जो प्रयास किया उसमें यह सुविधा नहीं थी।

जेमिनी को सक्रिय करने के लिए, आपको चश्मे के फ्रेम के दाईं ओर दो सेकंड का प्रेस करना होगा। एक स्टार्टअप घंटी बजेगी, जिससे आपको पता चलेगा कि जेमिनी चालू है और सुन रहा है। डेमो संस्करण में, जेमिनी को शुरू करने से उसी समय कैमरा भी शुरू हो जाएगा, लेकिन शिपिंग संस्करण उपयोगकर्ता को यह कॉन्फ़िगर करने की अनुमति देगा कि वे जेमिनी के शुरू होने पर कैमरा चालू करना चाहते हैं या नहीं।
प्रारंभिक परीक्षण में, हमने जेमिनी से एक पसंदीदा कलाकार की भूमिका निभाने के लिए कहकर चश्मे के माध्यम से संगीत बजाया। ध्वनि की गुणवत्ता का मूल्यांकन करने के लिए स्थान बहुत शोर था, दुर्भाग्य से, क्योंकि संगीत को अधिकतम मात्रा तक डायल किया गया था और अभी भी स्पष्ट और विस्तार से सुनना अपेक्षाकृत कठिन था। लेकिन इस सीमित अनुभव से प्रारंभिक धारणा यह थी कि चश्मा उच्च-गुणवत्ता वाले ईयरबड्स का एक अच्छा विकल्प नहीं होगा, हालांकि वे तब काम करेंगे जब आप बाहर, पैदल चलने, लंबी पैदल यात्रा या घर के आसपास काम करने के दौरान बस कुछ संगीत चाहते हों। ईयरबड न होने का फायदा यह है कि आप ऐप्पल के एयरपॉड्स जैसे उपकरणों पर पारदर्शिता मोड के अनुभवों की तुलना में किसी को बात करते हुए अधिक आसानी से सुन सकते हैं।
संगीत बंद करने के लिए, आप बस फ्रेम के किनारे, बीच में एक बार टैप करें, जैसे कि अपने मंदिर पर टैप कर रहे हों।

दूसरे टेस्ट में हमने किसी व्यक्ति की फोटो लेने के लिए फोटो कैप्चर बटन को अपनी उंगली से दबाया। डिस्प्ले बंद था, इसलिए चित्र हमारे फ़ोन और घड़ी में स्थानांतरित हो गया। (आप बाद में लंबे समय तक प्रेस करके वीडियो कैप्चर करने में सक्षम होंगे, लेकिन यह विकल्प प्रोटोटाइप के साथ परीक्षण के लिए उपलब्ध नहीं था। वीडियो के मामले में, आपको फोटो के बजाय वीडियो थंबनेल पूर्वावलोकन दिखाई देगा।)
आप जेमिनी को फोटो बटन दबाए बिना फोटो लेने के लिए भी कह सकते हैं, और परिणाम पर किसी प्रकार का एआई हेरफेर कर सकते हैं। उदाहरण के लिए, आप कुछ ऐसा कह सकते हैं जैसे “एक फोटो लें और व्यक्ति को एनीमे चरित्र में बदल दें।” फ़ोटो फ़ोन पर भेजी जाती है, फिर जेमिनी और नैनो बनाना सर्वर पर, और फिर उसके संपादित संस्करण में वापस आती है।
Google I/O स्थल पर, जहां वाई-फाई भारी लोड के तहत था, राउंड-ट्रिप में लगभग 45 सेकंड लगे।

डिस्प्ले सक्षम होने पर, आपको अपने दृश्य क्षेत्र में एक साधारण होम स्क्रीन दिखाई देगी। डेमो संस्करण में कुछ विजेट पहले से लोड किए गए थे जो मौसम और Google के I/O इवेंट की उलटी गिनती दिखाते थे। आप Google मानचित्र या अनुवाद जैसे विशिष्ट ऐप्स में त्वरित लॉन्चर भी बना सकते हैं, यदि वे चश्मे के लिए आपके मुख्य उपयोग के मामलों में से थे।
प्रोटोटाइप में दाहिनी आंख पर सिर्फ एक डिस्प्ले था, लेकिन प्लेटफ़ॉर्म सिंगल और डुअल डिस्प्ले, साथ ही ऑडियो-ओनली ग्लास दोनों को सपोर्ट कर सकता है। छवि स्वयं थोड़ी धुंधली थी, लेकिन हमने इसे अपने प्रिस्क्रिप्शन संपर्कों तक सीमित कर लिया, जिसमें एक तरफ दूरी के लिए अनुकूलित एक लेंस पहनना शामिल है, और दूसरी तरफ निकट दृष्टि के लिए अनुकूलित एक लेंस पहनना शामिल है। जब हमने एक आंख बंद की, तो छवि बेहतर फोकस में आई, लेकिन अनुभव ने लगभग तुरंत ही हमारी दाहिनी आंख के ऊपर कुछ तनाव पैदा कर दिया, और यह स्पष्ट नहीं है कि क्या इसके लिए पूरी तरह से नुस्खे जिम्मेदार थे।

सबसे अच्छे डेमो में से एक चश्मे पर भाषा अनुवाद अनुभव का था, जो फोन पर Google अनुवाद ऐप द्वारा समर्थित है। प्रदर्शनकारियों में से एक ने तेजी से स्पैनिश भाषा बोली, और चश्मे ने स्वचालित रूप से भाषा का पता लगाया और डिस्प्ले पर अंग्रेजी में पाठ प्रदर्शित किया, जबकि जेमिनी ने हमारे कान में अंग्रेजी बोली। हम विश्व यात्रियों को अकेले इस अनुभव के लिए चश्मा खरीदते हुए देख सकते हैं।
हमें ध्यान देना चाहिए कि अनुवाद केवल ऑडियो-ग्लास पर भी काम करेगा, केवल ग्लास पर टेक्स्ट प्रदर्शित किए बिना। इसके बजाय, यदि आवश्यक हो, तो वास्तविक समय ऑडियो फीडबैक के अलावा, आप फोन पर ट्रांसक्रिप्शन देख सकते हैं।
एक अन्य डेमो में नेविगेट करने के लिए चश्मे का उपयोग करना शामिल था। हालांकि स्पष्ट रूप से हम इसकी सटीकता का परीक्षण करने के लिए सैर पर नहीं जा सकते थे और कार्यक्रम स्थल को छोड़ नहीं सकते थे, हम यह अंदाजा लगा सकते थे कि यह कैसे काम करेगा। आप मिथुन को एक गंतव्य तक पहुंचने के लिए कहकर Google मानचित्र अनुभव शुरू कर सकते हैं – जो “निकटतम कॉफी शॉप” जैसा अस्पष्ट भी हो सकता है।
मिथुन राशि वाले फ़ोन पर Google मानचित्र सक्रिय कर देंगे, लेकिन इसका उपयोग करने के लिए आपको अपना फ़ोन अपने बैग या जेब से निकालने की ज़रूरत नहीं है। अनुभव लोड होने में थोड़ी देरी के बाद, चश्मा बारी-बारी से दिशा-निर्देश प्रदर्शित करता है। जब आप आगे की ओर देख रहे होते हैं, तो आपकी अगली बारी की जानकारी प्रदर्शित होती है। लेकिन अगर आपको अंतरिक्ष में उन्मुख होने की आवश्यकता है, तो आप जमीन पर नीचे देख सकते हैं और मानचित्र पर अपना नीला बिंदु देख सकते हैं। आप अंतरिक्ष में घूमने के लिए बाएँ और दाएँ भी मुड़ सकते हैं, ठीक वैसे ही जैसे आप अपने फ़ोन पर नीले बिंदु को सही दिशा में इंगित करने का प्रयास करेंगे।
फिर, यदि आप फिर से ऊपर देखते हैं, तो आप मानचित्र को अपने रास्ते में आए बिना भी चल सकते हैं।
क्योंकि अनुभव आपके फ़ोन पर Google मानचित्र से जुड़ा हुआ है, “घर” और “कार्य” जैसे सहेजे गए गंतव्य पहले से ही उपलब्ध होंगे।

हम अपने दृष्टिकोण में विभिन्न प्रकार की वस्तुओं की पहचान करने और उनके बारे में प्रश्न पूछने के लिए चश्मे का संक्षेप में उपयोग करने में भी सक्षम थे। शुरू में चश्मे को हमारे सामने एक शेल्फ पर मोनेट पेंटिंग की प्रतिकृति की पहचान करने में कठिनाई हुई, लेकिन ऐसा इसलिए था क्योंकि प्रोटोटाइप स्वचालित रूप से कैमरे को सक्षम नहीं करता था – इसे ऐप से फिर से चालू करना पड़ा। फिर भी, जेमिनी के यह कहने से पहले कि यह एक मोनेट जैसा दिखता है, इसमें कुछ प्रश्न लगे, भले ही हम नीचे बाईं ओर मोनेट हस्ताक्षर पर ध्यान केंद्रित करने के करीब पहुंचे।
अन्य परीक्षण आसान थे, क्योंकि चश्मे ने तुरंत शेल्फ पर पौधे की पहचान कर ली और एक किताब में विभिन्न व्यंजनों के बारे में सवालों के जवाब दे दिए। फिर भी, हमने मन ही मन सोचा कि ये ऐसी चीजें हैं जो आप आज Google लेंस (या चैटबॉट ऐप्स में एकीकृत अन्य AI मॉडल) के साथ कर सकते हैं, हालांकि हमारा मानना है कि अपने फोन को खींचे बिना इन्हें करने में सक्षम होना दिलचस्प है।
Google का कहना है कि इस वर्ष के अंत में जब वह अपने विश्वसनीय परीक्षक कार्यक्रम का विस्तार करेगा, तो उसके पास अपने Android XR डिस्प्ले ग्लास के बारे में साझा करने के लिए और भी बहुत कुछ होगा।

इस बीच, कंपनी का मानना है कि ऑडियो कुछ उपयोगकर्ताओं की ज़रूरतों के लिए पर्याप्त होगा, जो शायद इस तथ्य को घुमाने का एक स्मार्ट तरीका है कि इस मोर्चे पर मेटा और स्नैप से प्रतिस्पर्धा के बावजूद, उसके पास अपने डिस्प्ले ग्लास तैयार नहीं हैं।
डिस्प्ले संस्करण की तरह, ऑडियो ग्लास भी Google के जेमिनी एआई तक पहुंच प्रदान करते हैं, जिसे आप चश्मे के फ्रेम स्पीकर के माध्यम से निजी तौर पर सुनते हैं। आप इन चश्मे से चश्मे के माध्यम से संगीत सुनना, फोटो लेने के लिए बटन दबाना, कॉल करना या अपने फोन ऐप्स में टैप करने जैसे काम कर सकते हैं, जैसा कि आप भविष्य के डिस्प्ले संस्करणों पर कर सकते हैं।
अन्य तृतीय-पक्ष ऐप्स में टैप करना उन वस्तुओं में से नहीं था जिन्हें हमने प्रदर्शित किया था, लेकिन चश्मा उपयोगकर्ताओं को मिथुन को “इस नुस्खा से सामग्री लेने और उन्हें मेरी खरीदारी सूची में जोड़ने” जैसी चीजें करने के लिए कहने की अनुमति देगा।
एक अन्य उदाहरण में, जिसे Google ने इवेंट के मुख्य भाषण के दौरान प्रदर्शित किया था, चश्मा उस भोजन को देख सकता था जिसे पहनने वाला स्टोव पर पका रहा था और भोजन के बारे में प्रतिक्रिया दे सकता था, जैसे कि मांस अभी तक पूरी तरह से पक गया है या नहीं।
जब आप हमारे लेखों में दिए गए लिंक के माध्यम से खरीदारी करते हैं, तो हम एक छोटा कमीशन कमा सकते हैं। इससे हमारी संपादकीय स्वतंत्रता पर कोई असर नहीं पड़ता.









