जेमिनी कार्य स्वचालन धीमा, अव्यवस्थित और अत्यधिक प्रभावशाली है

मैं Pixel 10 Pro और Galaxy S26 Ultra पर जेमिनी के नए टास्क ऑटोमेशन का परीक्षण कर रहा हूं, जो पहली बार जेमिनी को इसकी जिम्मेदारी लेने और आपके लिए ऐप्स का उपयोग करने की सुविधा देता है। यह अभी एक छोटे उपसमुच्चय तक सीमित है – कुछ मुट्ठी भर भोजन वितरण और राइडशेयर सेवाएं – और यह अभी भी बीटा में है। यह धीमा है, कभी-कभी अव्यवस्थित होता है, और यह आपके फ़ोन का उपयोग करने में आने वाली किसी भी गंभीर समस्या का समाधान नहीं करता है। लेकिन यह अत्यंत प्रभावशाली है, और मुझे नहीं लगता कि यह कहना अतिश्योक्ति होगी कि यह भविष्य की एक झलक है। हम अभी भी बहुत दूर हैं, लेकिन यह पहली बार है जब मैंने एक सच्चे एआई सहायक को वास्तव में फोन पर काम करते देखा है – किसी मुख्य प्रस्तुति या किसी कन्वेंशन हॉल के अंदर सावधानीपूर्वक नियंत्रित डेमो में नहीं।

सबसे पहले: मिथुन राशि वाले अपने फ़ोन का उपयोग करने में आपसे, मुझसे, या अधिकांश लोगों से बहुत धीमे हैं। यदि आपको उबर ऑर्डर करने की आवश्यकता है ठीक इसी सेकंडआप अभी भी इस काम के लिए सर्वश्रेष्ठ व्यक्ति हैं। हालाँकि, इससे पहले कि आप इसे लिखें, याद रखें कि कार्य स्वचालन को पृष्ठभूमि में चलने के लिए डिज़ाइन किया गया है जब आप अपने फोन पर अन्य काम करते हैं। इससे भी बेहतर, यह आपके रहते हुए भी काम करता रहता है नहीं अपने फ़ोन को देखते हुए, ताकि आप 10वीं बार यह जाँचने जैसे काम कर सकें कि आपका पासपोर्ट आपके बैग में है या नहीं।

लेकिन अगर आप मेरी तरह उत्सुक हैं, तो आप पूरी घटना को घटित होते हुए देख सकते हैं। जब यह काम कर रहा होता है, तो स्क्रीन के नीचे टेक्स्ट दिखाई देता है जो दर्शाता है कि जेमिनी क्या कर रहा है। “कॉम्बो के लिए चिकन टेरीयाकी के दूसरे हिस्से का चयन करना” जैसी चीजें, जो उसने तब किया जब मैंने उसे शनिवार की रात को अपना रात्रिभोज ऑर्डर करने का निर्देश दिया। मिथुन राशि वालों को चीजों को तुरंत ईमानदारी से समझते हुए देखना कुछ नियमों जैसा है। मैंने चिकन कॉम्बो प्लेट मांगी; मेनू में आधे हिस्से की वृद्धि में विकल्प प्रस्तुत किए गए थे, इसलिए इसमें चिकन की दो आधी सर्विंग्स सही ढंग से जोड़ी गईं।

जेमिनी ने सोचा कि दो आधे हिस्से चिकन टेरीयाकी के एक ऑर्डर के बराबर होंगे।

जेमिनी को यहां स्क्रीन के ठीक मध्य में दिखाए गए हरे रंग का पक्ष ढूंढने में अधिक परेशानी हुई।

यह सबसे अच्छा है कि जब आप जेमिनी के साथ ऑटोमेशन शुरू करते हैं, तो इसका डिफ़ॉल्ट व्यवहार पृष्ठभूमि में चलना होता है। यदि आप मिथुन को कार्य करते हुए देखना चाहते हैं तो आपको एक बटन टैप करना होगा और दूसरी विंडो खोलनी होगी। और यह कष्टदायी हो सकता है. Uber Eats के मेनू में हरी सब्जियों का एक पक्ष खोजने का प्रयास करने के लिए कंप्यूटर को देखें वहीं स्क्रीन के शीर्ष पर बैठा हूं यह एक डरावनी फिल्म देखने जैसा है और यह जानना कि हत्यारा नायक के ठीक बगल वाली कोठरी में है। मेरा मतलब है, हत्या वाले हिस्से को छोड़कर। मेरे टेरीयाकी ऑर्डर को एक साथ रखते समय जेमिनी ने कुछ गलत मोड़ लिए, जिसे अंततः उसने अपने आप ही सुलझा लिया, लेकिन पूरे प्रकरण में लगभग नौ मिनट लग गए। आदर्श नहीं।

मिथुन राशि वालों से अपेक्षा की जाती है कि वे आपके कार्य को ठीक उस बिंदु तक पूरा करें जहां आपकी कार या रात्रिभोज की पुष्टि करने और ऑर्डर करने का समय हो ताकि आप उसके कार्य की दोबारा जांच कर सकें। मुझे लगता है कि अभी इस सुविधा का उपयोग करने का यही एकमात्र उचित तरीका है, और मुझे ऑर्डर पूरा करने में होने वाली अतिरिक्त परेशानी से कोई आपत्ति नहीं है। पिछले पांच दिनों में किए गए परीक्षणों में, मैंने कभी भी इसे खराब नहीं पाया और मेरे लिए मेरा ऑर्डर पूरा नहीं किया। और यह आश्चर्यजनक रूप से सटीक है; मुझे अंतिम क्रम में बहुत कम समायोजन करना पड़ा है। यदि यह विफल हो जाता है – जैसा कि मैंने कुछ बार देखा है – यह पहले या दो मिनट के भीतर होता है जब ऐप के बारे में कुछ चीज़ों पर मेरा ध्यान देने की आवश्यकता होती है, जैसे इसे मेरे स्थान का उपयोग करने की अनुमति देना, या नेवादा के बजाय घर पर डिलीवरी स्थान बदलना, जो आखिरी जगह थी जहां मैंने उस ऐप का उपयोग किया था। मुझे यह पता लगाना था कि इस तरह के मामलों में समस्या क्या थी, लेकिन एक बार इसका समाधान हो जाने के बाद मैं बिना किसी समस्या के स्वचालन को पुनः आरंभ करने में सक्षम था।

यहाँ वह है जो वास्तव में मुझे मिला। मैंने अगले दिन सैन फ्रांसिस्को की उड़ान के लिए अपने कैलेंडर पर एक कार्यक्रम रखा (मेरे लिए एक दिखावा यात्रा, लेकिन वास्तविक उड़ान विवरण)। मैंने जेमिनी को एक उबेर शेड्यूल करने के लिए एक अस्पष्ट संकेत दिया जो मुझे कल की उड़ान के लिए समय पर हवाई अड्डे पर पहुंचा देगा। चूँकि जेमिनी के पास मेरे ईमेल और कैलेंडर तक पहुंच है, इसलिए वह उस जानकारी को ढूंढ सकता है। इसके लिए थोड़े अतिरिक्त मार्गदर्शन की आवश्यकता थी – संभवतः इसलिए क्योंकि उड़ान मेरे ईमेल में वैसी नहीं थी जैसी कि अपेक्षा थी। लेकिन इसके साथ ही, उसे उड़ान की जानकारी मिल गई, उसने 11:30 या 11:45 पूर्वाह्न तक प्रस्थान करने का सुझाव दिया (1:45 अपराह्न की उड़ान के लिए तार्किक समय, क्योंकि मैं हवाई अड्डे के करीब रहता हूं), और पूछा कि क्या मैं उनमें से किसी एक समय के लिए यात्रा निर्धारित करना चाहता हूं। मैंने समय की पुष्टि की, और लगभग तीन मिनट में सवारी तय करने में लग गया, मेरी ओर से किसी और इनपुट की आवश्यकता नहीं थी।

यह थोड़ा अधिक प्रभावशाली है जब आप समझते हैं कि उबर इसका उल्लेख भी नहीं करता है अनुसूची बनाना एक सवारी – आप संरक्षित एक सवारी. हमारे द्वारा उपयोग किए जा रहे डिजिटल सहायकों और अब उभर रहे एआई सहायकों के बीच यही मुख्य अंतर है। जब आप अपने स्मार्ट होम को नियंत्रित कर रहे हों या अपने डिनर का ऑर्डर दे रहे हों, तो कंप्यूटर से बात करते समय प्राकृतिक भाषा का उपयोग करने में सक्षम होने से बहुत फर्क पड़ता है। यदि कंप्यूटर खराब हो जाता है और स्पष्टीकरण मांगता है जब आप भूल जाते हैं कि रेस्तरां आपके भोजन को “प्लेट” कहता है न कि “कॉम्बो”, या यदि आप “कटी हुई गोभी” के बजाय “स्लाव” मांगते हैं, तो यह उन सहायकों से अधिक उपयोगी नहीं है जिनका उपयोग हम पिछले एक दशक से टाइमर सेट करने और संगीत बजाने के लिए कर रहे हैं।

जैसा कि कहा गया है, जेमिनी को उबर ईट्स पर टैप और स्क्रॉल करते हुए देखने से एक बात स्पष्ट रूप से स्पष्ट हो जाती है: यदि आप एआई के उपयोग के लिए एक एप्लिकेशन डिजाइन कर रहे थे, तो यह हमारे पास आज के जैसा कुछ भी नहीं दिखेगा। आप जानते हैं, ऐप्स मनुष्यों के लिए डिज़ाइन किए गए हैं। आपके ऑर्डर पर 30 प्रतिशत की बचत करने के लिए एक एआई सहायक पृष्ठ के मध्य में एक बड़े विज्ञापन से आकर्षित नहीं होगा। वह जिस व्यंजन का ऑर्डर दे रहा है उसकी एक स्वादिष्ट, अच्छी तरह से मंचित तस्वीर निम्न-गुणवत्ता वाले से अधिक आश्वस्त करने वाली नहीं है। आप इसे एक डेटाबेस देंगे, न कि ढेर सारा ढेर सारा सामान, जिसे साफ करने के लिए उद्योग मॉडल कॉन्टेक्स्ट प्रोटोकॉल या एमसीपी में काम कर रहा है।

मानव-केंद्रित इंटरफ़ेस के माध्यम से अपने तरीके से तर्क करने वाला एआई मॉडल पिज्जा ऑर्डर देने का सबसे अव्यवहारिक और भंगुर तरीका लगता है। इसमें कभी-कभी कोई रुकावट आ जाती है, और यह आपको बताने में अच्छा नहीं है क्यों यह कुछ नहीं कर सका. कार्य स्वचालन का यह संस्करण एक स्टॉपगैप की तरह लगता है जब तक कि ऐप डेवलपर्स अधिक मजबूत तरीकों को नहीं अपनाते: एमसीपी या एंड्रॉइड के ऐप फ़ंक्शन। Google के Android प्रमुख, समीर समत ने हाल ही में मुझे बताया कि जेमिनी अन्य दो की अनुपस्थिति में तर्कपूर्ण दृष्टिकोण अपनाता है। हो सकता है कि कार्य स्वचालन का यह संस्करण हमारे लिए क्या संभव है इसका पूर्वावलोकन है, या डेवलपर्स को अन्य तरीकों में से एक को अपनाने के लिए प्रेरित करने का एक तरीका है। किसी भी तरह से, यह हमारे मोबाइल सहायकों का उपयोग करने के एक नए तरीके की दिशा में एक उल्लेखनीय पहला कदम जैसा लगता है – अजीब, धीमा, लेकिन बहुत आशाजनक।

फोटोग्राफी एलिसन जॉनसन / द वर्ज द्वारा

विषयों और लेखकों का अनुसरण करें इस कहानी से अपने वैयक्तिकृत होमपेज फ़ीड में इस तरह की और अधिक जानकारी देखने और ईमेल अपडेट प्राप्त करने के लिए।


Source link

Leave a Comment