Google ने जेमिनी 3 के लिए मानक ऊंचे रखे हैं। यह अपने चमकदार नए एआई मॉडल में उन्नत सुविधाओं का एक समूह का वादा कर रहा है, जिसमें इंटरैक्टिव 3डी विज़ुअलाइज़ेशन उत्पन्न करने वाले कोड से लेकर कार्यों को पूरा करने वाली “एजेंट” क्षमताओं तक शामिल है। लेकिन जैसा कि हमने अतीत में देखा है, जो विज्ञापित किया जाता है वह हमेशा वास्तविकता से मेल नहीं खाता है। इसलिए हमने Google के कुछ दावों का परीक्षण किया और पाया कि जेमिनी 3 कुछ चेतावनियों के साथ काफी अच्छा प्रदर्शन करता है।
Google ने इस सप्ताह की शुरुआत में जेमिनी 3 परिवार के मॉडलों की घोषणा की, जिसमें फ्लैगशिप जेमिनी 3 प्रो को सबसे पहले उपयोगकर्ताओं के लिए पेश किया गया। माना जाता है कि जेमिनी 3 प्रो तर्कशक्ति में बड़े उन्नयन के साथ-साथ Google के पिछले मॉडल की तुलना में अधिक संक्षिप्त और प्रत्यक्ष प्रतिक्रिया प्रदान करने की क्षमता के साथ आएगा।
सबसे बड़े वादा किए गए सुधारों में से कुछ कैनवस में हैं, जो जेमिनी ऐप के अंदर अंतर्निहित कार्यक्षेत्र है, जहां आप एआई चैटबॉट को कोड उत्पन्न करने के लिए कह सकते हैं, साथ ही आउटपुट का पूर्वावलोकन भी कर सकते हैं। कैनवास में निर्माण करते समय, गूगल कहता है जेमिनी 3 एक ही समय में विभिन्न प्रकार के स्रोतों, जैसे पाठ, चित्र और वीडियो से सामग्री की व्याख्या कर सकता है। Google के अनुसार, मॉडल अधिक जटिल संकेतों को भी संभाल सकता है, जिससे यह अधिक समृद्ध, अधिक इंटरैक्टिव उपयोगकर्ता इंटरफ़ेस, मॉडल और सिमुलेशन उत्पन्न कर सकता है। कंपनी का कहना है कि जेमिनी 3 “असाधारण” है शून्य-शॉट पीढ़ीभी, जिसका अर्थ है कि यह उन कार्यों को पूरा करने में बेहतर है जिन पर इसे प्रशिक्षित नहीं किया गया है।
अपने पहले परीक्षण के लिए, मैंने अधिक जटिल अनुरोधों में से एक को आज़माया, जिसे Google ने अपने एक डेमो में दिखाया था: मैंने जेमिनी 3 को एक उप-परमाणु कण, एक परमाणु, एक डीएनए स्ट्रैंड, एक बीच बॉल, पृथ्वी, सूर्य और आकाशगंगा के बीच के पैमाने के अंतर का 3डी विज़ुअलाइज़ेशन बनाने के लिए कहा। जैसा कि यहां दिखाया गया है.
जेमिनी 3 ने Google द्वारा दिखाए गए समान एक इंटरैक्टिव विज़ुअल बनाया, जिससे मुझे स्क्रॉल करने और विभिन्न तत्वों के आकार की तुलना करने की इजाजत मिली, जो प्रोटॉन से शुरू होने और ब्रह्मांडीय वेब तक अधिकतम तक छोटे से बड़े तक हर एक को सही ढंग से सूचीबद्ध करता प्रतीत होता था। (निष्पक्ष होने के लिए, मैं करूँगा आशा जेमिनी यह पता लगा सकते हैं कि एक बीच बॉल सूर्य से बहुत छोटी है।) इसमें डेमो में दिखाई गई लगभग सभी चीजें शामिल थीं, लेकिन इसकी छवि गुणवत्ता कुछ क्षेत्रों में कम हो गई, क्योंकि डीएनए और बीच बॉल के स्ट्रैंड के 3 डी मॉडल Google द्वारा दिखाए गए की तुलना में काफी मंद थे। खाना खिलाते समय मैंने बहुत कुछ वैसा ही देखा गूगल का अन्य मिथुन राशि में डेमो. मॉडल ने सही अवधारणा बताई, लेकिन यह हमेशा थोड़ा घटिया था, चाहे इसका रिज़ॉल्यूशन कम था या बस थोड़ा अधिक अव्यवस्थित था।
जब मैंने कुछ सरल करने की कोशिश की तो जेमिनी 3 का आउटपुट Google के डेमो के अनुरूप नहीं था। मैंने इसे एक पेड़ की शाखा पर बैठे वोक्सेल-आर्ट ईगल के एक मॉडल को फिर से बनाने के लिए कहा, और जबकि मेरे परिणाम डेमो के समान थे, मैं मदद नहीं कर सका लेकिन ध्यान दिया कि ईगल की कोई आंखें नहीं थीं, और पेड़ ट्रंक रहित थे। Google के उदाहरण से, वोक्सेल-शैली का पांडा ठीक निकला, लेकिन पेंगुइन और कछुए के मानक 3D मॉडल बहुत ही आदिम निकले, जिनमें बहुत कम या कोई विवरण नहीं था।
लेकिन जेमिनी 3 सिर्फ प्रोटोटाइप और मॉडलिंग के लिए नहीं बनाया गया है; Google प्रो ग्राहकों के लिए एक नई “जेनरेटिव यूआई” सुविधा का परीक्षण कर रहा है जो अपनी प्रतिक्रियाओं को “विज़ुअल” पत्रिका-शैली इंटरफ़ेस के अंदर, या “डायनामिक” इंटरैक्टिव वेबपेज के रूप में पैकेज करता है। मुझे केवल जेमिनी 3 के विज़ुअल लेआउट तक पहुंच मिली, जिसे Google ने आपकी यात्रा योजनाओं की कल्पना करने के एक तरीके के रूप में दिखाया, जैसे कि रोम की तीन दिवसीय यात्रा।
जब मैंने रोम यात्रा प्रॉम्प्ट को आज़माया, तो जेमिनी 3 ने मुझे एक वैयक्तिकृत वेबपेज जैसा दिखने वाला एक यात्रा कार्यक्रम प्रस्तुत किया, साथ ही इसे और अधिक अनुकूलित करने के विकल्पों के साथ, जैसे कि क्या मैं एक आरामदायक या तेज़ गति वाली छुट्टी पसंद करूंगा या क्या मैं कुछ भोजन शैलियों को प्राथमिकता दूंगा। एक बार जब आप अपनी प्राथमिकताएँ सबमिट कर देंगे, तो जेमिनी 3 आपके चयन से मेल खाने के लिए लेआउट को फिर से डिज़ाइन करेगा। मैंने पाया कि यह सुविधा अन्य विषयों पर भी इंटरैक्टिव गाइड प्रदान कर सकती है, जैसे कंप्यूटर कैसे बनाएं या एक्वेरियम कैसे स्थापित करें।
इसके बाद, मैंने जेमिनी एजेंट के साथ एक छोटा सा प्रयोग किया, एक सुविधा जिसे Google जेमिनी ऐप के अंदर अल्ट्रा सब्सक्राइबर्स के लिए परीक्षण कर रहा है। अन्य एजेंटिक सुविधाओं की तरह, जेमिनी एजेंट का लक्ष्य आपकी ओर से कार्य करना है, जैसे आपके कैलेंडर में अनुस्मारक जोड़ना और आरक्षण बनाना।
Google द्वारा साझा किया गया एक उदाहरण दिखाता है कि जेमिनी एजेंट एक जीमेल इनबॉक्स का आयोजन कर रहा है, इसलिए मैंने टूल से भी ऐसा ही करने के लिए कहा – और, ठीक है, इसने मेरे आदेशों का पालन किया। इसे पिछले सप्ताह के 99 अपठित ईमेल मिले और उन्हें एक इंटरैक्टिव चार्ट के अंदर प्रदर्शित किया गया। जेमिनी ने आरएसवीपी और बिल जैसी सबसे महत्वपूर्ण चीज़ों के लिए अनुस्मारक सेट करने के विकल्प प्रदान किए, जबकि प्रचार के रूप में पहचाने जाने वाले ईमेल को संग्रहीत करने के लिए बटन की पेशकश की। मैंने Google जेमिनी से अपने बिल का भुगतान करने के लिए एक अनुस्मारक शेड्यूल करने के लिए कहा, और AI सहायक ने इसे सही देय तिथि के साथ Google कार्य में डाल दिया। जब मैंने इसे बिल का भुगतान करने के लिए कहा, तो इसने बिलिंग इंटरफ़ेस को नेविगेट किया और मुझसे अपना भुगतान विवरण दर्ज करने के लिए कहने के करीब आया, लेकिन (एजेंट एआई के आसपास सुरक्षा चिंताओं को देखते हुए) मैंने इसे आगे बढ़ने से रोक दिया।
हालाँकि आप अपने इनबॉक्स को मैन्युअल रूप से व्यवस्थित कर सकते हैं, मुझे जेमिनी 3 की सहायता कुछ हद तक मददगार लगी, क्योंकि इसने कुछ भूले हुए ईमेल खोजे जो शायद मुझसे छूट गए थे। आप जेमिनी को बड़ी संख्या में स्पैम ईमेल प्रदाताओं को ढूंढने और सदस्यता समाप्त करने के लिए भी कह सकते हैं, जो अच्छा है।
पर्प्लेक्सिटी के एआई सहायक, चैटजीपीटी और जेमिनी के बीच, Google का एआई चैटबॉट (अनुमानतः) जीमेल के साथ सबसे समृद्ध एकीकरण प्रदान करता है। उलझन आपके इनबॉक्स में सूचीबद्ध ईमेल को खींच लेगी, लेकिन आपको केवल एक बटन दबाने के बजाय यह बताना होगा कि किसे रखना है, संग्रहीत करना है या हटाना है, जैसा कि आप मिथुन राशि के साथ कर सकते हैं। किसी कारण से, चैटजीपीटी ने मेरे इनबॉक्स को व्यवस्थित करने से इनकार कर दिया, यह दावा करते हुए कि मेरी ओर से ऐप के माध्यम से आसानी से एक ईमेल भेजने के बावजूद जीमेल के साथ इसका एकीकरण “केवल पढ़ने के लिए” मोड में है। लेकिन जबकि जेमिनी सीधे जीमेल से जुड़ा है, फिर भी यह पर्प्लेक्सिटी की तुलना में ऐप में ईमेल भेजने में बहुत धीमा था।
मिथुन लगभग बिना किसी हस्तक्षेप के एक रेस्तरां आरक्षण बुक करने में कामयाब रहे, केवल मुझे गलत तरीके से यह बताने के लिए कि बुकिंग को अंतिम रूप देने से ठीक पहले करने में “लागत” जुड़ी हुई है। जब मैंने शुल्क के बारे में पूछा, तो जेमिनी 3 पीछे हट गया और कहा कि यह रेस्तरां के 16 प्रतिशत सेवा शुल्क का “संभवतः उल्लेख” है। इसके बाद इसने मुझसे मेरे आरक्षण की पुष्टि करने के लिए कहा तीन बार और फिर मुझे बताया कि इसमें फिर से एक वित्तीय लेनदेन शामिल था। साँस. फिर, मुझे लगा कि मैं इन कार्यों को स्वयं कहीं अधिक तेजी से पूरा कर सकता हूं।
कार्यों को पूरा करने में आने वाली बाधाओं के बावजूद, जेमिनी 3 प्रो की इंटरैक्टिव विज़ुअलाइज़ेशन सुविधाएँ प्रभावशाली थीं, और मैं देख सकता था कि कुछ परिदृश्यों में इंटरैक्टिव मॉडल या विज़ुअल लेआउट कैसे उपयोगी हो सकते हैं – हालाँकि मैं खुद को दैनिक आधार पर उनका उपयोग करते हुए नहीं देख सकता, और जेमिनी के पाठ-आधारित उत्तर आमतौर पर मेरे लिए पर्याप्त जानकारीपूर्ण होते हैं। अभी के लिए, मुझे लगता है कि मैं हमेशा की तरह जेमिनी का उपयोग करना जारी रखूंगा: उन प्रश्नों के लिए जिन्हें मैं वेब ब्राउज़ करने पर तुरंत नहीं ढूंढ पाऊंगा।













