मैंने Google के नए नैनो बनाना प्रो को आज़माया और इसने तुरंत मेरे कपड़े उतार दिए। मैंने इसके लिए नहीं कहा, लेकिन एआई मॉडल ने स्पष्ट रूप से निर्णय लिया कि मेरा ग्रीटिंग कार्ड अधिक त्वचा के साथ बेहतर दिखेगा।
जैसा कि नाम से पता चलता है, नैनो बनाना प्रो पेशेवरों के लिए है। जेमिनी 3 द्वारा संचालित, यह प्रभावी रूप से कंपनी के लोकप्रिय इमेज जेनरेशन और एडिटिंग टूल का अपग्रेड है जो सोशल मीडिया ट्रेंड में वायरल हो गया जिसने सेल्फी को अतियथार्थवादी 3डी मूर्तियों में बदल दिया। Google का कहना है कि यह आपको उच्च गुणवत्ता वाली छवियां बनाने देता है जिन्हें आप प्रिंट कर सकते हैं, चित्रों पर सुपाठ्य पाठ प्रस्तुत कर सकते हैं, और कई छवियों को एक साथ एक ही रचना में मिश्रित कर सकते हैं। Google DeepMind की उत्पाद प्रबंधक नैना रायसिंघानी ने बताया, “यह उन लोगों के लिए भी है जो पेशेवरों की तरह महसूस करना चाहते हैं।” द वर्ज. यह अच्छा लगता है, क्योंकि मैं किसी भी तरह से पेशेवर नहीं हूं। मेरे लिए, परिणाम चमकदार, लेकिन मूर्खतापूर्ण थे। यह अच्छा लग रहा था, लेकिन शौकिया तौर पर लगा।
नैनो बनाना प्रो का उपयोग करना बहुत सरल है: आप जेमिनी ऐप में जाएं, “चित्र बनाएं” चुनें और ‘सोच’ मोड पर टॉगल करें। बस अपना प्रॉम्प्ट प्लग इन करें (और छवि, यदि आप एक का उपयोग कर रहे हैं) और जाएं। यह मुफ़्त भी है, हालाँकि इसकी कुछ सीमाएँ हैं, Google AI प्लस, प्रो और अल्ट्रा ग्राहकों के लिए कोटा का विस्तार किया गया है।
Google कुछ साहसिक दावे करता है, “स्टूडियो-गुणवत्ता वाले डिज़ाइन,” “त्रुटिहीन पाठ प्रतिपादन,” और कई बेहतरीन और रचनात्मक संपादन का वादा करता है। इनका परीक्षण करने के लिए, मैंने अपने पास की एक साधारण तस्वीर अपलोड की द वर्ज का पृष्ठभूमि में ब्रुकलिन ब्रिज के साथ न्यूयॉर्क में कार्यालय। मैंने जेमिनी से प्रकाश को दिन से रात में बदलने के लिए कहा और इसने बहुत अच्छा काम किया। परिणाम विश्वसनीय लगता है. इसने उन विवरणों को भी संभाला जो अक्सर छवि जनरेटर को बाधित कर देते हैं, जैसे कारों का सही दिशा में जाना। कैमरा एंगल को एडजस्ट करना भी उतना ही आसान था। मैंने जेमिनी से शॉट को फिर से बनाने के लिए कहा जैसे कि यह दाईं ओर एक ऊंचे कोण से लिया गया हो और ऐसा हुआ।


छवि: द वर्ज और छवि: द वर्ज/गूगल, नैनो बनाना प्रो
Google का यह भी कहना है कि नैनो बनाना प्रो मौसम या खेल जैसी वास्तविक समय की जानकारी को देखने में मदद करने के लिए इन्फोग्राफिक्स और आरेख बना सकता है। ब्रिटिश होने के नाते, मैंने वाशिंगटन, डीसी और न्यूयॉर्क शहर में, जहां मैं इस समय हूं, अगले चार दिनों के मौसम के बारे में पूछा। दृश्यतः, इन्फोग्राफिक एक बुनियादी पूर्वानुमान साइट पर घर पर होता। पाठ और संख्याएँ सामान्य दिखाई दीं – उस विकृत बकवास से बिल्कुल अलग जो आप अक्सर एआई-जनरेटेड छवियों में देखते हैं – और जेमिनी ने मुझे अंत में उद्धरणों की एक सूची दी जिससे मुझे यह पुष्टि करने में मदद मिली कि यह सटीक था।
मॉडल अधिक जटिल कार्यों में थोड़ा लड़खड़ाया। मैंने उससे हाल ही का सारांश प्रस्तुत करने के लिए कहा कगार कहानी इस बारे में है कि कैसे यूरोप कॉमिक बुक-शैली प्रारूप में अपने एआई और गोपनीयता कानूनों को वापस ले रहा है। चित्र और पाठ वास्तव में एक कार्टूनिस्ट फ़ॉन्ट में दोषरहित रूप से प्रस्तुत किए गए थे, लेकिन कॉमिक ने कहानी को संक्षेप में प्रस्तुत नहीं किया, इसके बजाय ब्लॉक के एआई अधिनियम का एक अस्पष्ट अवलोकन दिया। समस्या शायद इसलिए हुई क्योंकि मैंने पाठ को चिपकाने के बजाय जेमिनी को कहानी का एक लिंक दिया।
जब मैंने ऐसा किया तो इसने मुझे एक प्रचलित हास्य-शैली का सारांश दिया। इसने वास्तविक कहानी का सार बता दिया, हालाँकि मुझे नहीं लगता कि अगर मैंने स्रोत सामग्री नहीं लिखी होती तो मैं आसानी से समझ पाता। इसमें ऐसे वाक्यांश भी बने जो मेरे लेख में कहीं भी दिखाई नहीं दिए।
वास्तव में एक पेशेवर डिजाइनर की तरह महसूस करने के लिए, मैंने ग्रीटिंग कार्ड बनाने में अपना हाथ आजमाया। आख़िरकार क्रिसमस आ रहा है। इस बात पर विचार करते हुए कि मैंने केवल तीन सेल्फी अपलोड की हैं, जेमिनी ने स्पष्ट रूप से आश्चर्यजनक काम करते हुए मेरे तीन पूर्ण-शरीर संस्करण तैयार किए, जिनमें से प्रत्येक अलग-अलग पोशाक में था और एक अलग चेहरे की अभिव्यक्ति थी। इसने क्रिसमस पेड़ों के साथ एक यथार्थवादी, बर्फीली सेटिंग भी बनाई, जैसा कि मैंने इसे करने के लिए कहा था, और “मेरी क्रिसमस!” शीर्ष पर जैसे मैंने उससे पूछा था।
जब मैंने उससे कार्ड की बर्फीली पृष्ठभूमि को ऑस्ट्रेलियाई शैली की छुट्टियों के लिए ग्रीष्मकालीन समुद्र तट में बदलने के लिए कहा तो जेमिनी ने स्वतंत्रता ले ली। वे आज़ादी मेरे डीपफेक कपड़े थे: मेरे दो क्लोन टॉपलेस थे। यह अजीब था. सर्दियों के दृश्य से स्नोमैन को बदलने के लिए कुछ प्रमुख एआई-जनित पैर और एक स्माइली सैंडमैन भी थे (मेरे टॉपलेस हमशक्ल द्वारा बनाया जा रहा है)। हालाँकि, कुछ मुद्दे थे – चित्र में अन्य प्रस्तुत वस्तुओं के विपरीत, सैंडमैन की कोई छाया नहीं थी, और ताड़ के पेड़ों में क्रिसमस की रोशनी चमकदार सूरज में जादुई रूप से चमक रही थी। मैंने इसे केवल एक क्लोन में कुछ मांसपेशियाँ जोड़ने के लिए कहकर इसके सटीक संपादन कौशल का परीक्षण किया, जो इसने सेकंडों में किया (यदि वास्तविक दुनिया में यह इतना आसान होता)। कुल मिलाकर, गुणवत्ता शानदार थी, और छवि कुछ हद तक विश्वसनीय होती (एब्स को छोड़कर) यदि आपको नहीं पता होता कि मेरी छाती पर एक बड़ा टैटू गायब है।
हालाँकि, यह सब बढ़िया नहीं था। मॉडल मेरे कार्ड पर वही सटीक टेक्स्ट संरक्षित करने में विफल रहा जो मैंने उससे मांगा था। “मेरी क्रिसमस!” के बजाय इसने “ऑस्ट्रेलियाई ग्रीष्मकालीन क्रिसमस!” का विकल्प चुना। यह जानवरों के साथ संघर्ष करता हुआ भी प्रतीत होता है: मेरी बहन की बिल्ली बिल्कुल उसी झुकी हुई मुद्रा में बैठी है जैसा कि मैंने कार्ड के हर संस्करण में संदर्भ छवि प्रदान की थी (हालाँकि, उसे एक सनकी सांता टोपी दी गई थी)।
कुल मिलाकर, मैं प्रभावित हुआ। नैनो बनाना प्रो मूल मॉडल पर एक स्पष्ट अपग्रेड है। मैं अधिक सटीक संपादनों के लिए पूछने में सक्षम था और यह वास्तव में समझदार पाठ का उत्पादन करता है, वास्तविक दुनिया में इस तरह के जेनरेटिव एआई टूल के उपयोग को रोकने वाली एक बड़ी बाधा को हटा देता है। लेकिन अफसोस, ये खूबियाँ मुझे एक अच्छा डिजाइनर बनाने के लिए पर्याप्त नहीं थीं।












