मैं यह समझना शुरू कर रहा हूं कि Google के विज़ुअल AI मॉडल को इसका नाम कहां से मिला, क्योंकि कुछ दिनों तक इसके साथ खेलने के बाद, मैं इसे इस तरह सारांशित करूंगा: केले। इससे उत्पन्न छवियाँ इतनी यथार्थवादी हैं कि ये केले जैसी हैं। मुझे ऐसा लग रहा है कि बहुत देर तक उन्हें घूरने के बाद मैं केला बन रहा हूँ। और अगर मुझे एक कारण बताना हो कि नैनो बनाना प्रो की छवियां उनके पहले आए एआई स्लोप की तुलना में इतनी अधिक यथार्थवादी क्यों दिखती हैं, तो वह यह है: वे फोन कैमरे से ली गई तस्वीरों की तरह दिखती हैं।
निश्चित रूप से, यदि आप उन्हें खोजते हैं तो कहानियाँ वहाँ मौजूद हैं। इस लेख के शीर्ष पर शहर के फुटपाथ पर (वास्तविक नहीं!) जोड़े की छवि लें। पृष्ठभूमि में स्ट्रीटलाइट मुझे बिल्कुल सही नहीं लगती है, और इमारत के कुछ अग्रभाग – विशेष रूप से पृष्ठभूमि में दूर – थोड़े अजीब और अवरुद्ध दिखते हैं। लेकिन अगर मैं सोशल मीडिया पर इस तस्वीर को स्क्रॉल कर रहा होता तो? किसी भी तरह से मैं इसे एआई के रूप में नहीं देखूंगा। विषय यथार्थवादी दिखते हैं, लेकिन मुझे लगता है कि तथ्य यह है कि छवि बहुत सही नहीं दिखती है, जो इसे बेचती है।
उज्ज्वल, सपाट प्रदर्शन, क्षेत्र की उदार गहराई, थोड़ा कुरकुरा विवरण: यह सब मुझे फ़ोन कैमरा की तरह आकर्षित करता है। लोकप्रिय iPhone कैमरा ऐप हैलाइड के सह-संस्थापक बेन सैंडोफ़्स्की सहमत हैं। ऊपर नौका नाव की एआई-जनरेटेड छवि में, उन्होंने “स्मार्ट फोन फ़ोटो पर आपके सामने आने वाली आक्रामक छवि को तेज करने” का उल्लेख किया। यह एक दृश्य चाल है जो छवि को ‘पॉप’ करने में मदद करती है।” फोन से ली गई तस्वीरों की एक और बानगी? शोर। “अधिकांश एआई जनित तस्वीरें बहुत साफ-सुथरी लगती हैं। इन तस्वीरों की बनावट ऐसी लगती है जैसे वे किसी छोटे स्मार्ट फोन सेंसर से आई हों।”
तो Google का AI फ़ोन फ़ोटो के बारे में अपनी धारणाएँ कहाँ से प्राप्त कर रहा है? Google फ़ोटो जाने के लिए एक स्पष्ट – और गहरी समस्याग्रस्त – जगह प्रतीत होगी, लेकिन जेमिनी ऐप के वैश्विक संचार प्रबंधक एलिजा लॉल का कहना है कि “नैनो केले के लिए हम Google फ़ोटो का उपयोग नहीं करते हैं।” उन्होंने मुझे यह भी बताया कि नैनो बनाना प्रो को विशेष रूप से फ़ोन कैमरा लुक देने की दिशा में आगे नहीं बढ़ाया गया है। वे कहते हैं, “एक बड़ा सुधार यह है कि यह Google खोज से जुड़ सकता है।” यदि आप इसे आज के मौसम के बारे में एक इन्फोग्राफिक बनाने के लिए संकेत देते हैं, तो यह तापमान को देख सकता है – पहले, आपको उस जानकारी को अपने संकेत में शामिल करने की आवश्यकता होगी।
लॉल के अनुसार, यह टेक्स्ट खोज तक ही सीमित है न कि छवि खोज तक। लेकिन सक्षम होना मिल जाना वास्तविक दुनिया की जानकारी अपने आप में यहां एक प्रमुख घटक हो सकती है। नैनो बनाना प्रो उन चीज़ों को छवियों में जोड़ने में विशेष रूप से अच्छा है जो उस संदर्भ में समझ में आते हैं – भले ही आपने उनके लिए विशेष रूप से कभी नहीं पूछा हो। इसमें स्पष्ट रूप से बताए बिना अवधि-उपयुक्त कपड़े और कारों जैसे ऐतिहासिक तत्वों को जोड़ा जा सकता है। इसके लिए एक वॉटरमार्क भी जोड़ा गया नॉर्थवेस्ट मल्टीपल लिस्टिंग सेवा जब मैंने इसे सिएटल में एक नकली घर के लिए नकली ज़िलो लिस्टिंग बनाने के लिए कहा। असाइनमेंट को समझने और बिना बताए उन छोटे विवरणों को जोड़ने में यह बहुत बेहतर हो रहा है।
मैंने जेमिनी से वेस्ट सिएटल में सफेद पेंट और काले ट्रिम के साथ एक शिल्पकार-शैली के घर की ज़िलो सूची मांगी। इसने जगह का वर्णन करने वाली एक शब्दयुक्त टेक्स्ट-केवल सूची वापस दे दी, लेकिन एक अन्य संकेत के साथ, मैंने विवरण के साथ जाने के लिए एक छवि बनाने के लिए नैनो बनाना प्रो का उपयोग किया। मैंने विशेष रूप से इसके लिए नहीं कहा था, लेकिन छवि में 2023 का कॉपीराइट शामिल है, जो बेहद हास्यास्पद है, और एक वॉटरमार्क जैसा कि मूल रूप से हर रियल एस्टेट फोटो पर होता है जो आपको ग्रेटर सिएटल क्षेत्र में मिलता है। दिलचस्प बात यह है कि यह वर्तमान लोगो नहीं है – यह पिछला संस्करण है, जो 2018 में मेरे द्वारा खरीदे गए घर की हर तस्वीर पर समान है।
मैंने Google से पूछा कि नैनो बनाना संभवतः कहां से आ सकता है, और डीपमाइंड उत्पाद प्रबंधक नैना रायसिंघानी ने सुझाव दिया कि यह एक मतिभ्रम था, इस कथन की पेशकश करते हुए: “नैनो बनाना प्रो चरित्र स्थिरता, छवि निर्माण और खोज-आधारित सटीकता के लिए प्रमुख उन्नयन प्रदान करता है। हालांकि यह आज तक का हमारा सबसे सटीक छवि मॉडल है, एआई मतिभ्रम हो सकता है। यदि कोई छवि बिल्कुल सही नहीं है, तो हम आपको पुनः प्रयास करने के लिए प्रोत्साहित करते हैं, क्योंकि बाद के प्रयास अक्सर आपके इरादे के अनुरूप परिणाम देते हैं।” बात यह है कि, रियल एस्टेट लिस्टिंग सेवा के लिए वॉटरमार्क जोड़ने से ऐसा लगता है कि मॉडल बिल्कुल उसी तरह काम कर रहा है जैसा कि इरादा था।
वॉटरमार्क या नहीं, मुझे लगता है कि “बिक्री के लिए” चिह्न पर छोटा प्रिंट इसे एआई के रूप में पेश कर सकता है, या हो सकता है कि सामने के बरामदे पर गमले में लगे पौधे कुछ ज्यादा ही सही दिखें, लेकिन ईमानदारी से? मुझे यह विश्वास करने में कठिनाई हो रही है कि यह घर असली नहीं है, भले ही मैं जानता हूँ कि यह असली नहीं है। अगर मुझे यह रियल एस्टेट वेबसाइट पर मिले तो मैं इस पर दोबारा विचार नहीं करूंगा और वॉटरमार्क निश्चित रूप से इसे असली के रूप में बेचने में मदद करेगा। यदि एआई उन चीजों की नकल करने में इतना अच्छा हो रहा है जो संकेत देती हैं कि फोटो वास्तविक है, तो दोस्तों: हम तैयार हैं।
यह मेरे लिए सबसे अधिक चिंता का विषय है: एआई के कथनों को पहचानना कठिन होता जा रहा है, और नैनो केला छोटे-छोटे विवरणों की नकल करने में बेहतर हो रहा है जो छवि को वास्तविक बनाते हैं। हमने इसे चित्रित करने के लिए कुछ अस्पष्ट संकेत दिए कगार किसी लाइव इवेंट को कवर करने वाला रिपोर्टर; इसमें माइक्रोफ़ोन जैसे विवरण जोड़े गए कगार रिपोर्टर के हाथ में लोगो और स्क्रीन के निचले हिस्से में एक काइरॉन। कोई गलत वर्तनी या विदेशी दिखने वाले अक्षर नहीं। छह अंगुलियों वाला कोई हाथ नहीं. ऐसा कुछ भी नहीं है जो स्पष्ट रूप से इसे एआई के रूप में बताए और इसे वास्तविक सौदे के रूप में बेचने के लिए बहुत सारे छोटे-छोटे विवरण हों।
एक साल पहले, या कुछ महीने पहले भी, मुझे एहसास हुआ था कि भविष्य में एक दिन आने वाला है, एक ऐसा दिन जब किसी अपरिचित स्रोत से ऑनलाइन देखी गई किसी भी तस्वीर या वीडियो पर विश्वास करना बुद्धिमानी नहीं होगी जब तक कि अन्यथा साबित न हो। इस अभ्यास ने मुझे आश्वस्त कर दिया है कि वह दिन भविष्य में नहीं है; यह अब यहाँ है. अपने एआई रडार को उचित रूप से ट्यून करें, और अगर यह आपको थोड़ा परेशान कर दे तो आश्चर्यचकित न हों।













