Google का AI मॉडल फ़ोन फ़ोटो को स्पूफ करने में वास्तव में अच्छा हो रहा है

मैं यह समझना शुरू कर रहा हूं कि Google के विज़ुअल AI मॉडल को इसका नाम कहां से मिला, क्योंकि कुछ दिनों तक इसके साथ खेलने के बाद, मैं इसे इस तरह सारांशित करूंगा: केले। इससे उत्पन्न छवियाँ इतनी यथार्थवादी हैं कि ये केले जैसी हैं। मुझे ऐसा लग रहा है कि बहुत देर तक उन्हें घूरने के बाद मैं केला बन रहा हूँ। और अगर मुझे एक कारण बताना हो कि नैनो बनाना प्रो की छवियां उनके पहले आए एआई स्लोप की तुलना में इतनी अधिक यथार्थवादी क्यों दिखती हैं, तो वह यह है: वे फोन कैमरे से ली गई तस्वीरों की तरह दिखती हैं।

निश्चित रूप से, यदि आप उन्हें खोजते हैं तो कहानियाँ वहाँ मौजूद हैं। इस लेख के शीर्ष पर शहर के फुटपाथ पर (वास्तविक नहीं!) जोड़े की छवि लें। पृष्ठभूमि में स्ट्रीटलाइट मुझे बिल्कुल सही नहीं लगती है, और इमारत के कुछ अग्रभाग – विशेष रूप से पृष्ठभूमि में दूर – थोड़े अजीब और अवरुद्ध दिखते हैं। लेकिन अगर मैं सोशल मीडिया पर इस तस्वीर को स्क्रॉल कर रहा होता तो? किसी भी तरह से मैं इसे एआई के रूप में नहीं देखूंगा। विषय यथार्थवादी दिखते हैं, लेकिन मुझे लगता है कि तथ्य यह है कि छवि बहुत सही नहीं दिखती है, जो इसे बेचती है।

एक नौका नाव की एआई छवि

पहाड़ थोड़ा बड़ा और नाटकीय है, लेकिन जिस तरह से नाव, पानी और शहर को प्रस्तुत किया गया है, वह काफी हद तक एक फोन जैसा दिखता है।
छवि: नैनो बनाना प्रो

उज्ज्वल, सपाट प्रदर्शन, क्षेत्र की उदार गहराई, थोड़ा कुरकुरा विवरण: यह सब मुझे फ़ोन कैमरा की तरह आकर्षित करता है। लोकप्रिय iPhone कैमरा ऐप हैलाइड के सह-संस्थापक बेन सैंडोफ़्स्की सहमत हैं। ऊपर नौका नाव की एआई-जनरेटेड छवि में, उन्होंने “स्मार्ट फोन फ़ोटो पर आपके सामने आने वाली आक्रामक छवि को तेज करने” का उल्लेख किया। यह एक दृश्य चाल है जो छवि को ‘पॉप’ करने में मदद करती है।” फोन से ली गई तस्वीरों की एक और बानगी? शोर। “अधिकांश एआई जनित तस्वीरें बहुत साफ-सुथरी लगती हैं। इन तस्वीरों की बनावट ऐसी लगती है जैसे वे किसी छोटे स्मार्ट फोन सेंसर से आई हों।”

भीड़ भरी बस के इंटीरियर का AI प्रतिपादन

यहां तक ​​कि एआई-जनित किंग काउंटी मेट्रो सवार भी बस में अपना बैकपैक उतारने से इनकार करते हैं।
छवि: नैनो बनाना प्रो

तो Google का AI फ़ोन फ़ोटो के बारे में अपनी धारणाएँ कहाँ से प्राप्त कर रहा है? Google फ़ोटो जाने के लिए एक स्पष्ट – और गहरी समस्याग्रस्त – जगह प्रतीत होगी, लेकिन जेमिनी ऐप के वैश्विक संचार प्रबंधक एलिजा लॉल का कहना है कि “नैनो केले के लिए हम Google फ़ोटो का उपयोग नहीं करते हैं।” उन्होंने मुझे यह भी बताया कि नैनो बनाना प्रो को विशेष रूप से फ़ोन कैमरा लुक देने की दिशा में आगे नहीं बढ़ाया गया है। वे कहते हैं, “एक बड़ा सुधार यह है कि यह Google खोज से जुड़ सकता है।” यदि आप इसे आज के मौसम के बारे में एक इन्फोग्राफिक बनाने के लिए संकेत देते हैं, तो यह तापमान को देख सकता है – पहले, आपको उस जानकारी को अपने संकेत में शामिल करने की आवश्यकता होगी।

लॉल के अनुसार, यह टेक्स्ट खोज तक ही सीमित है न कि छवि खोज तक। लेकिन सक्षम होना मिल जाना वास्तविक दुनिया की जानकारी अपने आप में यहां एक प्रमुख घटक हो सकती है। नैनो बनाना प्रो उन चीज़ों को छवियों में जोड़ने में विशेष रूप से अच्छा है जो उस संदर्भ में समझ में आते हैं – भले ही आपने उनके लिए विशेष रूप से कभी नहीं पूछा हो। इसमें स्पष्ट रूप से बताए बिना अवधि-उपयुक्त कपड़े और कारों जैसे ऐतिहासिक तत्वों को जोड़ा जा सकता है। इसके लिए एक वॉटरमार्क भी जोड़ा गया नॉर्थवेस्ट मल्टीपल लिस्टिंग सेवा जब मैंने इसे सिएटल में एक नकली घर के लिए नकली ज़िलो लिस्टिंग बनाने के लिए कहा। असाइनमेंट को समझने और बिना बताए उन छोटे विवरणों को जोड़ने में यह बहुत बेहतर हो रहा है।

एक शिल्पकार शैली के घर की एआई छवि

छवि: नैनो बनाना प्रो

मैंने जेमिनी से वेस्ट सिएटल में सफेद पेंट और काले ट्रिम के साथ एक शिल्पकार-शैली के घर की ज़िलो सूची मांगी। इसने जगह का वर्णन करने वाली एक शब्दयुक्त टेक्स्ट-केवल सूची वापस दे दी, लेकिन एक अन्य संकेत के साथ, मैंने विवरण के साथ जाने के लिए एक छवि बनाने के लिए नैनो बनाना प्रो का उपयोग किया। मैंने विशेष रूप से इसके लिए नहीं कहा था, लेकिन छवि में 2023 का कॉपीराइट शामिल है, जो बेहद हास्यास्पद है, और एक वॉटरमार्क जैसा कि मूल रूप से हर रियल एस्टेट फोटो पर होता है जो आपको ग्रेटर सिएटल क्षेत्र में मिलता है। दिलचस्प बात यह है कि यह वर्तमान लोगो नहीं है – यह पिछला संस्करण है, जो 2018 में मेरे द्वारा खरीदे गए घर की हर तस्वीर पर समान है।

मैंने Google से पूछा कि नैनो बनाना संभवतः कहां से आ सकता है, और डीपमाइंड उत्पाद प्रबंधक नैना रायसिंघानी ने सुझाव दिया कि यह एक मतिभ्रम था, इस कथन की पेशकश करते हुए: “नैनो बनाना प्रो चरित्र स्थिरता, छवि निर्माण और खोज-आधारित सटीकता के लिए प्रमुख उन्नयन प्रदान करता है। हालांकि यह आज तक का हमारा सबसे सटीक छवि मॉडल है, एआई मतिभ्रम हो सकता है। यदि कोई छवि बिल्कुल सही नहीं है, तो हम आपको पुनः प्रयास करने के लिए प्रोत्साहित करते हैं, क्योंकि बाद के प्रयास अक्सर आपके इरादे के अनुरूप परिणाम देते हैं।” बात यह है कि, रियल एस्टेट लिस्टिंग सेवा के लिए वॉटरमार्क जोड़ने से ऐसा लगता है कि मॉडल बिल्कुल उसी तरह काम कर रहा है जैसा कि इरादा था।

वॉटरमार्क या नहीं, मुझे लगता है कि “बिक्री के लिए” चिह्न पर छोटा प्रिंट इसे एआई के रूप में पेश कर सकता है, या हो सकता है कि सामने के बरामदे पर गमले में लगे पौधे कुछ ज्यादा ही सही दिखें, लेकिन ईमानदारी से? मुझे यह विश्वास करने में कठिनाई हो रही है कि यह घर असली नहीं है, भले ही मैं जानता हूँ कि यह असली नहीं है। अगर मुझे यह रियल एस्टेट वेबसाइट पर मिले तो मैं इस पर दोबारा विचार नहीं करूंगा और वॉटरमार्क निश्चित रूप से इसे असली के रूप में बेचने में मदद करेगा। यदि एआई उन चीजों की नकल करने में इतना अच्छा हो रहा है जो संकेत देती हैं कि फोटो वास्तविक है, तो दोस्तों: हम तैयार हैं।

एप्पल पार्क में एक रिपोर्टर की एआई छवि

नैनो केला यहां एप्पल पार्क में कुछ अलग-अलग जगहों पर धूम मचा रहा है, लेकिन माहौल सही है। दिलचस्प बात यह है कि इसमें एक पुराना जोड़ा गया कगार लोगो यहाँ भी. आपको आश्चर्यचकित कर देता है.
छवि: नैनो बनाना प्रो

यह मेरे लिए सबसे अधिक चिंता का विषय है: एआई के कथनों को पहचानना कठिन होता जा रहा है, और नैनो केला छोटे-छोटे विवरणों की नकल करने में बेहतर हो रहा है जो छवि को वास्तविक बनाते हैं। हमने इसे चित्रित करने के लिए कुछ अस्पष्ट संकेत दिए कगार किसी लाइव इवेंट को कवर करने वाला रिपोर्टर; इसमें माइक्रोफ़ोन जैसे विवरण जोड़े गए कगार रिपोर्टर के हाथ में लोगो और स्क्रीन के निचले हिस्से में एक काइरॉन। कोई गलत वर्तनी या विदेशी दिखने वाले अक्षर नहीं। छह अंगुलियों वाला कोई हाथ नहीं. ऐसा कुछ भी नहीं है जो स्पष्ट रूप से इसे एआई के रूप में बताए और इसे वास्तविक सौदे के रूप में बेचने के लिए बहुत सारे छोटे-छोटे विवरण हों।

एक साल पहले, या कुछ महीने पहले भी, मुझे एहसास हुआ था कि भविष्य में एक दिन आने वाला है, एक ऐसा दिन जब किसी अपरिचित स्रोत से ऑनलाइन देखी गई किसी भी तस्वीर या वीडियो पर विश्वास करना बुद्धिमानी नहीं होगी जब तक कि अन्यथा साबित न हो। इस अभ्यास ने मुझे आश्वस्त कर दिया है कि वह दिन भविष्य में नहीं है; यह अब यहाँ है. अपने एआई रडार को उचित रूप से ट्यून करें, और अगर यह आपको थोड़ा परेशान कर दे तो आश्चर्यचकित न हों।

विषयों और लेखकों का अनुसरण करें इस कहानी से अपने वैयक्तिकृत होमपेज फ़ीड में इस तरह की और अधिक जानकारी देखने और ईमेल अपडेट प्राप्त करने के लिए।

क्लाउडफ़ेयर ने चेतावनी दी है कि 2027 तक बॉट ट्रैफ़िक ऑनलाइन मनुष्यों से आगे निकल जाएगा

Source link

Leave a Comment