एआई इमेज जेनरेटर खराब दिखने से बेहतर हो जाते हैं

याद रखें जब AI छवियां एक पंचलाइन थीं? टेढ़ी-मेढ़ी उंगलियां, रबर जैसे अंग और अलौकिक चमक तत्काल उपहार थे। अब और नहीं। एआई छवि जनरेटर वास्तविक कैमरों की खामियों को स्वीकार करके ठोस नकली बनाने में इतने अच्छे हो गए हैं कि यह बताना कि क्या वास्तविक है और क्या कृत्रिम है, लगभग असंभव हो गया है। युक्ति? उन्होंने परफेक्ट बनने की कोशिश करना बंद कर दिया।

एआई छवि निर्माण के शुरुआती दिन शुद्ध कॉमेडी गोल्ड थे। आपके संकेत ऐसे लोगों को सामने लाएंगे जिनके पास बहुत सारी उंगलियां हैं, जिनकी बनावट डिजिटल सूप की तरह दिखती है, और एक अलौकिक चिकनाई है जो ‘नकली’ चिल्लाती है। लेकिन वह युग निर्णायक रूप से ख़त्म हो चुका है। बदलाव इसलिए नहीं हुआ क्योंकि एआई इंजीनियरों ने अंततः फोटोरियलिज्म को तोड़ दिया। ऐसा इसलिए हुआ क्योंकि उन्होंने इसका पीछा करना बंद कर दिया.

TI 800V डेटासेंटर पावर आर्किटेक्चर के साथ आता है

गूगल 2025 के अंत में जब इसने अपने जेमिनी ऐप के भीतर नैनो बनाना प्रो का अनावरण किया तो एक वास्तविकता की जांच की गई। यह मॉडल लगभग तुरंत ही वायरल हो गया, लोगों ने इसका उपयोग अपने बारे में अजीब तरह से आश्वस्त करने वाली मूर्तियाँ बनाने के लिए किया। लेकिन यहां वह चीज़ है जो इसे अलग बनाती है: उस सिग्नेचर एआई चमक के साथ सब कुछ प्रस्तुत करने के बजाय, नैनो बनाना प्रो जानबूझकर फोन कैमरे पर कैप्चर की गई तस्वीरों की नकल करता है। इसका मतलब है कि कंट्रास्ट मुद्दे, आक्रामक शार्पनिंग कलाकृतियाँ, अजीब परिप्रेक्ष्य संपीड़न फोन बनाते हैं, और वे सभी प्रसंस्करण विकल्प जो आपके डिवाइस से स्नैपशॉट को तुरंत पहचानने योग्य बनाते हैं।

यह आधुनिक एआई छवि निर्माण के मूल में विरोधाभास है। जो चीज़ें किसी फ़ोटो को वास्तविक बनाती हैं, वे तकनीकी पूर्णता नहीं हैं। वे अपूर्णताएँ हैं। प्रशंसित iPhone कैमरा ऐप हैलाइड के सह-संस्थापक, बेन सैंडोफ़्स्की ने इसे सबसे अच्छी तरह से समझाया: फ़ोन कैमरा प्रोसेसिंग के स्वरूप को अपनाकर, जो पहले से ही हमारी तस्वीरों को “वास्तविकता से थोड़ा अप्रासंगिक” बनाता है, हो सकता है कि Google ने अलौकिक घाटी को पूरी तरह से दरकिनार कर दिया हो। एआई को संग्रहालय-गुणवत्ता की सटीकता के साथ वास्तविकता को फिर से बनाने की आवश्यकता नहीं है। इसे बस यह अनुकरण करने की आवश्यकता है कि हम सभी ने वास्तविकता को रिकॉर्ड करना कैसे सीखा है, जिसमें खामियां भी शामिल हैं।

यह ठीक नहीं है गूगल यह गेम खेल रहे हैं. एडोबजुगनू छवि जनरेटर में एक “विज़ुअल इंटेंसिटी” नियंत्रण शामिल है जो उपयोगकर्ताओं को उस चमकदार, अतिसुंदर सौंदर्य को कम करने देता है। मेटा एक “स्टाइलाइज़ेशन” स्लाइडर प्रदान करता है। यहां तक ​​की ओपनएआईका वीडियो जेनरेशन टूल सोरा 2 सुरक्षा कैमरे के फुटेज के दानेदार, कम-रिज़ॉल्यूशन लुक की नकल करके विश्वसनीय क्लिप तैयार करता है। जब आधार रेखा वोग कवर पूर्णता के बजाय सीसीटीवी गुणवत्ता है, तो एआई-जनरेटेड वीडियो को विश्वसनीय बनाना लगभग तुच्छ हो जाता है।

एनवीडिया के हुआंग द्वारा ओपनक्लॉ को ‘अगला चैटजीपीटी’ कहने के बाद चीनी एआई शेयरों में उछाल

DALL-E के आरंभिक पुनरावृत्तियों से प्रगति चौंका देने वाली है। पांच साल पहले, ओपनएआई 256×256 पिक्सेल थंबनेल के साथ लॉन्च किया गया। एक साल बाद, DALL-E 2 1024×1024 छवियों पर पहुंच गया, जो पहली नज़र में आश्चर्यजनक रूप से वास्तविक लग रहे थे, लेकिन जांच के दौरान टूटना शुरू हो गए। अभी भी बातें हो रही थीं. फायरफाइटर पोशाक पहने कुत्ते की आकृति अस्पष्ट और अजीब धब्बे थे। पूरी चीज़ में शैलीकरण की झलक थी जिसे आप एक तस्वीर के बजाय एक चित्रण के साथ जोड़ सकते हैं।