Google का नया एनीथिंग-टू-एनीथिंग एआई मॉडल बेहद अनोखा है

पिछले साल मैंने अपने बच्चे के भरवां जानवर को डीपफेक किया था ताकि ऐसा लगे कि उसका आलीशान हिरण छुट्टी पर था।

यह यह देखने के लिए एक प्रयोग था कि क्या मैं Google द्वारा चलाए जा रहे जेमिनी विज्ञापन में दर्शाई गई घटनाओं को फिर से बना सकता हूं, और मैंने कभी भी अपने चार साल के बच्चे को बडी हिरण के साहसिक कारनामों के वीडियो नहीं दिखाए। लेकिन यह एक खुलासा करने वाला अभ्यास था जिसने मुझे जेनरेटिव एआई और फुल-ऑन स्लॉप के साथ कुछ हानिरहित मनोरंजन के बीच अंतर के बारे में बहुत कुछ सोचने पर मजबूर कर दिया। हो सकता है कि वेन आरेख एक पूर्ण वृत्त हो! शायद नहीं. लेकिन मैं निश्चित रूप से जानता हूं कि यथार्थवादी वीडियो बनाने के उपकरण आश्चर्यजनक रूप से अच्छे हैं, इसके लिए आश्चर्यजनक रूप से कम प्रयास और जानकारी की आवश्यकता होती है। और यह चलन जेमिनी के ओम्नी युग में भी जारी है।

ओमनी जेनरेटिव मॉडल का एक नया परिवार है जो कथित तौर पर एक दिन किसी भी प्रकार के इनपुट – फोटो, वीडियो, टेक्स्ट – को किसी भी अन्य चीज़ में बदलने में सक्षम होगा। लेकिन शुरुआत के लिए, यह सिर्फ वीडियो बनाना है। ओमनी फ्लैश इनमें से पहला मॉडल है जिसे Google ने जारी किया है, जो अब कंपनी के AI वीडियो जेनरेशन और एडिटिंग प्लेटफॉर्म, फ्लो में उपलब्ध है। यदि आप चाहें तो आप अभी भी पिछले मॉडल, Veo का उपयोग कर सकते हैं, लेकिन ओमनी कुछ मायनों में Veo में सुधार करती है।

ओमनी के साथ, आप एक वीडियो अपलोड कर सकते हैं और उसे टेक्स्ट प्रॉम्प्ट के साथ अपने एआई-जनरेटेड निर्माण के शुरुआती बिंदु के रूप में उपयोग कर सकते हैं। Google यह भी दावा करता है कि वीडियो बनाते समय ओमनी अधिक वास्तविक दुनिया के ज्ञान को शामिल करता है और परिणामस्वरूप पूरे वीडियो में पात्रों को सुसंगत रखने का बेहतर काम कर सकता है। वास्तव में यह जानने का केवल एक ही तरीका था कि क्या वे दावे सच हैं: मैं एआई बडी को एक और साहसिक कार्य के लिए उसके छोटे एआई-जनरेटेड बैग पैक करने के लिए वापस लाया।

परिणाम इतने मिश्रित हैं कि वे चकित करने वाले हैं। कुछ बहुत अच्छे थे – जब मैं पाँच महीने पहले वीओ का परीक्षण कर रहा था, तब से कहीं अधिक सुसंगत और मेरे संकेत के अनुरूप। लेकिन यहां तक ​​कि ओमनी द्वारा मेरे लिए तैयार की गई सबसे अच्छी क्लिप में अभी भी कुछ एआई जंप डर हैं, जैसे कि जब बडी स्काइडाइविंग करते समय अचानक ओरिएंटेशन बदल देता है।

एक अन्य वीडियो के लिए, मैंने ओमनी को कुछ कलात्मक स्वतंत्रता दी। “छुट्टियों के लिए बडी की पैकिंग और एक उष्णकटिबंधीय छुट्टी के लिए एक क्रूज जहाज पर चढ़ने का एक असेंबल बनाएं। मूड प्यारा और चंचल है। बडी अपने सूटकेस में कुछ मजेदार पैक करता है जो बाद में क्लिप में दिखाई देता है।” इसमें बडी ने शहद का एक जार पैक किया था; बाद में क्लिप में वह इसे ऐसे पकड़ता है जैसे कि यह सनस्क्रीन की एक बोतल हो। “उह ओह,” पात्र अपने खुर पर शहद छिड़कते हुए कहता है।

ईमानदारी से कहूं तो, कुछ भी बुरा नहीं है। सिवाय इसके कि शहद की बोतल पूरे वीडियो में लगातार बदलती रहती है, एक जार से, पानी से भरी एक स्पष्ट धार वाली बोतल में, फिर वापस शहद से भरी एक निचोड़ बोतल में। और मैं यह बताना भी शुरू नहीं कर सकता कि मॉडल वीडियो के अंतिम फ्रेम के साथ कैसे आया – लगभग ऐसा जैसे कि उसने अभी-अभी बनाए गए अनुक्रम के तत्वों का एक समूह बना दिया हो।

आप अपने वीडियो में संपादन का सुझाव देने के लिए पाठ-आधारित संकेतों का उपयोग कर सकते हैं, और मैं Google को श्रेय दूंगा: जब मैंने Veo 3 का परीक्षण किया था, तब की तुलना में यह ओमनी के साथ बेहतर काम करता है। लेकिन परिणाम अच्छे नहीं थे खराब वीओ के साथ – इतना बुरा कि जब भी मैं कुछ बदलना चाहता था तो मुझे तुरंत एक नया वीडियो शुरू करना आसान लगता था। ओमनी वास्तव में आपके संपादनों को बोर्ड पर ले लेगा, लेकिन परिणाम हमेशा प्रभावित नहीं होते हैं।

मैंने बडी की छुट्टियों की क्लिप में उसके चेहरे की प्रतिक्रियाओं पर जोर दिया था, और परिणाम बिल्कुल अजीब लग रहे थे। यह समय-समय पर बडी एंटलर भी देता था, जो उसके पास नहीं है। बडी एक है बच्चाआपका बहुत-बहुत धन्यवाद। जब मैंने उसे एक दृश्य में दिखाई देने वाले सींगों को हटाने के लिए प्रेरित किया, तो उसने बाध्य किया – और फिर अन्य सभी सींगों को हटा दिया।

बात यह है कि इनमें से कुछ भी मुफ़्त नहीं है। वीडियो बनाने में क्रेडिट का खर्च आता है, जो दृश्य की लंबाई और आपके द्वारा शुरू की गई “सामग्री” के आधार पर 15 से 40 क्रेडिट तक भिन्न होता है। संपादन के एक दौर में 40 क्रेडिट का खर्च आता है। मेरे पास $20 प्रति माह का एआई प्रो प्लान है जो हर महीने 1,000 क्रेडिट के साथ आता है। कुछ संपादनों के साथ लगभग 20 क्लिप तैयार होने के बाद, मैं 145 पर आ गया हूं। यदि आपके पास उस वीडियो के बारे में विशिष्ट विचार हैं जिसे आप ओमनी द्वारा तैयार करना चाहते हैं, तो हो सकता है कि आप एक ऐसा वीडियो प्राप्त करने के लिए मॉडल के साथ बहुत सी महंगी चीजें देख रहे हों जो आपकी दृष्टि के करीब है।

मैं सचमुच कह सकता हूं कि मैंने जो देखा उसके लिए मैं तैयार नहीं था

ओमनी की कथित शक्तियों में से एक वास्तविक वीडियो में एआई-जनित सामग्री जोड़ना है, इसलिए मैंने बडी को एक ब्रेक दिया और खुद को डीपफेक किया। एक तटस्थ अभिव्यक्ति के साथ एक सेल्फी वीडियो से शुरुआत करते हुए, मैंने ओमनी को एक प्लेट स्पेगेटी खाते हुए, एक हवाई जहाज की सीट पर बैठे हुए और एफिल टॉवर के सामने खड़े होकर एक बैगूएट से नाश्ता करते हुए मेरे वीडियो बनाने के लिए प्रेरित किया। और मैं सचमुच कह सकता हूं कि मैंने जो देखा उसके लिए मैं तैयार नहीं था।

मेरे डीपफेक वीडियो में एआई के बारे में बताया गया है। पास्ता के कटोरे से टकराने वाले कांटे की खड़खड़ाहट कुछ ज्यादा ही बनावटी होती है। हवाई जहाज के वीडियो के बैकग्राउंड में एक महिला है जो दो बार दिखाई देती है। लेकिन उन छोटी-मोटी गड़बड़ियों और उनके बारे में एक अस्पष्ट अजीब समझ के अलावा, वे बिल्कुल आश्वस्त करने वाले हैं।

मैंने अपने पति को पास्ता क्लिप दिखाई; वह जानता था कि मैं एक एआई वीडियो टूल का परीक्षण कर रहा था, लेकिन मैंने उसे यह नहीं बताया कि एआई द्वारा दृश्य में क्या उत्पन्न किया गया था। यह जाने बिना कि इसके बारे में एआई-जनित क्या था, उन्होंने यह मान लिया कि मैं कैमरे के सामने बैठकर पास्ता खा रहा था, और कहा कि उनका एकमात्र सुराग यह था कि कुछ हुआ था कि कटोरा अपरिचित लग रहा था। पास्ता खाना अपने आप में इतना वास्तविक लग रहा था कि यकीन दिलाया जा सके मेरे पति. एक आदमी जिसने असल जिंदगी में मुझे मूल रूप से देखा है पिछले दशक से हर एक दिन.

मेरे अन्य डीपफेक “सोशल मीडिया पर लोगों को बेवकूफ बनाने के लिए काफी अच्छे” स्तर के अलग-अलग स्तर के हैं। एफिल टॉवर की कुछ क्लिपें थोड़ी कार्टून जैसी लगती हैं, लेकिन उनमें से एक इतनी प्रभावशाली है कि आपको यह देखने के लिए इसे कुछ बार दोबारा देखने की आवश्यकता हो सकती है कि यह एआई है। मैं मुझे पता है कि यह मैं नहीं हूं जब एआई मी अपना सिर घुमाती है और अपने बालों को पोनीटेल में पीछे खींचे हुए दिखाती है। लेकिन मुझे यकीन नहीं है कि किसी और को यह अंतर पता होगा, और इससे मुझे अजीब लगता है।

हम निश्चित रूप से अलौकिक घाटी में गहरे हैं

ईमानदारी से कहूँ तो मैं इस सब से थोड़ा थक गया हूँ। जब मैंने वीओ 3 का यथार्थवाद के साथ परीक्षण किया तो मैं आश्चर्यचकित रह गया। मैं इस बात से हैरान हूं कि पिछले कुछ वर्षों में बार-बार नकली तस्वीरों में नकली लोगों को दिखाना कितना आसान हो गया है। मुझे शायद ओमनी से भी चौंकना चाहिए था, और मुझे लगता है कि मैं चौंका भी हूं, लेकिन किनारा खराब हो गया है।

एआई-जनरेटेड सिनेमैटिक मास्टरपीस बनाना अभी भी उतना आसान नहीं है जितना Google चाहता है कि आप उस पर विश्वास करें। लेकिन ओमनी कुछ पहचानने योग्य तरीकों से वीओ में सुधार करता है। यदि आपके पास Google खाता और क्रेडिट कार्ड है, तो आप घर बैठे अपना एक वीडियो ले सकते हैं और थोड़े से प्रयास से ऐसा दिखा सकते हैं जैसे आप माउ की उड़ान पर हैं। मुझे नहीं लगता कि हम वास्तव में “विलक्षणता की तलहटी” पर हैं, लेकिन हम निश्चित रूप से अलौकिक घाटी में गहरे हैं।

इस कहानी के सभी चित्र और वीडियो Google जेमिनी द्वारा तैयार किए गए थे।

विषयों और लेखकों का अनुसरण करें इस कहानी से अपने वैयक्तिकृत होमपेज फ़ीड में इस तरह की और अधिक जानकारी देखने और ईमेल अपडेट प्राप्त करने के लिए।


Source link

Leave a Comment