मैं Google की नई वीडियो-क्लोनिंग ओमनी AI से आकर्षित हुआ – फिर मैंने इसके निहितार्थों पर विचार किया

गूगल अभी-अभी जेमिनी ओमनी को छोड़ा गया है, एक एआई वीडियो टूल जो आपकी उपस्थिति को क्लोन कर सकता है, टेक्स्ट कमांड के साथ फुटेज में हेरफेर कर सकता है, और हाइपर-यथार्थवादी अवतार उत्पन्न कर सकता है – यह सब एक इंटरफ़ेस के भीतर। यह घोषणा तकनीकी दिग्गजों के साथ प्रतिस्पर्धा करने की होड़ के बीच आई है OpenAI का सोरा और मेटा का वीडियो निर्माण उपकरण, लेकिन प्रौद्योगिकी की डीपफेक क्षमता पहले से ही शोधकर्ताओं और नैतिकतावादियों के बीच लाल झंडे उठा रही है जो ऐसी शक्तिशाली वीडियो हेरफेर क्षमताओं को लोकतांत्रिक बनाने के निहितार्थ के बारे में चिंतित हैं।

गूगल जेमिनी ओमनी के साथ एआई-जनरेटेड वीडियो में अपना अब तक का सबसे आक्रामक कदम उठा रहा है, एक टूल जो वीडियो क्लोनिंग, अवतार जेनरेशन और प्राकृतिक भाषा संपादन को पैकेज करता है जिसे कंपनी एक ऑल-इन-वन कंटेंट क्रिएशन प्लेटफॉर्म कहती है। यह घोषणा सीधे तौर पर Google के ख़िलाफ़ है ओपनएआई बहुप्रचारित सोरा मॉडल और मेटा का वीडियो निर्माण के प्रयोग, लेकिन यह नैतिक निहितार्थ हैं जो प्रारंभिक प्रतिक्रियाओं पर हावी हो रहे हैं।

सिस्टम स्रोत फुटेज का विश्लेषण करके काम करता है और फिर उपयोगकर्ताओं को सरल टेक्स्ट कमांड के माध्यम से इसमें हेरफेर करने की अनुमति देता है – सोचें “मुझे अपने बाएं हाथ से इशारा करें” या “पृष्ठभूमि को कॉफी शॉप में बदलें।” के साथ साझा किए गए विवरण के अनुसार ZDNetजेमिनी ओमनी कई एआई क्षमताओं को एकीकृत करता है जिनके लिए पहले अलग-अलग टूल की आवश्यकता होती थी: यथार्थवादी वीडियो संश्लेषण, अनुकूलन योग्य डिजिटल अवतार, बढ़िया शैली नियंत्रण और संवादी संपादन इंटरफेस।

जो चीज़ इसे पहले के प्रयासों से अलग करती है वह एकीकरण का स्तर है। जबकि प्रतिस्पर्धी पसंद करते हैं मार्ग और सिन्थेसिया इस पहेली के टुकड़ों की पेशकश की है, Google ने अपने गहन शिक्षण बुनियादी ढांचे और YouTube से विशाल प्रशिक्षण डेटा का लाभ उठाते हुए शुरुआती परीक्षकों को बेहद यथार्थवादी परिणाम के रूप में वर्णित किया है। उपकरण स्पष्ट रूप से प्रकाश समायोजन, लिप-सिंकिंग और यहां तक कि सूक्ष्म-अभिव्यक्तियों को एक तरलता के साथ संभालता है जिसे प्राप्त करने के लिए पिछली पीढ़ी के उपकरणों को संघर्ष करना पड़ा।

लेकिन यह यथार्थवाद बिल्कुल वही है जिसने शोधकर्ताओं को चिंतित कर दिया है। प्रौद्योगिकी अनिवार्य रूप से डीपफेक निर्माण का लोकतंत्रीकरण करती है, जिससे Google खाते वाले किसी भी व्यक्ति के हाथों में हॉलीवुड-स्तरीय वीडियो हेरफेर हो जाता है। एआई नैतिकता विशेषज्ञ पहले से ही पहचान की चोरी, गैर-सहमति वाले वीडियो निर्माण और सिंथेटिक मीडिया की संभावित बाढ़ के बारे में चिंताओं को चिह्नित कर रहे हैं जो पहले से ही गलत सूचना से जूझ रहे सामाजिक प्लेटफार्मों को प्रभावित कर सकते हैं।

मातृत्व अवकाश | इलेक्ट्रॉनिक्स साप्ताहिक

यहां Google का समय आकस्मिक नहीं है। पिछले साल ओपनएआई द्वारा सोरा को छेड़े जाने के बाद से कंपनी जेनरेटिव एआई वीडियो स्पेस में तेजी से काम कर रही है। माइक्रोसॉफ्ट वीडियो जेनरेशन को अपने एंटरप्राइज़ टूल में एकीकृत कर रहा है, मेटा इंस्टाग्राम और फेसबुक के लिए वीडियो सुविधाओं के साथ प्रयोग कर रहा है, और पिका और रनवे जैसे स्टार्टअप उस चीज़ को खा रहे हैं जिसे Google संभवतः अपने प्राकृतिक क्षेत्र के रूप में देखता है।

जेमिनी ओमनी के पीछे की तकनीकी वास्तुकला कथित तौर पर Google के मौजूदा वीडियो समझ मॉडल पर आधारित है, जो कंपनी द्वारा जेमिनी के लिए विकसित की जा रही मल्टीमॉडल क्षमताओं के साथ संयुक्त है। इसका मतलब है कि सिस्टम टेक्स्ट, छवि और वीडियो इनपुट के संदर्भ को एक साथ समझ सकता है – पिछली पीढ़ी-दर-पीढ़ी दृष्टिकोण से एक महत्वपूर्ण छलांग जिसके लिए कई प्रसंस्करण चरणों की आवश्यकता होती है।

व्यावसायिक दृष्टिकोण से, Google स्पष्ट रूप से उपभोक्ता रचनाकारों और उद्यम ग्राहकों दोनों को लक्षित कर रहा है। सामग्री निर्माता इसका उपयोग महंगे वीडियो शूट के बिना रैपिड प्रोटोटाइप, शैक्षिक वीडियो या सोशल मीडिया सामग्री के लिए कर सकते हैं। इस बीच, उद्यम इसे प्रशिक्षण वीडियो, विपणन सामग्री या ग्राहक सेवा अवतार के लिए तैनात कर सकते हैं। कंपनी ने अभी तक मूल्य निर्धारण की घोषणा नहीं की है, लेकिन उम्मीद है कि अन्य जेमिनी उत्पादों के समान स्तरीय पहुंच होगी।

प्रारंभिक घोषणा में जो स्पष्ट रूप से अनुपस्थित है वह सुरक्षा रेलिंग के बारे में विस्तृत जानकारी है। जबकि Google ने अपनी SynthID तकनीक के माध्यम से AI-जनरेटेड छवियों के लिए वॉटरमार्किंग और डिटेक्शन सिस्टम लागू किया है, वीडियो तेजी से अधिक जटिल चुनौतियां पेश करता है। एक एकल हेरफेर किए गए फ्रेम का पता लगाना आसान हो सकता है, लेकिन परिष्कृत वीडियो संपादन जो महत्वपूर्ण क्षणों को बदलते समय प्रामाणिक फुटेज को संरक्षित करता है, स्वचालित सिस्टम के माध्यम से फिसल सकता है।

यहां प्रतिस्पर्धात्मक दबाव तीव्र है। ओपनएआई सुरक्षा चिंताओं और शोधकर्ताओं और चुनिंदा रचनाकारों तक पहुंच सीमित करने का हवाला देते हुए, सोरा के रोलआउट को लेकर अपेक्षाकृत सतर्क रहा है। यदि Google जेमिनी ओमनी के साथ अधिक आक्रामक वितरण रणनीति अपनाता है, तो यह प्रतिस्पर्धियों को अपनी समयसीमा में तेजी लाने के लिए मजबूर कर सकता है – संभवतः पर्याप्त सुरक्षा उपाय लागू होने से पहले।

उद्योग पर्यवेक्षकों का कहना है कि यह घोषणा Google के रैपिड-फ़ायर एआई रिलीज़ के व्यापक पैटर्न पर फिट बैठती है क्योंकि यह जेनरेटिव एआई स्पेस में कथात्मक गति को पुनः प्राप्त करने का प्रयास करता है। कंपनी ने अपडेटेड जेमिनी मॉडल लॉन्च किए, अपने उत्पाद सूट में एआई को एकीकृत किया, और घोषित मिलान सुविधाओं के बारे में आक्रामक रही ओपनएआई और anthropic. जेमिनी ओमनी उस चल रही लड़ाई में वीडियो सीमा का प्रतिनिधित्व करता है।

अमेज़ॅन इको हब को एआई वीडियो सर्च और इंटरफ़ेस ओवरहाल मिलता है

असली परीक्षा यह होगी कि प्रौद्योगिकी बड़े पैमाने पर कैसा प्रदर्शन करती है और क्या Google के सुरक्षा उपाय अपरिहार्य दुरुपयोग के प्रयासों के साथ तालमेल बिठा सकते हैं। समान टूल के लिए प्रारंभिक पहुंच कार्यक्रमों ने लगातार दिखाया है कि उपयोगकर्ता प्रतिबंधों से बचने के लिए रचनात्मक तरीके ढूंढते हैं, और वीडियो हेरफेर विशेष रूप से सहमति, प्रामाणिकता और सत्यापन के आसपास कांटेदार चुनौतियां पेश करता है।

Google की जेमिनी ओमनी एक महत्वपूर्ण तकनीकी उपलब्धि और ऑनलाइन वीडियो प्रामाणिकता के लिए संभावित पेंडोरा बॉक्स दोनों का प्रतिनिधित्व करती है। उपयोगकर्ता नियंत्रण के साथ यथार्थवाद को सहजता से मिश्रित करने की उपकरण की क्षमता वैध उद्देश्यों के लिए सामग्री निर्माण में क्रांतिकारी बदलाव ला सकती है, लेकिन यह बड़े पैमाने पर दर्शकों को परिष्कृत वीडियो हेरफेर क्षमताओं को भी सौंपती है, इससे पहले कि समाज यह समझ सके कि एआई-जनित सामग्री की अंतिम लहर को कैसे संभालना है। जैसे-जैसे एआई वीडियो की दौड़ तेज हो रही है, उद्योग यह पता लगाने वाला है कि क्या नवाचार दुरुपयोग से आगे रह सकता है – या क्या हम ऐसे उपकरण बना रहे हैं जो स्क्रीन पर हम जो देखते हैं उस पर भरोसा करने की हमारी क्षमता को मौलिक रूप से कमजोर कर देंगे। आने वाले हफ्तों में Google द्वारा पहुंच, मूल्य निर्धारण और सुरक्षा सुविधाओं पर अधिक विवरण जारी करने की प्रतीक्षा करें, और प्रतिस्पर्धियों से अपेक्षा करें कि वे जल्द ही अपनी घोषणाएँ जारी करेंगे।