“डियर अपस्टेयर नेबर्स” वीओ के वीडियो-टू-वीडियो एआई वर्कफ़्लो को प्रदर्शित करता है
प्रकाशित: सोम, जनवरी 26, 2026, 6:31 अपराह्न यूटीसी | अद्यतन: मंगल, जनवरी 27, 2026, 12:31 अपराह्न यूटीसी

- ■
गूगल डीपमाइंड सनडांस में “डियर अपस्टेयर नेबर्स” का प्रीमियर हुआ, जिसमें पिक्सर के अनुभवी कोनी हे के साथ विकसित एआई-सहायता प्राप्त एनीमेशन वर्कफ़्लो का प्रदर्शन किया गया।
- ■
टीम ने कस्टम आर्टवर्क पर वीओ और इमेजन मॉडल को ठीक किया, एआई को शॉट्स में लगातार चरित्र डिजाइन और अभिव्यक्तिवादी दृश्य शैलियों को बनाए रखने के लिए सिखाया।
- ■
नवीन वीडियो-टू-वीडियो वर्कफ़्लो एनिमेटरों को टेक्स्ट प्रॉम्प्ट के बजाय रफ एनीमेशन के साथ एआई का मार्गदर्शन करने देते हैं, जिससे समय और प्रदर्शन पर सटीक नियंत्रण बना रहता है।
- ■
इस महीने के अंत में Google AI स्टूडियो और वर्टेक्स AI में Veo का 4K अपस्केलिंग लॉन्च हुआ, जो पेशेवर फिल्म निर्माण टूल को व्यापक दर्शकों तक पहुंचाएगा।
गूगल डीपमाइंड हाल ही में सनडांस फिल्म फेस्टिवल में कुछ अभूतपूर्व प्रीमियर हुआ – पारंपरिक एनिमेटरों और एआई शोधकर्ताओं के बीच एक मौलिक सहयोग के माध्यम से बनाई गई एक एनिमेटेड लघु फिल्म। सनडांस स्टोरी फ़ोरम में आज स्क्रीनिंग “डियर अपस्टेयर नेबर्स” रचनात्मक एआई टूलिंग में एक नई सीमा का प्रतिनिधित्व करती है, जहां फाइन-ट्यून किए गए वीडियो मॉडल हाथ से तैयार किए गए एनीमेशन को बदलने के बजाय उसके साथ काम करते हैं। प्रोजेक्ट से पता चलता है कि कैसे गूगल का Veo AI अद्वितीय कलात्मक शैलियों को सीख सकता है और केवल पाठ संकेतों के अलावा दृश्य दिशा पर भी प्रतिक्रिया दे सकता है।
गूगल डीपमाइंड अभी-अभी एक बेहद महत्वाकांक्षी प्रयोग के साथ सनडांस दुर्घटनाग्रस्त हो गया। एनिमेटेड लघु फिल्म “डियर अपस्टेयर नेबर्स” का आज फेस्टिवल के स्टोरी फोरम में प्रीमियर हुआ, लेकिन यह नींद से वंचित एक महिला की आकर्षक कहानी नहीं है जो शोर मचाने वाले पड़ोसियों से जूझ रही है, जिसमें लोग बात कर रहे हैं – यह इस तरह से बनी है।
पिक्सर के पूर्व छात्र, निर्देशक कोनी हे ने मिलकर काम किया गूगल का एआई शोधकर्ता कुछ ऐसा बना रहे हैं जो अभी तक अस्तित्व में नहीं होना चाहिए: एक हाथ से तैयार की गई एनिमेटेड फिल्म जहां एआई सबसे तकनीकी रूप से क्रूर हिस्सों पर भारी भार उठाता है, जबकि मानव कलाकार फ्रेम-दर-फ्रेम रचनात्मक नियंत्रण बनाए रखते हैं। परिणाम मूल रूप से उन सभी चीज़ों को चुनौती देता है जिनके बारे में हमने सोचा था कि हम रचनात्मक कार्यों में एआई की भूमिका के बारे में जानते हैं।
पर्यवेक्षक एनिमेटर कैसिडी कर्टिस ने बताया, “अभिव्यक्तिवादी दृश्य शैलियाँ कहानी कहने के केंद्र में हैं – और पारंपरिक एनीमेशन में इसे हासिल करना बेहद मुश्किल है।” गूगल की घोषणा. टीम को शुरू में ही पता चल गया कि उनकी दृष्टि इतनी विशिष्ट थी, उनकी शैलियाँ इतनी अनोखी थीं कि मौजूदा एआई उपकरण इसे काट नहीं सकते थे। इसलिए उन्होंने नये बनाये।
यहीं पर यह दिलचस्प हो जाता है। प्रोडक्शन टीम ने Veo और Imagen के कस्टम संस्करणों को बेहतर ढंग से तैयार किया – गूगल का वीडियो और छवि निर्माण मॉडल – उन्हें प्रोडक्शन डिजाइनर यिंगज़ोंग शिन की कलाकृति खिलाकर। लेकिन यह सरल शैली स्थानांतरण नहीं था. एआई ने दो-बिंदु परिप्रेक्ष्य जैसी गहरी कलात्मक अवधारणाओं को सीखा और चरित्र सिल्हूट को कैसे बनाए रखा जाए जो 2 डी एनीमेशन नियमों का पालन करते हैं, भले ही फॉर्म 3 डी स्पेस में घूमते हों।
टीम ने कहा, “वीओ ने हमारी अवधारणा कला से जो सीखा उसने हमें आश्चर्यचकित कर दिया: न केवल रंग और बनावट जैसे सतही विवरण, बल्कि गहरी कलात्मक अवधारणाएं।” जब उन्होंने नायक, एडा की एआई पेंटिंग दिखाई, तो मॉडल ने समझ लिया कि उसके विशिष्ट बाल पूफ को हमेशा सिल्हूट में दिखना चाहिए, कभी भी उसके चेहरे को अस्पष्ट नहीं करना चाहिए – एक सख्ती से दो-आयामी नियम जो भौतिक 3 डी स्पेस में मौजूद नहीं हो सकता है।
लेकिन अकेले फ़ाइन-ट्यूनिंग से नियंत्रण समस्या का समाधान नहीं हो सका। टेक्स्ट प्रॉम्प्ट – एआई को निर्देशित करने का मानक तरीका – कॉमेडी टाइमिंग, सोई हुई उंगलियों की टाइपिंग की लय, या कैमरे के प्रदर्शन की सटीक फ्रेमिंग बताने के लिए बेकार साबित हुआ। इसलिए टीम ने वीडियो-टू-वीडियो वर्कफ़्लो विकसित किया जो एनिमेटरों को हमेशा की तरह संवाद करने देता है: ड्राइंग, पेंटिंग या रफ एनीमेशन को ब्लॉक करके।
एनिमेटर बेन नाइट ने मुख्य दृश्यों के लिए माया में रफ 3डी एनीमेशन बनाया। शोधकर्ता एंडी कोएनन ने फिर उस एनीमेशन को बढ़िया ट्यून किए गए वीओ मॉडल के माध्यम से खिलाया, ग्रे पुतलों को पूरी तरह से शैलीबद्ध, चित्रकारी पात्रों में बदल दिया, जो नाइट के इच्छित सटीक गति और समय का पालन करते थे। अन्य एनिमेटरों ने 2डी एनीमेशन के लिए टीवी पेंट में काम किया या स्वयं दृश्यों का अभिनय किया।
कर्टिस ने बताया, “हमने नए वीडियो-टू-वीडियो वर्कफ़्लो विकसित किए, जिससे हमारे एनिमेटरों को अपने इरादों को दृश्य रूप से व्यक्त करने की अनुमति मिली।” मॉडलों ने “कड़े नियंत्रण और रचनात्मक सुधार के बीच एक समायोज्य संतुलन के साथ” रफ एनीमेशन को पूरी तरह से स्टाइल वाले वीडियो में बदल दिया।
कार्यप्रवाह जादू नहीं था. फाइन-ट्यून किए गए वीओ मॉडल के साथ टेक्स्ट-टू-वीडियो जेनरेशन के शुरुआती प्रयासों में ऐसे दृश्य उत्पन्न हुए जो एडा की तरह दिखते थे लेकिन “यादृच्छिक, अनियंत्रित और अक्सर विचित्र” तरीकों से चलते थे। टीम की ब्लूपर रील में एडा को इस तरह से स्पेगेटी खाते हुए दिखाया गया है जो भौतिकी और बुनियादी मर्यादा दोनों का उल्लंघन करता है।
यहां तक कि वीडियो-टू-वीडियो नियंत्रण के साथ भी, एक भी पीढ़ी से कोई अंतिम शॉट सामने नहीं आया। टीम ने पारंपरिक फिल्म निर्माणों की तरह ही दैनिक “दैनिक” समीक्षाएं आयोजित कीं, जिसमें फीडबैक के कई दौरों के माध्यम से प्रत्येक शॉट की आलोचना की गई। उन्होंने स्थानीय शोधन उपकरण बनाए जो उन्हें वीडियो के विशिष्ट क्षेत्रों को संपादित करने देते हैं – उदाहरण के लिए, एडा के सिल्हूट को बेहतर बनाने के लिए बालों का एक अतिरिक्त गुच्छा जोड़ना – पूरे शॉट को पुनर्जीवित किए बिना।
फिल्म के सबसे गहन अभिव्यक्तिवादी दृश्यों के लिए, एआई अप्रत्याशित रूप से कुशल साबित हुआ। एनिमेटर स्टीवन चाओ ने माया में गतिशील लो-पॉली प्रभाव बनाए। शोधकर्ता एलेन जियांग और निदेशक उन्होंने फिर उन ज्यामितीय आकृतियों को नियॉन पेंट के हरे-भरे छींटों में बदलने के लिए फाइन-ट्यून किए गए वेओ और इमेजन मॉडल का उपयोग किया। टीम ने नोट किया, “बदलती पेंट बनावट की स्थिर लय कार्रवाई की तीव्रता को बढ़ाती है।”
अंत में, उन्होंने नाटकीय प्रस्तुति के लिए शॉट्स को 4K रिज़ॉल्यूशन में लाने के लिए वीओ की अपस्केलिंग क्षमता का उपयोग किया। शोधकर्ताओं ने हाथ से चित्रित सौंदर्य की हर बारीकियों को संरक्षित करते हुए विस्तार जोड़ने के लिए अपस्केलिंग मॉडल को ट्यून किया – जब आप अभिव्यक्तिवादी ब्रशवर्क की कठोर ऊर्जा को बनाए रखने की कोशिश कर रहे हों तो यह कोई छोटी उपलब्धि नहीं है।
Veo 4K अपस्केलिंग मॉडल इस महीने के अंत में Google AI स्टूडियो और वर्टेक्स AI में लॉन्च होगा। गूगल पुष्टि की गई है, जिससे ये पेशेवर फिल्म निर्माण उपकरण अनुसंधान टीम से परे उपलब्ध हो जाएंगे।
जो बात इस परियोजना को महत्वपूर्ण बनाती है वह सिर्फ तकनीकी उपलब्धि नहीं है। यह वर्कफ़्लो दर्शन है. एनिमेटरों को AI से बदलने के बजाय, गूगल डीपमाइंड तकनीकी कलाकारों के रूप में शोधकर्ताओं को सीधे उत्पादन प्रक्रिया में शामिल किया गया। एनिमेटरों को प्रायोगिक अनुसंधान उपकरणों तक सीधी पहुंच मिली और व्यावहारिक आलोचना के माध्यम से उनके विकास को आकार देने में मदद मिली।
टीम ने लिखा, “हमारे कलाकारों ने प्रायोगिक अनुसंधान तक सीधी पहुंच के माध्यम से नई रचनात्मक शक्तियां पाईं और इसके विकास को आकार देने में मदद के लिए अपने शिल्प और परिप्रेक्ष्य का उपयोग किया।” इस बीच, शोधकर्ताओं ने “तकनीकी कलाकारों के रूप में व्यावहारिक अनुभव प्राप्त किया, कलात्मक और तकनीकी बाधाओं को तोड़ने के लिए तेजी से प्रोटोटाइप समाधान तैयार किए।”
यह सहयोगी मॉडल एआई उद्योग के अलगाव में उपकरण बनाने और फिर उन्हें कंधे उचकाने के साथ रचनात्मक पेशेवरों को जारी करने के सामान्य दृष्टिकोण के बिल्कुल विपरीत है। “डियर अपस्टेयर नेबर्स” टीम यह समझने के लिए वास्तविक उत्पादन की दर्दनाक, पुनरावृत्तीय प्रक्रिया से गुज़री कि कलाकारों को वास्तव में क्या चाहिए – जो कि एक-क्लिक जादू नहीं, बल्कि बारीक नियंत्रण साबित होता है।
यह फिल्म ऐसे समय आई है जब हॉलीवुड निर्माण में एआई की भूमिका से जूझ रहा है। 2023 WGA और SAG-AFTRA हमलों ने AI के उपयोग पर रोक लगा दी है, लेकिन यह सवाल बना हुआ है कि ये उपकरण रचनात्मक वर्कफ़्लो को कैसे नया आकार देंगे। गूगल का दृष्टिकोण – एआई को एक संवर्द्धन उपकरण के रूप में स्थापित करना जिसके लिए हर कदम पर मानव दिशा की आवश्यकता होती है – एक संभावित उत्तर प्रदान करता है।
यह देखना बाकी है कि “डियर अपस्टेयर नेबर्स” मनोरंजन के रूप में काम करता है या नहीं। लेकिन मानव-एआई रचनात्मक सहयोग की अवधारणा के प्रमाण के रूप में, यह पहले से ही कुछ उल्लेखनीय हासिल कर चुका है: यह दर्शाता है कि एआई एनीमेशन के तकनीकी रूप से क्रूर हिस्सों को संभाल सकता है जबकि कलाकार रचनात्मक दृष्टि बनाए रखते हैं जो एक फिल्म को देखने लायक बनाती है।
“डियर अपस्टेयर नेबर्स” एक फिल्म के रूप में कम मायने रखता है, बल्कि एआई-सहायता प्राप्त रचनात्मक उत्पादन सही ढंग से किए जाने पर कैसा दिख सकता है, इसके लिए एक ब्लूप्रिंट के रूप में। शोधकर्ताओं को उत्पादन प्रक्रिया में शामिल करके और उन्हें बदलने के बजाय कलाकारों के वास्तविक वर्कफ़्लो के आसपास उपकरण बनाकर, गूगल डीपमाइंड प्रदर्शित किया कि एआई को एक ब्लैक बॉक्स नहीं होना चाहिए जो या तो सब कुछ करता है या कुछ भी नहीं करता है। टीम का वीडियो-टू-वीडियो दृष्टिकोण, फाइन-ट्यूनिंग क्षमताएं और स्थानीयकृत शोधन उपकरण एक ऐसे भविष्य की ओर इशारा करते हैं जहां एआई तकनीकी जटिलता को संभालता है जबकि कलाकार शॉट-दर-शॉट रचनात्मक नियंत्रण बनाए रखते हैं। जैसे ही ये उपकरण इस महीने Google AI स्टूडियो और वर्टेक्स AI के लिए रोल आउट होंगे, असली परीक्षा शुरू हो जाएगी: क्या यह सहयोगी मॉडल एक प्रयोगात्मक शॉर्ट से आगे बढ़ सकता है ताकि उद्योग एनीमेशन उत्पादन के दृष्टिकोण को नया आकार दे सके।









