अनुसंधान भंडार ArXiv लेखकों पर एक वर्ष के लिए प्रतिबंध लगा देगा यदि वे AI को सारा काम करने देंगे

वैज्ञानिक समुदाय के सबसे बड़े प्रीप्रिंट सर्वर ने हाल ही में कृत्रिम बुद्धिमत्ता पर एक सख्त रेखा खींची है। ArXiv ने घोषणा की कि अगर वे पूरी तरह से बड़े भाषा मॉडल द्वारा तैयार किए गए पेपर जमा करते हैं तो वह शोधकर्ताओं पर एक साल के लिए प्रतिबंध लगा देगा, जो एक प्रमुख अकादमिक प्रकाशन मंच से अब तक की सबसे आक्रामक सामग्री मॉडरेशन नीति को चिह्नित करता है। यह कदम उन लाखों शोधकर्ताओं को प्रभावित करता है जो भौतिकी, गणित, कंप्यूटर विज्ञान और अन्य क्षेत्रों में प्रारंभिक चरण के निष्कर्षों को साझा करने के लिए कॉर्नेल-संचालित रिपॉजिटरी पर भरोसा करते हैं।

arXivओपन-एक्सेस रिपॉजिटरी जो वैज्ञानिक अनुसंधान के लिए आवश्यक बुनियादी ढाँचा बन गई है, प्रवर्तन को एक नए स्तर पर ले जा रही है। मंच ने घोषणा की कि वह उन लेखकों पर साल भर का प्रतिबंध लगाएगा जो एआई को अपने कागजात पर सभी काम करने देते हैं, जो कि उन सौम्य चेतावनियों से एक नाटकीय वृद्धि है, जिन्होंने जेनेरिक एआई के लिए अकादमिक प्रकाशन के दृष्टिकोण को परिभाषित किया है।

समय संयोग नहीं है. ArXiv मॉडरेटर ने पिछले 18 महीनों में AI-जनरेटेड सबमिशन में विस्फोट होते देखा है, जिसे अंदरूनी सूत्र गुणवत्ता संकट के रूप में वर्णित करते हैं। ‘तल्लीन करना’ और ‘यह नोट करना महत्वपूर्ण है’ जैसे गप्पी एलएलएम वाक्यांशों से भरे पेपर अब प्रतिदिन आते हैं, कभी-कभी मनगढ़ंत उद्धरण और निरर्थक कार्यप्रणाली अनुभागों के साथ जो उनके एल्गोरिदमिक मूल को धोखा देते हैं।

एक ArXiv मॉडरेटर ने आंतरिक चर्चा में सहकर्मियों से कहा, ‘हम कुछ शोधकर्ताओं के वैज्ञानिक लेखन के दृष्टिकोण में एक बुनियादी बदलाव देख रहे हैं।’ प्लेटफ़ॉर्म में सार्वजनिक रूप से विस्तृत पहचान के तरीके नहीं हैं, लेकिन नीति से पता चलता है कि उन्हें विश्वास है कि वे पूरी तरह से एआई-जनित कार्य की पहचान कर सकते हैं। यह देखते हुए कि उपकरण कितनी जल्दी पसंद करते हैं, यह एक साहसिक रुख है चैटजीपीटी और क्लाउड मानव अकादमिक लेखन की नकल करने के लिए विकसित हुए हैं।

ArXiv की प्रवर्तन शक्ति वास्तविक महत्व रखती है। रिपॉजिटरी सालाना 200,000 से अधिक पत्रों की प्रक्रिया करती है और भौतिकी, गणित, कंप्यूटर विज्ञान, मात्रात्मक जीव विज्ञान और अर्थशास्त्र में अत्याधुनिक अनुसंधान के लिए प्राथमिक वितरण चैनल के रूप में कार्य करती है। प्रतिबंधित होने का अर्थ है साथियों के साथ निष्कर्षों को साझा करने के सबसे तेज़ रास्ते तक पहुंच खोना, खोजों पर प्राथमिकता स्थापित करने की होड़ में शुरुआती चरण के शोधकर्ताओं के लिए करियर को नुकसान पहुंचाने वाला दंड।

जिओथर्मी, वासेर और ऑस्मोस इम चेक

नीति विशेष रूप से बड़े भाषा मॉडल के ‘लापरवाह उपयोग’ को लक्षित करती है, ऐसी भाषा जो बताती है कि ArXiv एआई सहायता पर पूरी तरह से प्रतिबंध नहीं लगा रहा है। शोधकर्ता अभी भी एलएलएम का उपयोग गद्य को निखारने, अनुच्छेद पुनर्गठन का सुझाव देने या व्याकरण संबंधी त्रुटियों को पकड़ने के लिए कर सकते हैं। यह पंक्ति लेखकत्व की प्रतीत होती है – क्या आपने एआई की मदद से पेपर लिखा था, या एआई ने आपके नाम के साथ पेपर लिखा था?

यह अंतर मायने रखता है क्योंकि शैक्षणिक संस्थान एआई नीतियों से जूझ रहे हैं। एमआईटी और स्टैनफोर्ड पूर्णतया प्रतिबंधों पर रोक लगाते हुए एआई के उपयोग के बारे में पारदर्शिता को प्रोत्साहित करने वाले दिशानिर्देश जारी किए हैं। कुछ पत्रिकाओं को अब लेखकों से यह खुलासा करने की आवश्यकता है कि किन अनुभागों में एलएलएम सहायता शामिल है। ArXiv का दृष्टिकोण स्पष्ट है: पूर्ण स्वचालन में सीमा पार करें और आप एक वर्ष के लिए बाहर हो जाएंगे।

यह कदम अन्य प्रीप्रिंट सर्वरों और प्रकाशकों पर दबाव डालता है। Biorxivजैविक विज्ञान के लिए ArXiv के समकक्ष ने AI-जनित सामग्री को चिह्नित किया है, लेकिन समान निलंबन नीतियों की घोषणा नहीं की है। नेचर और साइंस जैसी पारंपरिक पत्रिकाओं ने प्रकटीकरण आवश्यकताओं को जोड़ा है लेकिन समस्याग्रस्त एआई उपयोग को पकड़ने के लिए काफी हद तक सहकर्मी समीक्षा पर निर्भर हैं। ArXiv शर्त लगा रहा है कि आक्रामक अग्रिम मॉडरेशन बाद में गंदगी को साफ करने में सक्षम है।

लेकिन प्रवर्तन सरल नहीं होगा. भारी एआई सहायता और पूर्ण एआई पीढ़ी के बीच अंतर करना तकनीकी रूप से चुनौतीपूर्ण बना हुआ है। जांच उपकरण गलत सकारात्मक परिणाम देते हैं, और समझदार उपयोगकर्ता जानते हैं कि स्वचालित स्क्रीनिंग से बचने के लिए एलएलएम आउटपुट को कैसे संपादित किया जाए। ArXiv संभवतः निर्णय कॉल करने वाले मानव मध्यस्थों पर निर्भर करेगा, एक व्यक्तिपरक प्रक्रिया जो अपील और विवाद को ट्रिगर कर सकती है।

यह नीति समानता पर भी सवाल उठाती है। जिन शोधकर्ताओं की पहली भाषा अंग्रेजी नहीं है, उन्होंने अंग्रेजी-प्रभुत्व वाले अकादमिक प्रकाशन के लेखन मानकों को पूरा करने के लिए तेजी से एलएलएम की ओर रुख किया है। पूर्ण प्रतिबंध गैर-अंग्रेजी भाषी देशों के वैज्ञानिकों पर प्रतिकूल प्रभाव डाल सकता है जो एआई उपकरणों का उपयोग आलस्य के कारण नहीं बल्कि भाषाई आवश्यकता के कारण करते हैं। ArXiv ने यह नहीं बताया है कि मॉडरेटर उन मामलों का हिसाब कैसे देंगे।

फिर भी, व्यापक संदेश स्पष्ट है: अकादमिक प्रकाशन कम प्रयास वाली एआई सामग्री की बाढ़ को पीछे धकेल रहा है। ArXiv की प्रतिष्ठा गुणवत्ता मानकों को बनाए रखने पर निर्भर करती है, और अनियंत्रित एलएलएम प्रस्तुतियाँ प्लेटफ़ॉर्म को मशीन से उत्पन्न शोर के लिए डंपिंग ग्राउंड में बदलने की धमकी देती हैं। उल्लंघनों के वास्तविक परिणामों को जोड़कर, रिपॉजिटरी तेजी से प्रदूषित सूचना पारिस्थितिकी तंत्र में एक विश्वसनीय फ़िल्टर के रूप में अपनी भूमिका का बचाव कर रहा है।

डेसर मेह्रोबोटर बिएटेट डेन बेस्टेन कन्टेंश्निट

आगे क्या होता है यह आंशिक रूप से इस बात पर निर्भर करता है कि शोधकर्ता कैसे प्रतिक्रिया देते हैं। यदि नीति वैध उपयोगकर्ताओं को निशाने पर लिए बिना थोक एआई पीढ़ी को सफलतापूर्वक रोकती है, तो अन्य प्लेटफ़ॉर्म संभवतः ArXiv के नेतृत्व का अनुसरण करेंगे। यदि यह प्रतिक्रिया को ट्रिगर करता है या अप्रवर्तनीय साबित होता है, तो एक गड़बड़ गणना की उम्मीद करें क्योंकि अकादमिक प्रकाशन उपयोगी एआई उपकरणों को अपनाने और विद्वानों की अखंडता को बनाए रखने के बीच सही संतुलन खोजने की कोशिश करता है।

ArXiv की साल भर की निलंबन नीति एआई-जनित सामग्री के लिए अकादमिक प्रकाशन की अब तक की सबसे सशक्त प्रतिक्रिया का प्रतिनिधित्व करती है, जो एक मिसाल कायम करती है जो शोधकर्ताओं द्वारा बड़े भाषा मॉडल का उपयोग करने के तरीके को नया आकार दे सकती है। असली परीक्षा क्रियान्वयन में आती है – क्या प्लेटफ़ॉर्म वैध एआई-सहायता प्राप्त कार्य को दंडित किए बिना लगातार उल्लंघनों की पहचान कर सकता है। शोधकर्ताओं के लिए, संदेश स्पष्ट है: एआई आपके वर्कफ़्लो में एक उपकरण हो सकता है, लेकिन यह लेखक नहीं हो सकता। जैसा कि अन्य प्रकाशक देख रहे हैं कि यह कैसे होता है, उम्मीद है कि वैज्ञानिक लेखन में एआई की भूमिका पर बहस तेज हो जाएगी, साथ ही ArXiv का प्रयोग प्रवर्तन के लिए एक मॉडल या ओवररीच के बारे में एक चेतावनी कहानी के रूप में काम करेगा।