ओपनएआई ने शीघ्र इंजेक्शन हमलों के खिलाफ लॉकडाउन मोड लॉन्च किया

ओपनएआई हाल ही में लॉकडाउन मोड की घोषणा की गई है, एक नई सुरक्षा सुविधा जिसे चैटजीपीटी उपयोगकर्ताओं को त्वरित इंजेक्शन हमलों से बचाने के लिए डिज़ाइन किया गया है जो संवेदनशील डेटा को उजागर कर सकते हैं। यह कदम तब उठाया गया है जब उद्यम गोपनीय जानकारी तक पहुंच के साथ तेजी से एआई सहायकों को तैनात कर रहे हैं, जिससे वे हमलावरों के लिए प्रमुख लक्ष्य बन गए हैं जो सावधानीपूर्वक तैयार किए गए इनपुट के माध्यम से चैटबॉट प्रतिक्रियाओं में हेरफेर करते हैं। जबकि लॉकडाउन मोड कमजोरियों को पूरी तरह से खत्म नहीं करेगा, यह एंटरप्राइज़ एआई तैनाती को सुरक्षित बनाने के लिए ओपनएआई के अब तक के सबसे आक्रामक प्रयास का प्रतिनिधित्व करता है।

ओपनएआई एआई की सबसे जटिल सुरक्षा समस्याओं में से एक पर निशाना साध रहा है। कंपनी ने अभी लॉकडाउन मोड का अनावरण किया है चैटजीपीटीत्वरित इंजेक्शन हमलों के खिलाफ एक नया रक्षा तंत्र जो एआई सहायकों को संवेदनशील जानकारी लीक करने के लिए प्रेरित करता है जिसे उन्हें साझा नहीं करना चाहिए।

शीघ्र इंजेक्शन उद्योग का दुःस्वप्न बन गया है। हमलावर प्रतीत होने वाले मासूम सवालों को गढ़ते हैं जो एआई के अंतर्निहित निर्देशों में हेरफेर करते हैं, जिससे यह सुरक्षा रेलिंग को बायपास कर देता है और गोपनीय डेटा फैला देता है। यह सोशल इंजीनियरिंग की तरह है, लेकिन मशीनों के लिए। जैसे-जैसे अधिक कंपनियां चैटजीपीटी को अपने आंतरिक सिस्टम – ग्राहक डेटाबेस, वित्तीय रिकॉर्ड, मालिकाना कोड – में प्लग करती हैं, दांव चढ़ते रहते हैं।

के अनुसार टेकक्रंचलॉकडाउन मोड सिल्वर बुलेट होने का वादा नहीं करता है। सक्षम सुविधा के साथ भी, ChatGPT कुछ इंजेक्शन तकनीकों के प्रति असुरक्षित रहता है। लेकिन ओपनएआई यह शर्त लगा रहा है कि हमले की सतह को कम करना सही सुरक्षा का दावा करने से ज्यादा मायने रखता है। लक्ष्य दुर्भावनापूर्ण संकेतों के लिए संवेदनशील डेटा निकालना काफी कठिन बना रहा है, भले ही निर्धारित हमलावर अंततः समाधान ढूंढ सकें।

समय आकस्मिक नहीं है. इस साल एंटरप्राइज़ एआई को अपनाने में महत्वपूर्ण मोड़ आया है, कंपनियों में एआई सहायकों को तैनात करने की होड़ मची है, जो कर्मचारी ईमेल से लेकर ग्राहक भुगतान जानकारी तक सब कुछ एक्सेस कर सकते हैं। उस भीड़ ने भारी सुरक्षा अंतराल पैदा कर दिया। पारंपरिक साइबर सुरक्षा उपकरण उन हमलावरों से बचाव के लिए नहीं बनाए गए थे जो कोड शोषण के बजाय प्राकृतिक भाषा का उपयोग करते हैं।

रोबोरॉक क्यूरेवो एज 2 आईएम टेस्ट

जब ChatGPT उपयोगकर्ता इनपुट को संसाधित करता है जिसमें एम्बेडेड निर्देश शामिल हो सकते हैं तो लॉकडाउन मोड अतिरिक्त सत्यापन परतें जोड़कर काम करता है। सिस्टम इंजेक्शन प्रयासों से जुड़े पैटर्न के लिए आने वाले संकेतों का विश्लेषण करता है – ऐसे अनुरोध जो सिस्टम निर्देशों को ओवरराइड करने, प्रशिक्षण डेटा निकालने, या संदिग्ध तरीकों से आउटपुट स्वरूपण में हेरफेर करने का प्रयास करते हैं। जब संभावित हमलों का पता चलता है, तो सुविधा प्रतिबंधित करती है कि एआई किस जानकारी तक पहुंच सकता है और साझा कर सकता है, भले ही इसका मतलब कम उपयोगी प्रतिक्रियाएं प्रदान करना हो।

यह एक क्लासिक सुरक्षा ट्रेडऑफ़ है। सख्त सुरक्षा का मतलब है कि कुछ वैध प्रश्नों को गलत तरीके से चिह्नित किया जा सकता है, जिससे अत्यधिक सतर्क प्रतिक्रिया वाले उपयोगकर्ता निराश हो सकते हैं। लेकिन वास्तव में संवेदनशील डेटा – स्वास्थ्य देखभाल रिकॉर्ड, वित्तीय लेनदेन, कानूनी दस्तावेज़ – को संभालने वाले उद्यमों के लिए यह घर्षण एक भयावह रिसाव से बचने के लायक हो सकता है।

घोषणा दबाव बनाती है anthropic, गूगलऔर माइक्रोसॉफ्ट OpenAI की सुरक्षा स्थिति से मेल खाने के लिए। एंथ्रोपिक का क्लाउड पहले से ही सुरक्षा सुविधाओं पर जोर देता है, जबकि Google चुपचाप जेमिनी को इसी तरह के हमलों के खिलाफ सख्त कर रहा है। Microsoft, जो अपने एंटरप्राइज़ उत्पादों में OpenAI की तकनीक को एम्बेड करता है, संभवतः अपने कॉर्पोरेट ग्राहकों के लिए लॉकडाउन मोड को जल्दी से अपनाएगा।

सुरक्षा शोधकर्ता एक वर्ष से अधिक समय से शीघ्र इंजेक्शन के बारे में चेतावनी दे रहे हैं। पारंपरिक सॉफ़्टवेयर कमजोरियों के विपरीत, जिन्हें पैच किया जा सकता है, इंजेक्शन हमले बड़े भाषा मॉडल के टेक्स्ट को संसाधित करने के बुनियादी तरीके का फायदा उठाते हैं। इसका कोई सरल उपाय नहीं है क्योंकि मॉडल लचीले और प्राकृतिक भाषा के प्रति प्रतिक्रियाशील होने के लिए डिज़ाइन किए गए हैं – वही गुण जो उन्हें उपयोगी बनाते हैं, उन्हें जोड़-तोड़ करने योग्य भी बनाते हैं।

OpenAI का दृष्टिकोण इस वास्तविकता को स्वीकार करता है। त्वरित इंजेक्शन को पूरी तरह से हल करने का दावा करने के बजाय, कंपनी ऐसे बचावों पर काम कर रही है जो हमलों को अधिक महंगा और कम विश्वसनीय बनाते हैं। यह घर्षण के माध्यम से सुरक्षा है – बार को इतना ऊंचा उठाना कि आकस्मिक हमलावर आगे बढ़ जाएं और सुरक्षा टीमों को परिष्कृत प्रयासों का पता लगाने और जवाब देने का समय मिल जाए।

एंटरप्राइज़ ग्राहकों के लिए, एआई परिनियोजन समीक्षाओं के दौरान लॉकडाउन मोड संभवतः एक चेकबॉक्स आइटम बन जाएगा। सीआईएसओ यह मूल्यांकन कर रहे हैं कि चैटजीपीटी को संवेदनशील प्रणालियों तक पहुंच दी जाए या नहीं, अब उनके पास एक ठोस सुरक्षा नियंत्रण है जिसे वे इंगित कर सकते हैं, भले ही यह जोखिम को पूरी तरह से खत्म नहीं करता है। यह उन कंपनियों को अपनाने के लिए पर्याप्त हो सकता है जो अपने मुकुट रत्नों के साथ एआई पर भरोसा करने में झिझक रही हैं।

बूक्स के अनोखे पेज-टर्निंग रिमोट ने मुझे जीत लिया

यह सुविधा यह भी संकेत देती है कि OpenAI अपने विकास पथ को कहां देखता है। उपभोक्ता चैटजीपीटी उपयोगकर्ताओं को शायद लॉकडाउन मोड बिल्कुल भी नज़र नहीं आएगा। लेकिन चैटजीपीटी टीम और एंटरप्राइज़ योजनाओं के लिए प्रति माह सैकड़ों या हजारों का भुगतान करने वाले एंटरप्राइज़ ग्राहकों के लिए, सुरक्षा सुविधाएँ मुख्य अंतर बन रही हैं। ओपनएआई स्पष्ट रूप से शर्त लगा रहा है कि उद्यम बाजार जीतने का मतलब सुरक्षा हथियारों की दौड़ जीतना है।

ओपनएआई का लॉकडाउन मोड त्वरित इंजेक्शन समस्या को समाप्त नहीं करेगा, लेकिन यह एआई कंपनियों के सुरक्षा दृष्टिकोण में बदलाव का प्रतीक है। कमजोरियों के मौजूद न होने का दिखावा करने या असंभव गारंटी का वादा करने के बजाय, ओपनएआई व्यावहारिक सुरक्षा का निर्माण कर रहा है जो जोखिम को खत्म किए बिना कम करता है। एआई अपनाने की बाड़ पर बैठे उद्यमों के लिए, वह व्यावहारिक दृष्टिकोण बिल्कुल वही हो सकता है जिसकी उन्हें अंततः छलांग लगाने के लिए आवश्यकता है। अब सवाल यह है कि क्या प्रतिस्पर्धी इन सुरक्षाओं से मेल खाएंगे या पूरी तरह से उनसे आगे निकलने की कोशिश करेंगे।