एआई उपकरण गुमनाम खातों का पर्दाफाश कर सकते हैं

क्या आपके पास Reddit alt, Secret X, finsta, या Glassdoor खाता है जिससे आप अपने बॉस को बर्बाद कर देते हैं? हो सकता है कि AI ने आपको बेनकाब करना बहुत आसान बना दिया हो। यह एक का निष्कर्ष है हाल ही में प्रकाशित अध्ययनजो ऑनलाइन निजी बने रहने के कुछ असुविधाजनक परिणामों की ओर संकेत करता है – भले ही अभी गुमनामी के लिए अंतिम संस्कार आयोजित करने का समय नहीं आया है।

यह खोज, जिसकी सहकर्मी समीक्षा नहीं की गई है, ईटीएच ज्यूरिख, एंथ्रोपिक और मशीन लर्निंग एलाइनमेंट एंड थ्योरी स्कॉलर्स प्रोग्राम के शोधकर्ताओं से आई है। उन्होंने अनिर्दिष्ट मॉडलों का उपयोग करके एआई एजेंटों की एक स्वचालित प्रणाली बनाई – जो वेब पर खोज करने और मानव अन्वेषक की तरह जानकारी के साथ बातचीत करने में सक्षम है – यह परीक्षण करने के लिए कि बड़े भाषा मॉडल कितने प्रभावी ढंग से अज्ञात सामग्री को फिर से पहचान सकते हैं। यह प्रणाली खातों को अज्ञात करने, बड़े पैमाने पर व्यक्तिगत विवरण के लिए पाठ को खंगालने के लिए पारंपरिक कम्प्यूटेशनल तकनीकों से “काफ़ी हद तक बेहतर प्रदर्शन” करती है।

सिस्टम पोस्ट या अन्य टेक्स्ट को सुरागों के एक सेट के रूप में मानकर काम करता है। यह पैटर्न के लिए पाठ का विश्लेषण करता है – लेखन संबंधी विचित्रताएं, भटके हुए जीवनी संबंधी विवरण, पोस्ट करने की आवृत्ति और समय – जो किसी की पहचान का संकेत दे सकते हैं। इसके बाद यह अन्य खातों को स्कैन करता है, संभावित रूप से उनमें से लाखों, लक्षणों के समान मिश्रण की तलाश करते हैं। संभावित मिलानों को चिह्नित किया जाता है, अधिक विस्तार से तुलना की जाती है, और संभावित पहचानों की एक संक्षिप्त सूची बनाई जाती है।

बिना सोचे-समझे उपयोगकर्ताओं को लक्षित करने के बजाय, टीम ने सार्वजनिक रूप से उपलब्ध पोस्टों से निर्मित डेटासेट का उपयोग करके सिस्टम का मूल्यांकन किया, जिसमें हैकर न्यूज़ और लिंक्डइन की सामग्री, एंथ्रोपिक के वैज्ञानिकों के साथ साक्षात्कार के टेप कि वे एआई का उपयोग कैसे करते हैं, और रेडिट खाते जिन्हें जानबूझकर परीक्षण के लिए दो अज्ञात हिस्सों में विभाजित किया गया था। पेपर की रिपोर्ट है कि प्रत्येक सेटिंग में एलएलएम-आधारित दृष्टिकोण ने 90 प्रतिशत सटीकता के साथ 68 प्रतिशत मिलान खातों की सही पहचान की। इसके विपरीत, बड़े डेटासेट में बिखरे हुए डेटा बिंदुओं को जोड़ने जैसी तुलनीय गैर-एलएलएम विधियों ने लगभग किसी की पहचान नहीं की।

परिणाम हर डेटासेट में एक समान नहीं थे, और, अनुमानतः, मॉडल ने बेहतर प्रदर्शन किया जब उसके पास काम करने के लिए अधिक संरचित जानकारी थी। मुख्य आर/मूवी सबरेडिट और छोटे फिल्म समुदायों में फिल्मों के बारे में पोस्ट करने वाले रेडिट उपयोगकर्ताओं की जांच करने वाले एक प्रयोग में, सिस्टम उन खातों को लिंक करने में सक्षम था, जिनमें 90 प्रतिशत सटीकता के साथ लगभग 3 प्रतिशत समय में सिर्फ एक फिल्म का उल्लेख था। जब उपयोगकर्ताओं ने 10 या अधिक फिल्मों का उल्लेख किया, तो सफलता दर लगभग आधी हो गई।

इस बीच, एंथ्रोपिक के वैज्ञानिकों के सर्वेक्षण का उपयोग करते हुए एक प्रयोग ने 125 उत्तरदाताओं में से नौ की पहचान की, जो लगभग 7 प्रतिशत की याद दर है। उस परीक्षण में, सिस्टम ने प्रत्येक उत्तरदाता की उनके उत्तरों के सुरागों के आधार पर एक प्रोफ़ाइल बनाई और फिर संभावित मिलानों के लिए वेब पर सार्वजनिक रूप से उपलब्ध जानकारी की खोज की। एक उदाहरण मैच में, शोधकर्ता इस बात पर प्रकाश डालते हैं कि कैसे एक “पर्यवेक्षक” का संदर्भ एक पीएचडी छात्र का सुझाव दे सकता है और ब्रिटिश अंग्रेजी का उपयोग यूके संबद्धता का संकेत दे सकता है। भौतिक विज्ञान में पृष्ठभूमि और जीव विज्ञान अनुसंधान में वर्तमान कार्य के उल्लेख के साथ, सिस्टम क्षेत्र को एक विशेष उम्मीदवार तक सीमित करने में सक्षम था।

फिर भी, शोधकर्ताओं का तर्क है कि असंरचित पाठ से किसी भी उत्तरदाता की पहचान करने की क्षमता उल्लेखनीय है, जिसे मिनटों में दोहराने में एक मानव अन्वेषक को घंटों लग जाते। इसके अलावा, उन्होंने बताया द वर्ज जैसे-जैसे एआई सिस्टम अधिक सक्षम होंगे और डेटा के बड़े पूल तक पहुंच प्राप्त होगी, प्रदर्शन में सुधार होने की संभावना है। अधिक व्यापक रूप से, वे चेतावनी देते हैं कि अब यह मान लेना सुरक्षित नहीं होगा कि छद्म नाम से पोस्ट करने से ऑनलाइन पहचान, अतीत या भविष्य की रक्षा होगी।

“एलएलएम द्वारा सैद्धांतिक रूप से पाई गई प्रत्येक चीज़ एक मानव अन्वेषक द्वारा पाई जा सकती है।”

ईटीएच ज्यूरिख के एक शोधकर्ता और अध्ययन के लेखकों में से एक डैनियल पालेका ने कहा, “इंटरनेट पर जानकारी हमेशा के लिए है।” शोधकर्ताओं ने चेतावनी दी है कि यह दृढ़ता पत्रकारों, असंतुष्टों और छद्म नामों पर भरोसा करने वाले कार्यकर्ताओं के लिए वास्तविक दुनिया के जोखिमों में तब्दील हो सकती है, साथ ही “अति-लक्षित विज्ञापन” और “अत्यधिक वैयक्तिकृत” घोटालों को भी सक्षम कर सकती है।

खातों को अज्ञात करने के जोखिम नए नहीं हैं, न ही वे एआई के लिए अद्वितीय हैं। पलेका ने बताया, “एलएलएम में सैद्धांतिक रूप से पाई गई हर एक चीज एक मानव अन्वेषक द्वारा पाई जा सकती है।” द वर्ज.

पालेका का तर्क है कि जो नया है, वह एंड-टू-एंड ऑटोमेशन है। जिस काम के लिए एक समय एक मेहनती अन्वेषक की आवश्यकता होती थी, जो जानकारी के छोटे-छोटे टुकड़ों की तलाश में धैर्यपूर्वक पोस्टों की छानबीन करता था, वह अब कहीं अधिक आसानी से और कहीं अधिक बड़ी संख्या में लक्ष्यों पर किया जा सकता है।

यह सस्ता भी है. शोधकर्ताओं ने कहा कि उनके प्रयोग की लागत $2,000 से कम है, प्रत्येक प्रोफ़ाइल के लिए लागत $1 और $4 के बीच है, जिस पर उन्होंने AI एजेंट चलाया। सहलेखक साइमन लेर्मेन ने बताया, “अर्थशास्त्र अब पूरी तरह से अलग है।” द वर्जचेतावनी देते हुए कि प्रवेश के लिए निचली बाधा का विस्तार हो सकता है जिसके पास ऑनलाइन गुमनामी का प्रयास करने और भेदने की क्षमता – और प्रोत्साहन – है। उन्होंने कहा कि जो समूह ऐतिहासिक रूप से “रडार के नीचे उड़ गए हैं” उन्हें ऐसा करना जारी रखना मुश्किल हो सकता है।

लोग “इस महत्वपूर्ण शोध को गलत समझ सकते हैं और निष्कर्ष निकाल सकते हैं कि गोपनीयता मर चुकी है।” ऐसा नहीं है.

यह महत्वपूर्ण है कि निष्कर्षों को बढ़ा-चढ़ाकर न बताया जाए। ऑक्सफ़ोर्ड इंटरनेट इंस्टीट्यूट के एसोसिएट प्रोफेसर ल्यूक रोचर ने कहा, “हालांकि इन एल्गोरिदम में सुधार हो रहा है, लेकिन ये इंसान जो कर सकते हैं उससे बहुत दूर हैं।” द वर्ज. यह कार्य वास्तविक दुनिया का स्पष्ट रूप से चित्रण नहीं करता है; प्रयोग प्रयोगशाला स्थितियों के तहत डेटासेट का उपयोग करके किए गए थे जिन्हें परीक्षण के प्रयोजनों के लिए सावधानीपूर्वक क्यूरेट किया गया था और अज्ञात किया गया था। उन्होंने कहा कि उन्हें चिंता है कि लोग “इस महत्वपूर्ण शोध को गलत समझ सकते हैं और निष्कर्ष निकाल सकते हैं कि गोपनीयता मर चुकी है।” ऐसा नहीं है, उन्होंने तर्क दिया।

रोचर ने कहा, गुमनाम उपयोगकर्ताओं को बेनकाब करने के लिए डिज़ाइन की गई तकनीकों में वर्षों की वृद्धिशील प्रगति के बावजूद, “बिटकॉइन के आविष्कारक सातोशी नाकामोटो की पहचान एक दशक से अधिक समय के बाद भी एक रहस्य बनी हुई है।” उन्होंने आगे कहा, व्हिसलब्लोअर अब भी बिना उजागर हुए पत्रकारों के साथ संवाद कर सकते हैं, और सिग्नल जैसे उपकरण “अब तक हमारी सामूहिक गोपनीयता की रक्षा करने में सफल रहे हैं।”

पेपर में, शोधकर्ताओं ने कहा कि नैतिक चिंताओं के कारण वे वास्तविक छद्म नाम वाले उपयोगकर्ताओं पर अपने सिस्टम का परीक्षण करने से बचते हैं। समान कारणों से, उन्होंने अपने दृष्टिकोण का पूरा तकनीकी विवरण प्रकाशित नहीं किया और पूछे जाने पर प्रदर्शन प्रदान करने से इनकार कर दिया। टीम यह भी नहीं बताएगी कि क्या उन्होंने अध्ययन के दायरे से बाहर सिस्टम का परीक्षण किया था, फिर से नैतिक चिंताओं का हवाला देते हुए, यह सवाल खुला छोड़ दिया कि यह वास्तविक दुनिया के खातों के खिलाफ कितना विश्वसनीय प्रदर्शन करेगा।

जो लोग पहले से ही गुमनामी के प्रति गहराई से प्रतिबद्ध हैं, उनके लिए व्यावहारिक प्रभाव सीमित हो सकता है। बुनियादी सावधानियाँ – खातों को अलग रखना, व्यक्तिगत विवरण सीमित करना, अपने समय क्षेत्र में केवल जागने के घंटों के दौरान पोस्ट करने जैसे पहचाने जाने योग्य पैटर्न से बचना – अभी भी महत्वपूर्ण हैं।

एआई स्टार्टअप रोबोट प्रतिस्थापन को प्रशिक्षित करने के लिए मुफ्त सफाई की पेशकश करता है

जो लोग छद्मनामों को अधिक सहजता से देखते हैं, उनके लिए पालेका और लेर्मेन ने उपयोगकर्ताओं को सार्वजनिक मंचों पर पोस्ट की जाने वाली चीज़ों के बारे में सावधानी से सोचने की सलाह दी, यहां तक कि ऐसे खातों पर भी जो गुमनाम लगते हैं, और यह ध्यान में रखें कि जो पहले से ही मौजूद है उसे कई लोगों की अपेक्षा अधिक आसानी से एक साथ जोड़ा जा सकता है।

शोधकर्ताओं का तर्क है कि ज़िम्मेदारी पूरी तरह से उपयोगकर्ताओं पर नहीं होनी चाहिए। लेर्मेन ने कहा कि एआई प्रयोगशालाओं को निगरानी करनी चाहिए कि उनके उपकरणों का उपयोग कैसे किया जा रहा है और लोगों को गुमनाम करने के लिए उनका उपयोग रोकने के लिए सुरक्षा उपाय तैयार करने चाहिए। उन्होंने कहा कि सोशल मीडिया प्लेटफॉर्म स्क्रैपिंग और बड़े पैमाने पर डेटा निष्कर्षण पर रोक लगा सकते हैं जो ऐसे प्रयासों को संभव बनाते हैं।

दूसरे शब्दों में, सातोशी संभवतः एआई जासूसों से सुरक्षित है। Reddit पर आपकी थकाऊ AITA पोस्ट? वह दूसरी बात हो सकती है.

विषयों और लेखकों का अनुसरण करें इस कहानी से अपने वैयक्तिकृत होमपेज फ़ीड में इस तरह की और अधिक जानकारी देखने और ईमेल अपडेट प्राप्त करने के लिए।

रॉबर्ट हार्ट
गोपनीयता

रोबोटिक फिश प्रोसेसिंग स्टार्टअप शिंकेई पर फाउंडर्स फंड का दांव

इस विषय की पोस्ट आपके दैनिक ईमेल डाइजेस्ट और आपके होमपेज फ़ीड में जोड़ दी जाएंगी।

सभी देखें गोपनीयता