- ■
anthropic एआई राजनीतिक पूर्वाग्रह को मापने वाला ओपन-सोर्स टूल जारी करता है, दावा करता है कि क्लाउड 95% तटस्थता स्कोर के साथ आगे है
- ■
क्लाउड ने बेहतर प्रदर्शन किया जीपीटी-5 (89%) और मेटा का लामा 4 (66%) सम-हाथ परीक्षणों में
- ■
पहचाने जाने योग्य राजनीतिक झुकाव से बचने के लिए कंपनी क्लाउड को प्रशिक्षित करने के लिए सुदृढीकरण सीखने का उपयोग करती है
- ■
यह कदम ट्रम्प के जुलाई के कार्यकारी आदेश के बाद उठाया गया है जिसमें सरकारी खरीद से ‘वोक एआई’ पर प्रतिबंध लगाया गया है
anthropic अभी-अभी प्रतिस्पर्धी बेंचमार्क गिराए गए हैं, जिसने इसके क्लाउड एआई को राजनीतिक तटस्थता में प्रतिद्वंद्वियों से आगे रखा है, क्लॉड सॉनेट ने इसकी तुलना में 95% सम-हैंडनेस स्कोर हासिल किया है। ओपनएआईका GPT-5 89% पर और मेटाका लामा 4 मात्र 66% पर। यह समय संयोग नहीं है – यह ट्रम्प के ‘वोक एआई’ को लक्षित करने वाले कार्यकारी आदेश के महीनों बाद आया है, जिससे उद्योग यह साबित करने के लिए संघर्ष कर रहा है कि उनके मॉडल राजनीतिक रूप से तटस्थ रह सकते हैं।
anthropic एआई पूर्वाग्रह युद्धों में एक साहसिक भूमिका निभा रहा है, विस्तृत कार्यप्रणाली और प्रतिस्पर्धी बेंचमार्क जारी कर रहा है जो क्लाउड को उद्योग के सबसे राजनीतिक रूप से तटस्थ चैटबॉट के रूप में स्थापित करता है। कंपनी का नया ब्लॉग पोस्ट केवल उनके दृष्टिकोण को रेखांकित नहीं करता है – यह सीधे तौर पर कठिन संख्याओं वाले प्रतिस्पर्धियों को चुनौती देता है जो दिखाता है कि क्लाउड सॉनेट 4.5 ने तुलना में 95% सम-हैंडनेस स्कोर प्राप्त किया है। ओपनएआईका GPT-5 89% पर और मेटाका लामा 4 66% पर पिछड़ रहा है।
यह घोषणा एआई उद्योग के लिए राजनीतिक रूप से महत्वपूर्ण क्षण में आई है। जुलाई में, राष्ट्रपति ट्रम्प ने एक कार्यकारी आदेश पर हस्ताक्षर किए, जिसमें कहा गया कि सरकारी एजेंसियां केवल ‘निष्पक्ष’ और ‘सच्चाई की तलाश करने वाले’ एआई मॉडल की खरीद करती हैं, जिससे उन्होंने संघीय उपयोग से ‘वोक एआई’ पर प्रभावी रूप से प्रतिबंध लगा दिया। जबकि आदेश तकनीकी रूप से केवल सरकारी खरीद पर लागू होता है, लहर प्रभाव पहले से ही कंपनियों के मॉडल प्रशिक्षण के दृष्टिकोण को नया आकार दे रहा है।
‘मॉडल को इस तरह से परिष्कृत करना कि उन्हें लगातार और अनुमानित रूप से कुछ दिशाओं में संरेखित करना एक महंगी और समय लेने वाली प्रक्रिया हो सकती है,’ जैसा कि द वर्ज के आदि रॉबर्टसन ने उल्लेख किया है कार्यकारी आदेश को कवर करते समय. उस जटिलता का मतलब है कि सरकारी अनुपालन के लिए किए गए बदलाव उपभोक्ता-सामना वाले मॉडल तक सीमित हो जाएंगे।
ओपनएआई इस बदलाव का संकेत पिछले महीने ही मिल गया था जब उसने इसकी योजना की घोषणा की थी चैटजीपीटी में पूर्वाग्रह पर ‘नकेल कसें’. अब anthropic अधिक व्यवस्थित दृष्टिकोण के साथ दोगुना हो रहा है जो प्रतिस्पर्धी स्थिति के साथ तकनीकी नवाचार को जोड़ता है।
तकनीकी विवरण से पता चलता है कि तटस्थता का यह प्रयास कितना गहरा है। anthropic क्लाउड को प्रोग्राम किया है जिसे वह सिस्टम प्रॉम्प्ट कहता है – अनिवार्य रूप से व्यवहार संबंधी नियमों का एक सेट जो मॉडल को तथ्यात्मक सटीकता बनाए रखने और कई दृष्टिकोणों का प्रतिनिधित्व करते हुए ‘अनचाही राजनीतिक राय’ से बचने का निर्देश देता है। लेकिन वास्तविक नवाचार उनके सुदृढीकरण सीखने के दृष्टिकोण में निहित है।
कंपनी ‘पूर्व-परिभाषित लक्षणों के एक सेट के करीब प्रतिक्रियाएं उत्पन्न करने के लिए मॉडल को पुरस्कृत करने के लिए’ सुदृढीकरण सीखने का उपयोग करने का वर्णन करती है। एक प्रमुख गुण क्लाउड को निर्देश देता है कि ‘प्रश्नों का उत्तर इस तरह से देने का प्रयास करें कि कोई मुझे न तो रूढ़िवादी और न ही उदारवादी के रूप में पहचान सके।’ यह एआई सिस्टम में वैचारिक अदृश्यता को प्रोग्राम करने का एक आकर्षक प्रयास है।









