मुस्तफा सुलेमान लंबे समय से अपनी नई नौकरी के विवरण की तैयारी कर रहे हैं। सुलेमान माइक्रोसॉफ्ट के एआई के शुरुआती सीईओ हैं, लेकिन मार्च के मध्य में कंपनी के बड़े पैमाने पर पुनर्गठन के बाद, उन्होंने कुछ कर्तव्यों को सौंप दिया और अपना ध्यान सुपरइंटेलिजेंस पर केंद्रित कर दिया। वह बताते हैं, हालांकि यह खबर पिछले महीने ही सार्वजनिक की गई थी द वर्जवह लगभग नौ महीने से परिवर्तन की तैयारी कर रहा था – और हालाँकि OpenAI के साथ Microsoft के अनुबंध पर फिर से बातचीत करना वह चीज़ है जिसे आधिकारिक तौर पर “अनलॉक” किया गया है [Microsoft’s] अधीक्षण को आगे बढ़ाने की क्षमता,” वह स्याही सूखने से पहले ही योजना बना रहा था।
“यह एक लंबे समय से चली आ रही योजना रही है,” उन्होंने कहा, उन्होंने कहा कि अधीक्षण हासिल करना “विशुद्ध रूप से मेरा ध्यान केंद्रित था।”
सुपरइंटेलिजेंस – एजीआई, या कृत्रिम सामान्य बुद्धि के साथ – एआई उद्योग में एक अस्पष्ट और बदलती परिभाषा है। सुलेमान के लिए, यह पूरी तरह से व्यवसाय और उत्पादकता के बारे में है। “सुपरइंटेलिजेंस वास्तव में इस बारे में है, ‘क्या ये मॉडल उन लाखों उद्यमों के लिए उत्पाद मूल्य प्रदान करने में सक्षम हैं जो विश्व स्तरीय भाषा मॉडल वितरित करने के लिए हम पर निर्भर हैं?” सुलेमान ने कहा। “यह वास्तव में हमारा ध्यान केंद्रित है। हम डेवलपर्स, उद्यमों और कई, कई उपभोक्ताओं के लिए वितरित करना चाहते हैं।” एआई कंपनियों को अधिक राजस्व देने के लिए भारी दबाव का सामना करना पड़ता है, और माइक्रोसॉफ्ट की योजनाएं ओपनएआई में भी एक नई रणनीति की प्रतिध्वनि देती हैं।
माइक्रोसॉफ्ट के पुनर्गठन ने कोपायलट एआई बैनर के तहत अपनी उद्यम और उपभोक्ता टीमों को मिला दिया। जबकि सुलेमान अभी भी बड़ी तस्वीर वाली रणनीति पर काम करेंगे, जैकब आंद्रेउ, जो पहले माइक्रोसॉफ्ट एआई के लिए उत्पाद और विकास के कॉर्पोरेट उपाध्यक्ष थे, इसके कार्यकारी उपाध्यक्ष बने, अग्रणी नई संयुक्त टीमों की इंजीनियरिंग, विकास, उत्पाद और डिज़ाइन पहल। उस बदलाव ने सुलेमान के लिए अपना समय सुपरइंटेलिजेंस को आगे बढ़ाने और माइक्रोसॉफ्ट के लिए नए फ्रंटियर एआई मॉडल विकसित करने के लिए समर्पित करने के लिए जगह छोड़ी, ऐसे समय में जब अग्रणी एआई कंपनियों के बीच प्रतिस्पर्धा – और नए भुगतान करने वाले उपभोक्ताओं और उद्यम ग्राहकों को आकर्षित करने का दबाव – पहले से कहीं अधिक तेज है।
गुरुवार को, माइक्रोसॉफ्ट ने एक नया ट्रांसक्रिप्शन मॉडल लॉन्च किया, उसे उम्मीद है कि यह ऐसा ही करेगा – और, जैसा कि सुलेमान के अनुसार, यह “अन्य अत्याधुनिक मॉडलों की आधी जीपीयू लागत” है, यह माइक्रोसॉफ्ट के लिए “भारी लागत-बचत” है।
कंपनी एमएआई-ट्रांसक्राइब-1 को 25 भाषाओं में मीटिंग, कैप्शन वीडियो और कॉल सेंटर एक्सचेंजों का विश्लेषण करने की क्षमता के साथ “भाषण पहचान की सीमा को आगे बढ़ाने” के रूप में पेश करती है। मॉडल की घोषणा करते हुए माइक्रोसॉफ्ट के ब्लॉग पोस्ट में कहा गया है कि इसे पृष्ठभूमि शोर, कम गुणवत्ता वाले ऑडियो और ओवरलैपिंग भाषण सहित “चुनौतीपूर्ण” रिकॉर्डिंग स्थितियों के लिए बनाया गया था, जिसे “मानव-क्यूरेटेड” और मशीन-ट्रांसक्रिप्टेड ट्रांसक्रिप्ट के संयोजन पर प्रशिक्षित किया गया था। सुलेमान ने कहा कि स्रोत रिकॉर्डिंग नियंत्रित साउंड बूथ डेटा और ठेकेदारों का मिश्रण है, जिन्हें व्यस्त सड़कों से लेकर बच्चों के इधर-उधर भागते हुए पृष्ठभूमि शोर के बीच खुद को रिकॉर्ड करने का काम सौंपा गया है, साथ ही “खुले वेब से भारी मात्रा में डेटा” भी है।
मौजूदा वॉयस और इमेज-जेनरेशन मॉडल MAI-वॉयस-1 और MAI-इमेज-2 के साथ, नया ट्रांसक्रिप्शन मॉडल अब Microsoft फाउंड्री पर और नए Microsoft AI प्लेग्राउंड के हिस्से के रूप में उपलब्ध है। माइक्रोसॉफ्ट के अनुसार, यह पहली बार है कि ये मॉडल “व्यापक रूप से व्यावसायिक उपयोग के लिए उपलब्ध हैं”। MAI-Transcribe-1 MP3, WAV और FLAC फॉर्मेट में ऑडियो फाइलों को संभाल सकता है।
सुलेमान परीक्षणों में नए मॉडल के प्रदर्शन का श्रेय एक छोटी, केंद्रित 10-व्यक्ति टीम को देते हैं। उनका कहना है कि मॉडलिंग टीम को “किसी भी नौकरशाही से मुक्त कर दिया गया है”, क्योंकि उनके पास एक आसपास की टीम है जो विक्रेताओं को प्रबंधित करने, डाउनलोड करने के लिए डेटा ढूंढने और बहुत कुछ करने के लिए जिम्मेदार है। माइक्रोसॉफ्ट ने आवाज और छवि निर्माण के लिए एक समान रणनीति अपनाई है, और अन्य कंपनियों ने भी इसी तरह के कदम उठाए हैं – मेटा, अमेज़ॅन और गूगल हैं के साथ प्रयोग कर रहे हैं अपने संगठनों को समतल करते हुए, और एंथ्रोपिक ने कहा है कि वह कुछ डेवलपर्स की छोटी टीमों को कुछ निश्चित स्तरों की गणना के साथ स्वतंत्र लगाम देने का भी प्रयोग कर रहा है ताकि वे देख सकें कि वे क्या हासिल कर सकते हैं।
नया प्रतिलेखन मॉडल “मानव-केंद्रित” एआई (माइक्रोसॉफ्ट के पसंदीदा एआई मूलमंत्र, “मानवतावादी अधीक्षण” का एक रूप) प्रदान करने के सुलेमान के लक्ष्य का हिस्सा है जो रोजमर्रा के व्यक्ति के लिए उपयोगी है। उन्होंने कहा, “हर किसी की जेब में एक एआई सहायक होगा जो वास्तव में विश्व स्तरीय होगा, उनके प्रति जवाबदेह होगा, उनके पक्ष में होगा, उनके हितों से जुड़ा होगा, उनकी ओर से काम करेगा।”









