- ■
माइक्रोसॉफ्ट के एमएआई डिवीजन ने तीन मूलभूत मॉडल लॉन्च किए: वॉयस-टू-टेक्स्ट ट्रांसक्रिप्शन, ऑडियो जेनरेशन और इमेज सिंथेसिस। टेकक्रंच
- ■
मुस्तफा सुलेमान के नेतृत्व में एमएआई के गठन के छह महीने बाद पहला बड़ा उत्पाद जारी
- ■
यह कदम Google की मल्टीमॉडल पेशकशों के साथ सीधे प्रतिस्पर्धा करते हुए OpenAI साझेदारी पर Microsoft की निर्भरता को कम करता है
- ■
एंटरप्राइज़ ग्राहक अब वॉयस, ऑडियो और विज़ुअल तौर-तरीकों में Microsoft-नेटिव AI तक पहुंच सकते हैं
माइक्रोसॉफ्ट का नवगठित एमएआई डिवीजन ने अभी-अभी तीन मूलभूत एआई मॉडल गिराए हैं – जो एक सीधी चुनौती है ओपनएआई और गूगल मल्टीमॉडल दौड़ में. मॉडल वॉयस ट्रांसक्रिप्शन, ऑडियो जेनरेशन और इमेज निर्माण को संभालते हैं, जो छह महीने पहले मुस्तफा सुलेमान के स्वतंत्र एआई समूह के गठन के बाद पहला ठोस उत्पाद लॉन्च है। यह कदम केवल ओपनएआई की तकनीक पर निर्भर रहने के बजाय अपने एआई स्टैक का स्वामित्व लेने के माइक्रोसॉफ्ट के इरादे का संकेत देता है।
माइक्रोसॉफ्ट से स्वतंत्रता स्थापित करने के लिए अपना अब तक का सबसे साहसिक कदम उठा रहा है ओपनएआई साझेदारी. कंपनी का एमएआई प्रभाग – एआई अनुसंधान समूह का गठन पिछले अक्टूबर में हुआ था गूगल डीपमाइंड के सह-संस्थापक मुस्तफा सुलेमान – ने अभी तीन मूलभूत मॉडल जारी किए हैं जो वॉयस ट्रांसक्रिप्शन, ऑडियो जेनरेशन और इमेज निर्माण को संभालते हैं।
समय इससे अधिक रणनीतिक नहीं हो सकता। जबकि माइक्रोसॉफ्ट OpenAI में अरबों डॉलर खर्च करने और अपने उत्पाद सूट में GPT-4 को एकीकृत करने के बाद, तकनीकी दिग्गज चुपचाप अपनी खुद की AI नींव का निर्माण कर रहा है। ये मॉडल उस प्रयास के पहले ठोस परिणाम का प्रतिनिधित्व करते हैं, जो एंटरप्राइज़ ग्राहकों को तृतीय-पक्ष AI टूल के लिए Microsoft-मूल विकल्प प्रदान करते हैं।
वॉयस ट्रांसक्रिप्शन मॉडल जैसे स्थापित खिलाड़ियों को लक्ष्य बनाता है ओपनएआई कानाफूसी और गूगल का वाक्-से-पाठ सेवाएँ। इसे उच्च सटीकता के साथ बोली जाने वाली भाषा को लिखित पाठ में परिवर्तित करने के लिए डिज़ाइन किया गया है, जो टीमों में ट्रांसक्रिप्ट को पूरा करने से लेकर विंडोज़ में एक्सेसिबिलिटी सुविधाओं तक हर चीज़ के लिए एक महत्वपूर्ण क्षमता है। ऑडियो जेनरेशन मॉडल उस स्क्रिप्ट को फ़्लिप करता है, यथार्थवादी वॉयस आउटपुट को संश्लेषित करता है – संभावित रूप से वर्चुअल असिस्टेंट से लेकर ऑडियोबुक कथन तक सब कुछ शक्ति प्रदान करता है।
लेकिन यह छवि निर्माण मॉडल है जो डालता है माइक्रोसॉफ्ट से सीधा मुकाबला है ओपनएआई DALL-ई और गूगल का इमेजेन. एंटरप्राइज़ ग्राहक अपने एआई छवि टूल पर अधिक नियंत्रण की मांग कर रहे हैं, विशेष रूप से लाइसेंसिंग, डेटा गोपनीयता और अनुकूलन के आसपास। माइक्रोसॉफ्ट के स्वामित्व वाला मॉडल कॉर्पोरेट ग्राहकों को बाहरी एपीआई से परे एक और विकल्प देता है।









