क्वालकॉम ने अनुमान के लिए एक्सेलेरेटर लॉन्च किया


AI200 और AI250 प्रति डॉलर प्रति वाट उच्च प्रदर्शन पर तेजी से जेनरेटिव AI अनुमान के लिए रैक-स्केल प्रदर्शन और बेहतर मेमोरी क्षमता प्रदान करने का दावा करते हैं।

एआई200 एक उद्देश्य-निर्मित रैक-स्तरीय एआई अनुमान समाधान पेश करता है जिसे एलएलएम, एलएमएम अनुमान और अन्य एआई वर्कलोड के लिए कम टीसीओ और अनुकूलित प्रदर्शन प्रदान करने के लिए डिज़ाइन किया गया है।

यह उच्च मेमोरी क्षमता और कम लागत के लिए प्रति कार्ड 768 जीबी एलपीडीडीआर का समर्थन करता है, जिससे अनुमान के लिए स्केल और लचीलापन सक्षम होता है।

AI250 का मेमोरी आर्किटेक्चर नियर-मेमोरी कंप्यूटिंग पर आधारित है, जो 10 गुना से अधिक प्रभावी मेमोरी बैंडविड्थ और कम बिजली की खपत प्रदान करके AI अनुमान वर्कलोड के लिए दक्षता और प्रदर्शन में सुधार करता है।

यह ग्राहक के प्रदर्शन और लागत आवश्यकताओं को पूरा करते हुए हार्डवेयर के कुशल उपयोग के लिए अलग-अलग एआई अनुमान लगाने में सक्षम बनाता है।

AI आर्म्स रेस में Apple म्यूजिक से लड़ने के लिए Spotify ने ChatGPT पर दांव लगाया

दोनों रैक समाधानों में थर्मल दक्षता के लिए प्रत्यक्ष तरल शीतलन, स्केल अप के लिए पीसीआईई, स्केल आउट के लिए ईथरनेट, सुरक्षित एआई वर्कलोड के लिए गोपनीय कंप्यूटिंग और 160 किलोवाट की रैक-स्तरीय बिजली खपत की सुविधा है।

क्वालकॉम-छवि

क्वालकॉम एसवीपी दुर्गा मल्लदी ने कहा, “ये नवोन्मेषी नए एआई बुनियादी ढांचे के समाधान ग्राहकों को आधुनिक डेटा केंद्रों की लचीलेपन और सुरक्षा की मांग को बनाए रखते हुए अभूतपूर्व टीसीओ पर जेनरेटिव एआई तैनात करने के लिए सशक्त बनाते हैं।”

हाइपरस्केलर-ग्रेड एआई सॉफ्टवेयर स्टैक, जो एप्लिकेशन लेयर से सिस्टम सॉफ्टवेयर लेयर तक एंड-टू-एंड तक फैला है, एआई अनुमान के लिए अनुकूलित है।

स्टैक अग्रणी मशीन लर्निंग (एमएल) फ्रेमवर्क, इंट्रेंस इंजन, जेनरेटिव एआई फ्रेमवर्क और एलएलएम / एलएमएम इंट्रेंस ऑप्टिमाइजेशन तकनीकों जैसे अलग-अलग सर्विंग का समर्थन करता है।

डेवलपर्स को क्वालकॉम टेक्नोलॉजीज की कुशल ट्रांसफॉर्मर लाइब्रेरी और क्वालकॉम एआई इनफरेंस सूट के माध्यम से निर्बाध मॉडल ऑनबोर्डिंग और हगिंग फेस मॉडल की एक-क्लिक तैनाती से लाभ होता है। हमारा सॉफ्टवेयर एआई को संचालित करने के लिए उपयोग में आसान एआई एप्लिकेशन और एजेंट, व्यापक उपकरण, लाइब्रेरी, एपीआई और सेवाएं प्रदान करता है।

पिंट आकार का सोनोस रोआम 2 इस सप्ताहांत 20 प्रतिशत से अधिक है

AI200 और AI250 के क्रमशः 2026 और 2027 में व्यावसायिक रूप से उपलब्ध होने की उम्मीद है।





Source link

Leave a Comment