MLCommons ने आधिकारिक तौर पर 6 बिलियन पैरामीटर बड़े भाषा मॉडल और कंप्यूटर विज़न और प्राकृतिक भाषा प्रसंस्करण मॉडल GPT-J के लिए MLPerf अनुमान v3.1 के प्रदर्शन बेंचमार्क परीक्षण परिणामों की घोषणा की। इंटेल सीपीयू प्रोसेसर और एआई एक्सेलेरेटर ने अच्छा प्रदर्शन किया और एआई अनुमान में काफी प्रतिस्पर्धी हैं।
पहले बताए गए MLCCommonsAI प्रशिक्षण परिणाम और जून में HuggingFace प्रदर्शन बेंचमार्क परीक्षण परिणामों से पता चला कि इंटेल गौडी2AI त्वरक उन्नत दृश्य भाषा मॉडल में NVIDIA H100 त्वरक के प्रदर्शन को पूरी तरह से पार कर सकता है।इसे NVIDIAH100/A100 का एकमात्र व्यवहार्य विकल्प कहा जा सकता है, नवीनतम परिणाम फिर से इसकी पुष्टि करते हैं।
जीपीटी-जे मॉडल पर, इंटेल गौडी2 एक्सेलेरेटर का जीपीटी-जे-99, जीपीटी-जे-99.9 सर्वर क्वेरी और ऑफ़लाइन नमूना अनुमान प्रदर्शन क्रमशः 78.58 गुना/सेकंड और 84.08 गुना/सेकंड है।
प्रतिस्पर्धी उत्पादों की तुलना में, H100 में गौडी2 की तुलना में केवल 1.09 गुना (सर्वर) और 1.28 गुना (ऑफ़लाइन) प्रदर्शन लाभ है। A100 की तुलना में गौडी2 में 2.4 गुना (सर्वर) और 2 गुना (ऑफ़लाइन) प्रदर्शन लाभ है।
यह उल्लेखनीय हैगौडी2 द्वारा प्रस्तुत परिणाम 99.9% की सटीकता के साथ एफपी8 डेटा प्रकार का उपयोग करते हैं।
गौडी2 सॉफ्टवेयर हर 6-8 सप्ताह में अपडेट किया जाता है और यह एमएलपर्फ बेंचमार्क प्रदर्शन में सुधार और मॉडल कवरेज का विस्तार करना जारी रखेगा।
उसी समय, इंटेल ने GPT-J मॉडल सहित, SapphireRapids चौथी पीढ़ी के Xeon स्केलेबल प्रोसेसर पर आधारित 7 अनुमान बेंचमार्क परीक्षण प्रस्तुत किए।
नतीजे बताते हैं कि चौथी पीढ़ी का Xeon दृष्टि, भाषा प्रसंस्करण, भाषण और ऑडियो अनुवाद मॉडल के साथ-साथ बड़े DLRMv2 गहन शिक्षण अनुशंसा मॉडल और ChatGPT-J मॉडल सहित सामान्य AI कार्यभार को संभालने में बहुत अच्छा प्रदर्शन करता है।
इस समय,इंटेल उद्योग-मानक गहन शिक्षण पारिस्थितिकी तंत्र सॉफ़्टवेयर का उपयोग करके सार्वजनिक सीपीयू परिणाम प्रस्तुत करने वाला एकमात्र विक्रेता बना हुआ है।
नवीनतम परिणामों के अनुसार,लगभग 1,000-1,500 शब्दों की 1000-शब्द प्रेस विज्ञप्ति को सारांशित करने के लिए जीपीटी-जे का उपयोग करते हुए, चौथी पीढ़ी का ज़ीऑन ऑफ़लाइन मोड में प्रति सेकंड दो पैराग्राफ और वास्तविक समय सर्वर मोड में प्रति सेकंड एक पैराग्राफ पूरा कर सकता है।
भी,इंटेल ने पहली बार Xeon CPUMax प्रोसेसर के लिए MLPerf परीक्षण परिणाम प्रस्तुत किया, जो 64GB HBM3 हाई-बैंडविड्थ मेमोरी को एकीकृत करता है, एकमात्र सीपीयू है जो GPT-J के लिए 99.9% सटीकता प्राप्त कर सकता है, जो अत्यधिक उच्च सटीकता आवश्यकताओं वाले अनुप्रयोगों के लिए बहुत उपयुक्त है।
खरीद पृष्ठ पर जाएँ:
इंटेल फ्लैगशिप स्टोर