NVIDIA की नई पीढ़ी के AI कंप्यूटिंग प्लेटफॉर्म का वेरा रुबिन युग आधिकारिक तौर पर शुरू हो गया है। इसे दुनिया में सबसे तेज़ AI प्लेटफ़ॉर्म के रूप में जाना जाता है। इसे परीक्षण और सत्यापन के लिए कई शीर्ष क्लाउड सेवा प्रदाताओं को सौंप दिया गया है, जिससे बड़े मॉडल और एजेंट एआई प्रशिक्षण तैनाती के अगले चरण का मार्ग प्रशस्त हो गया है।

रिपोर्टों के अनुसार, वेरा रुबिन प्लेटफॉर्म बड़े पैमाने पर उत्पादन चरण में प्रवेश कर चुका है, और संपूर्ण सिस्टम का पहला बैच प्रमुख एआई क्लाउड विक्रेताओं के कंप्यूटर रूम में पहुंचा दिया गया है, जिसमें ओरेकल और कोरवेव जैसी कंपनियां शामिल हैं। इससे पहले, NVIDIA ने पिछले महीने कई प्रमुख एआई कंपनियों को वेरा सीपीयू का पहला बैच वितरित किया था, जिसने इस नए प्लेटफॉर्म की पारिस्थितिकी की नींव रखी थी।

ओरेकल क्लाउड इंफ्रास्ट्रक्चर के कार्यकारी उपाध्यक्ष, महेश त्यागराजन ने सबसे पहले सोशल प्लेटफॉर्म पर वेरा रुबिन एनवीएल72 रैक सिस्टम की भौतिक तस्वीरें प्रकाशित कीं, जिसमें 72 रुबिन जीपीयू और 36 वेरा सीपीयू से बना यह विशाल रैक क्लस्टर दिखाया गया था। आधिकारिक तौर पर इसे एआई वर्कलोड के लिए वर्तमान शीर्ष जीपीयू और सीपीयू संयोजन के रूप में स्थापित करते हुए, इसका लक्ष्य ग्रेस ब्लैकवेल के बाद एनवीडिया की एआई उत्पाद लाइन में एक और मील का पत्थर मंच बनना है।

HKfY-0LaAAAeCwL.jpgHKfY-0ObYAATmc4.jpg

त्यागराजन ने कहा कि ओरेकल क्लाउड में वेरा रुबिन एनवीएल72 सिस्टम पेश करने और सत्यापन परीक्षण करने वाले पहले क्लाउड प्रदाताओं में से एक है। दोनों पक्ष उद्यम ग्राहकों को बड़े पैमाने पर क्लाउड वातावरण में त्वरित कंप्यूटिंग क्षमताओं की एक नई पीढ़ी प्रदान करने के लिए मिलकर काम करेंगे। ऑन-साइट चित्रों से देखते हुए, एनवीएल72 कैबिनेट आकार में बड़ा है और इसमें जटिल वायरिंग और कूलिंग संरचनाएं हैं, जो अल्ट्रा-बड़े पैमाने के डेटा केंद्रों के लिए इसके डिजाइन अभिविन्यास को उजागर करती हैं।

ओरेकल के अलावा, क्लाउड कंप्यूटिंग कंपनी CoreWeave ने भी पहले वेरा रुबिन NVL72 सिस्टम की स्थापना के पूरा होने की घोषणा की और तैनाती के लिए परिवहन वाहन से कंप्यूटर कक्ष में उतारी जाने वाली पूरी मशीन का एक पूरा वीडियो जारी किया। स्क्रीन से पता चलता है कि एकल कैबिनेट की स्थापना के लिए 3 से 4 इंजीनियरों के सहयोगात्मक संचालन की आवश्यकता होती है। यह कुछ हद तक मात्रा और वजन के संदर्भ में सिस्टम के "डेटा सेंटर-स्तरीय" विनिर्देशों को दर्शाता है। इसका तात्पर्य यह भी है कि भविष्य में एआई डेटा केंद्रों में इसी तरह की अलमारियाँ सैकड़ों या हजारों में तैनात की जा सकती हैं।

CoreWeave ने इस बात पर भी जोर दिया कि यह न केवल वेरा रुबिन NVL72 को पेश करने वाले पहले क्लाउड सेवा प्रदाताओं में से एक था, बल्कि सॉफ्टवेयर और हार्डवेयर के पूर्ण स्टैक के संयुक्त डिबगिंग और सत्यापन को पूरा करने वाला भी पहला था। इस प्रयोजन के लिए, कंपनी ने अपना स्वयं का सॉफ़्टवेयर-परिभाषित तरल शीतलन प्रणाली और एकीकृत कैबिनेट नियंत्रण समाधान बनाया है, जिसका नाम क्रमशः वाल्वी और रैकी है, जिसका उपयोग तरल शीतलन प्रबंधन और संपूर्ण कैबिनेट वेरा रुबिन प्लेटफ़ॉर्म के एकीकृत शेड्यूलिंग के लिए किया जाता है, और "कोरवेव मिशन कंट्रोल" के माध्यम से कैबिनेट क्लस्टर स्तर पर परिचालन निगरानी प्राप्त करने के लिए किया जाता है।

NVIDIA के सीईओ जेन्सेन हुआंग द्वारा प्रस्तावित "AI एक पांच-परत वाला केक है" के वास्तुशिल्प दृश्य में, वेरा रुबिन NVL72 हार्डवेयर की केवल एक परत है। इसके पीछे, यह बिजली आपूर्ति, कूलिंग, इंटरकनेक्शन, नेटवर्क इत्यादि सहित परिष्कृत बुनियादी ढांचे के साथ-साथ कई वर्षों में निर्मित सॉफ्टवेयर स्टैक समर्थन पर भी निर्भर करता है। AI वर्कलोड के लिए CUDA और CUDA-X इकोसिस्टम को अपने मूल में रखते हुए, NVIDIA सॉफ्टवेयर और हार्डवेयर को एकीकृत करता है, जिससे प्रतिस्पर्धी निर्माताओं के लिए पारिस्थितिक परिपक्वता और व्यापक रूप से अपनाने के मामले में प्रतिस्पर्धा करना मुश्किल हो जाता है।

प्रदर्शन के संदर्भ में, रिपोर्ट से संकेत मिलता है कि मिक्स ऑफ एक्सपर्ट्स (एमओई) मॉडल प्रशिक्षण परिदृश्य में, वेरा रुबिन प्लेटफॉर्म केवल एक चौथाई जीपीयू का उपयोग करके पिछली पीढ़ी के ब्लैकवेल सिस्टम के समान प्रशिक्षण गति प्राप्त कर सकता है, जबकि अनुमान चरण में प्रति टोकन लागत को ब्लैकवेल के दसवें हिस्से तक कम किया जा सकता है। इसका मतलब यह है कि फैक्ट्री स्तर पर बड़े पैमाने पर मॉडल और एजेंट एआई को तैनात करते समय, वेरा रुबिन से बिजली घनत्व और ऊर्जा दक्षता की गणना में महत्वपूर्ण लाभ लाने की उम्मीद है, जिससे क्लाउड विक्रेताओं को लागत को नियंत्रित करने और पैमाने का विस्तार करने में महत्वपूर्ण सहायता मिलेगी।

वर्तमान में, वेरा रुबिन प्लेटफ़ॉर्म पूर्ण बड़े पैमाने पर उत्पादन में प्रवेश कर चुका है, और NVIDIA इस वर्ष की तीसरी तिमाही में आधिकारिक तौर पर ग्राहक-सामना वाले उत्पादन कार्य के पहले बैच को लॉन्च करने की योजना बना रहा है। ओरेकल और कोरवेव जैसे अग्रणी क्लाउड सेवा प्रदाताओं द्वारा लॉन्च और सत्यापन को पूरा करने में अग्रणी होने के साथ, उद्योग आमतौर पर उम्मीद करता है कि वेरा रुबिन जल्द ही एआई डेटा सेंटर बुनियादी ढांचे की नई पीढ़ी के मुख्य घटकों में से एक बन जाएगा, जो "एजेंट एआई कारखानों" और अधिक जटिल बड़े मॉडल अनुप्रयोगों के कार्यान्वयन को बढ़ावा देगा।