NVIDIAआजओपनरीज़निंग-नेमोट्रॉन जारी किया गया, जो 1.5 अरब, 7 अरब, 14 अरब और 32 अरब मापदंडों के साथ चार सुव्यवस्थित अनुमान मॉडल का एक संग्रह है, जो सभी 67.1 अरब मापदंडों के साथ डीपसीक आर1 0528 से प्राप्त हुए हैं। एक विशाल "शिक्षक" मॉडल को चार क्वेन-2.5-आधारित "छात्र" मॉडल में संपीड़ित करके, एनवीआईडीआईए उच्च जीपीयू शुल्क और क्लाउड उपयोग के बारे में चिंता किए बिना मानक गेमिंग उपकरणों पर भी उन्नत अनुमान प्रयोगों को सक्षम बनाता है।

मुख्य बात परिष्कृत तकनीक नहीं है, बल्कि कच्चा डेटा है। NVIDIA ने 5 मिलियन गणित, विज्ञान और कोड समाधान उत्पन्न करने के लिए NeMo स्किल्स पाइपलाइन का उपयोग किया, फिर शुद्ध पर्यवेक्षित शिक्षण के माध्यम से प्रत्येक समाधान को ठीक किया। वर्तमान में, 32 बिलियन पैरामीटर मॉडल ने AIME24 पर 89.2 अंक और HMMT फरवरी प्रतियोगिता में 73.8 अंक हासिल किए, जबकि 1.5 बिलियन पैरामीटर संस्करण ने भी 55.5 और 31.5 अंक के ठोस स्कोर हासिल किए।

NVIDIA इन मॉडलों को शक्तिशाली अनुसंधान टूलकिट के रूप में देखता है। सभी चार चेकपॉइंट हगिंग फेस पर डाउनलोड के लिए उपलब्ध हैं, जो सुदृढीकरण सीखने-संचालित अनुमान की खोज करने या विशिष्ट कार्यों के लिए मॉडल को अनुकूलित करने के लिए एक ठोस आधार प्रदान करते हैं। जेनसेलेक्ट मोड (प्रति प्रश्न कई पुनरावृत्तियों) का उपयोग करके, कई समानांतर बिल्ड उत्पन्न करना और सर्वोत्तम उत्तर का चयन करना संभव है, जिसके परिणामस्वरूप असाधारण 32बी मॉडल प्रदर्शन होता है जो कई गणित और कोडिंग बेंचमार्क पर ओपनएआई के ओ 3-उच्च प्रदर्शन को प्रतिद्वंद्वी या उससे भी अधिक करता है।

क्योंकि NVIDIA ने इन मॉडलों को केवल पर्यवेक्षित फाइन-ट्यूनिंग का उपयोग करके प्रशिक्षित किया है, न कि सुदृढीकरण सीखने का, समुदाय के पास भविष्य के सुदृढीकरण सीखने के प्रयोगों के लिए एक स्पष्ट, उन्नत प्रारंभिक बिंदु है। गेमर्स और घरेलू शौकीनों के लिए, यदि आपके पास अधिक शक्तिशाली गेमिंग जीपीयू है, तो हमें एक पूरी तरह से स्थानीयकृत मॉडल मिलता है जो अत्याधुनिक के बहुत करीब पहुंच सकता है।