हालाँकि NVIDIA वर्तमान में AI प्रशिक्षण के क्षेत्र में बेजोड़ है, वास्तविक समय तर्क की बढ़ती मांग के सामने, यह एक "गुप्त हथियार" की योजना बना रहा है जो उद्योग परिदृश्य को बदल सकता है। एजीएफ के अनुसार,एनवीआईडीआईए ने एआई अनुमान प्रदर्शन में उल्लेखनीय सुधार के लिए ग्रोक से एलपीयू (भाषा प्रसंस्करण इकाई) को 2028 में लॉन्च किए गए फेनमैन आर्किटेक्चर जीपीयू में एकीकृत करने की योजना बनाई है।

फेनमैन आर्किटेक्चर रुबिन आर्किटेक्चर का स्थान लेगा और TSMC की सबसे उन्नत A16 (1.6nm) प्रक्रिया का उपयोग करेगा। अर्धचालकों की भौतिक सीमाओं को तोड़ने के लिए, NVIDIA ने विशेष रूप से अनुमान त्वरण के लिए डिज़ाइन की गई LPU इकाइयों को सीधे GPU के शीर्ष पर रखने के लिए TSMC की SoIC हाइब्रिड बॉन्डिंग तकनीक का उपयोग करने की योजना बनाई है।

NVIDIA X3D स्टैकिंग डिज़ाइन का उपयोग करना चाहता है! जीपीयू की अगली पीढ़ी एलपीयू इकाइयां पेश करेगी

यह डिज़ाइन AMD की 3D V-कैश तकनीक के समान है, लेकिन NVIDIA साधारण कैश को नहीं, बल्कि विशेष रूप से अनुमान त्वरण के लिए डिज़ाइन की गई LPU इकाइयों को स्टैक करता है।

डिज़ाइन का मुख्य तर्क SRAM की स्केलिंग दुविधा को हल करना है। 1.6 एनएम की चरम प्रक्रिया के तहत, बड़ी संख्या में एसआरएएम को सीधे मुख्य चिप पर एकीकृत करना बेहद महंगा है और जगह लेता है।

स्टैकिंग तकनीक के माध्यम से, NVIDIA कंप्यूटिंग कोर को मुख्य चिप पर रख सकता है और SRAM को स्टैक कर सकता है जिसके लिए बड़े क्षेत्र की आवश्यकता होती है जिसे चिप्स की दूसरी परत में रखा जाता है।

TSMC की A16 प्रक्रिया की एक प्रमुख विशेषता यह है कि यह बैकसाइड बिजली आपूर्ति तकनीक का समर्थन करती है। यह तकनीक वर्टिकल सिग्नल कनेक्शन के लिए चिप के सामने जगह खाली कर सकती है, जिससे यह सुनिश्चित होता है कि स्टैक्ड एलपीयू बेहद कम बिजली खपत के साथ हाई-स्पीड डेटा एक्सचेंज कर सकते हैं।

NVIDIA X3D स्टैकिंग डिज़ाइन का उपयोग करना चाहता है! जीपीयू की अगली पीढ़ी एलपीयू इकाइयां पेश करेगी

एलपीयू के "नियतात्मक" निष्पादन तर्क के साथ संयुक्त, भविष्य के एनवीआईडीआईए जीपीयू तत्काल एआई प्रतिक्रियाओं (जैसे आवाज संवाद, वास्तविक समय अनुवाद) को संसाधित करते समय गति में गुणात्मक छलांग हासिल करेंगे।

हालाँकि, दो संभावित चुनौतियाँ भी हैं, अर्थात् गर्मी अपव्यय मुद्दे और CUDA संगतता मुद्दे।अत्यधिक उच्च कंप्यूटिंग घनत्व वाले जीपीयू में चिप्स की एक परत जोड़कर, "थर्मल क्रैश" से कैसे बचा जाए, यह इंजीनियरिंग टीम के लिए नंबर एक समस्या है।

साथ ही, एलपीयू "नियतात्मक" निष्पादन क्रम पर जोर देता है और सटीक मेमोरी कॉन्फ़िगरेशन की आवश्यकता होती है, जबकि सीयूडीए पारिस्थितिकी तंत्र हार्डवेयर अमूर्तता के आधार पर डिज़ाइन किया गया है। दोनों के बीच सही तालमेल हासिल करने के लिए शीर्ष-स्तरीय सॉफ़्टवेयर अनुकूलन की आवश्यकता है।