चाइना एकेडमी ऑफ इंफॉर्मेशन एंड कम्युनिकेशंस टेक्नोलॉजी ने आज घोषणा की कि उसने मॉडल और घरेलू सॉफ्टवेयर और हार्डवेयर के बीच गहन सहयोग को बढ़ावा देने और औद्योगिक कार्यान्वयन में तेजी लाने के लिए आधिकारिक तौर पर डीपसीक वी4 का स्थानीयकरण अनुकूलन परीक्षण लॉन्च किया है।यह परीक्षण उद्योग और सूचना प्रौद्योगिकी मंत्रालय की प्रमुख प्रयोगशाला और AISHPerf बेंचमार्क सिस्टम के आधार पर किया गया था, जिसमें फुल-स्टैक AI सॉफ्टवेयर और हार्डवेयर उत्पादों जैसे चिप्स, सर्वर, ऑल-इन-वन मशीन, क्लस्टर, डेवलपमेंट टूल चेन और इंटेलिजेंट कंप्यूटिंग प्लेटफॉर्म को शामिल किया गया था, जो डीपसीक V4 मॉडल की पूरी श्रृंखला के अनुमान और फाइन-ट्यूनिंग प्रक्रियाओं पर ध्यान केंद्रित करता था।
मूल्यांकन पांच आयामों से मूल्यांकन करता है: अनुकूलन में आसानी, कार्यात्मक पूर्णता, अनुकूलन प्रभाव, प्रदर्शन और लागत, और एक त्रि-आयामी मूल्यांकन प्रणाली बनाने के लिए अनुक्रम प्रसंस्करण, कोड क्षमताओं, एजेंट कॉल सफलता दर और कार्य डिस्सेप्लर जैसे विशेष संकेतक जोड़ता है।
अपनी रिलीज़ के दिन, डीपसीक वी4 ने कई घरेलू हार्डवेयर के लिए डे-0 अनुकूलन हासिल कर लिया है, जो घरेलू एआई सॉफ्टवेयर और हार्डवेयर के समान-आवृत्ति पुनरावृत्ति चरण में प्रवेश को चिह्नित करता है।
यह परीक्षण अनुकूलन स्तर को निष्पक्ष रूप से सत्यापित करेगा, घरेलू कंप्यूटिंग शक्ति के समर्थन को मजबूत करेगा और एक स्वतंत्र और नियंत्रणीय एआई पारिस्थितिकी तंत्र के निर्माण में तेजी लाएगा।
डीपसीक वी4 में दो संस्करण शामिल हैं: वी4-प्रो (फ्लैगशिप संस्करण) और वी4-फ्लैश (लाइटवेट संस्करण)। दोनों संस्करण मूल रूप से 1 मिलियन टोकन अल्ट्रा-लॉन्ग संदर्भों (लगभग 750,000 शब्द) का समर्थन करते हैं। वे दस लाख संदर्भों के लिए अनुमान की लागत को 70% तक कम करने और स्मृति उपयोग को 40% तक कम करने के लिए स्व-विकसित डीएसए विरल ध्यान तंत्र को अपनाते हैं।
वी4-प्रो: कुल पैरामीटर 1.6 ट्रिलियन तक पहुंचते हैं, और सक्रियण पैरामीटर 49बी हैं। यह शीर्ष प्रदर्शन सीमा, जीपीटी-5 और क्लाउड ओपस जैसे दुनिया के शीर्ष क्लोज्ड-सोर्स मॉडल के मुकाबले बेंचमार्क पर केंद्रित है, और जटिल तर्क, कोड पीढ़ी, वैज्ञानिक अनुसंधान गणना और अन्य कठिन कार्यों के लिए उपयुक्त है।
वी4-फ्लैश: कुल पैरामीटर 284बी, सक्रियण पैरामीटर 13बी, उच्च दक्षता और कम लागत पर ध्यान केंद्रित, प्रो संस्करण के करीब तर्क क्षमता, तेज गति, कम कीमत, दैनिक बातचीत के लिए उपयुक्त, सामग्री निर्माण, उद्यम हल्के तैनाती और अन्य परिदृश्य।
