SuperCLUE टीम ने DeepSeek V4 श्रृंखला के चीनी बड़े मॉडल के मूल्यांकन परिणाम जारी किए। डीपसीक-वी4-प्रो अपने व्यापक प्रदर्शन के कारण देश में पहले स्थान पर है।फ्लैश संस्करण दूसरे स्थान पर रहा, और घरेलू ओपन सोर्स मॉडल एक और सफलता हासिल कर रहा है। इस मूल्यांकन में छह आयाम शामिल हैं: गणितीय तर्क, वैज्ञानिक तर्क, कोड निर्माण, एजेंट कार्य योजना, निर्देश का पालन, और भ्रम नियंत्रण। प्रो संस्करण ने 70.98 अंक और फ़्लैश संस्करण ने 68.82 अंक अर्जित किये। दोनों स्कोर अन्य घरेलू मॉडलों से काफी आगे थे।


डीपसीक वी4 श्रृंखला एक नया ध्यान तंत्र अपनाती है। सभी संस्करण कंप्यूटिंग शक्ति और मेमोरी उपयोग को कम करते हुए लाखों लंबे संदर्भों का समर्थन करते हैं। जब घरेलू चिप्स के साथ उपयोग किया जाता है, तो समग्र दक्षता अधिक होती है।

पिछली पीढ़ी के V3.2 की तुलना में, दोनों संस्करणों ने व्यापक सुधार हासिल किए हैं। प्रो संस्करण की एजेंट क्षमता में 20 से अधिक अंकों का सुधार किया गया है, गणितीय तर्क में लगभग 10 अंकों का सुधार किया गया है, कमांड फॉलोइंग में लगभग 12 अंकों का सुधार किया गया है, और भ्रम नियंत्रण को भी काफी अनुकूलित किया गया है।


कुशल तर्क को बनाए रखते हुए, फ्लैश संस्करण उत्कृष्ट लागत प्रदर्शन के साथ एजेंट और गणितीय तर्क में भी उल्लेखनीय सुधार करता है।


प्रो संस्करण (15 युआन/मिलियन टोकन) उच्च प्रदर्शन, अधिक स्थिर भ्रम नियंत्रण पर केंद्रित है, और जटिल कार्यों और पेशेवर दृश्यों के लिए उपयुक्त है। फ़्लैश संस्करण तेज़ और सस्ता है. एपीआई की कीमत केवल 1.25 युआन प्रति मिलियन टोकन है, जो इसे दैनिक उपयोग के लिए अधिक लागत प्रभावी बनाती है।

मूल्यांकन में यह भी बताया गया कि कोड जनरेशन और जटिल निर्देश निष्पादन के मामले में मॉडल और शीर्ष विदेशी मॉडल के बीच अभी भी अंतर है। कुल मिलाकर, डीपसीक वी4 ने अपनी संतुलित क्षमताओं और किफायती लागत के साथ खुद को चीन में पहले क्षेत्र के रूप में स्थापित किया है, जो दैनिक कार्यालय के काम, विकास और निर्माण और लंबे पाठ प्रसंस्करण के लिए एक उच्च गुणवत्ता वाला विकल्प बन गया है।