Quick Technology ने 3 मई को बताया कि बड़े मॉडलों की DeepSeek V4 श्रृंखला आधिकारिक तौर पर 24 अप्रैल को जारी की गई थी। पिछले साल के DeepSeek R1 अपडेट को 15 महीने हो गए हैं। V4 के प्रदर्शन ने देश और विदेश में भी चर्चा शुरू कर दी है, और अमेरिकी भी बहुत चिंतित हैं।
DeepSeek V4 की क्षमता का मूल्यांकन करने के लिए कई परीक्षण हुए हैं, काउंसिल ऑन फॉरेन रिलेशंस में 3 वरिष्ठ शोधकर्ताओं द्वारा आयोजित एक पिछली शोध रिपोर्ट से पता चला है कि यह शीर्ष अमेरिकी बड़े मॉडलों से लगभग 7 महीने पीछे है।
अब नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी (NIST) की सहायक कंपनी सेंटर फॉर आर्टिफिशियल इंटेलिजेंस स्टैंडर्ड्स एंड इनोवेशन (CAISI) भी DeepSeek V4 का मूल्यांकन करने आ गई है। उनका निष्कर्ष यह है कि डीपसीक वी4 संयुक्त राज्य अमेरिका से लगभग 8 महीने पीछे है, जो पिछले अंतर के समान है।

अपने AI क्षमता मूल्यांकन परिणामों में, DeepSeek V4 ने 800 अंक प्राप्त किए, और वर्तमान सबसे मजबूत GPT-5.5 है, 1200 से अधिक अंकों के स्कोर के साथ, GPT-5.4 और Opus 4.6 भी ऊपर हैं 1000 अंक.
DeepSeek V4 का समग्र प्रदर्शन 8 महीने पहले GPT-5 के समान है, लेकिन DeepSeek अधिकारियों ने पहले एक रिलीज़ रिपोर्ट में इसे GPT-5.4 के समान माना था।
हालाँकि, CAISI ने यह भी स्वीकार किया कि DeepSeek V4 चीन में सबसे शक्तिशाली बड़ा AI मॉडल है जिसका उन्होंने मूल्यांकन किया है, और नेटवर्क, सॉफ्टवेयर इंजीनियरिंग, प्राकृतिक विज्ञान, अमूर्त तर्क और गणित के पांच क्षेत्रों में नौ परीक्षणों में बहुत मजबूत है।

इससे भी महत्वपूर्ण बात यह है कि डीपसीक वी4 अधिक लागत प्रभावी है। यहां तक कि GPT-5.4 मिनी लार्ज मॉडल की तुलना में, जो संयुक्त राज्य अमेरिका में सबसे अधिक लागत प्रभावी मॉडल है, डीपसीक V4 की 7 बेंचमार्क परीक्षणों में से 4 में बेहतर परीक्षण लागत है, जो 41% से 53% तक अधिक है।
