डीपसीक बड़े मॉडल समावेशन की सीमाओं को फिर से परिभाषित कर रहा है। 26 अप्रैल को, डीपसीक ने आधिकारिक तौर पर एपीआई मूल्य समायोजन घोषणा जारी की। सभी एपीआई इनपुट कैश हिट्स की कीमत शुरुआती कीमत के दसवें हिस्से तक कम कर दी गई है। V4‑Pro अपग्रेड पर सीमित समय के लिए 25% की छूट है, और एक मिलियन टोकन का इनपुट कैश हिट 0.025 युआन जितना कम है, जो दुनिया में बड़े मॉडलों की कीमत में एक नया निचला स्तर स्थापित करता है।

डीपसीक के आधिकारिक एपीआई मूल्य निर्धारण पृष्ठ पर घोषणा के अनुसार, यह मूल्य कटौती वी4 श्रृंखला के सभी मॉडलों को कवर करती है, और मुख्य समायोजन इनपुट कैश हिट परिदृश्यों पर केंद्रित है। उनमें से, डीपसीक-वी4-फ्लैश इनपुट कैश हिट मूल्य 0.2 युआन/मिलियन टोकन से गिरकर 0.02 युआन/मिलियन टोकन हो गया।

एंटरप्राइज़-स्तर के उपयोगकर्ताओं के लिए डीपसीक-वी4-प्रो पर और भी अधिक छूट है। कैश इनपुट के लिए 1 युआन/मिलियन टोकन की मूल कीमत घटाकर 0.1 युआन कर दी गई है। 5 मई, 2026 से पहले सीमित समय के लिए 25% की विशेष पेशकश जोड़ी गई है, जो वास्तव में केवल 0.025 युआन/मिलियन टोकन है। कैश मिस इनपुट 12 युआन से घटाकर 3 युआन कर दिया गया है, और आउटपुट 24 युआन से घटाकर 6 युआन कर दिया गया है।


छवि स्रोत: डीपसीक आधिकारिक वेबसाइट

डीपसीक ने उल्लेख किया कि दो मॉडल नाम डीपसीक-चैट और डीपसीक-रीज़नर को भविष्य में बंद कर दिया जाएगा। अनुकूलता कारणों से, दोनों क्रमशः डीपसीक-वी4-फ्लैश के गैर-सोच और सोच मोड के अनुरूप हैं।

मूल्य समायोजन से पहले और बाद की कीमतों की तुलना करने पर, यह पता लगाना आसान है कि उच्च-आवृत्ति कॉल और लंबे टेक्स्ट प्रोसेसिंग परिदृश्यों की लागत में 90% से अधिक की गिरावट आई है। आरएजी ज्ञान आधार, बुद्धिमान ग्राहक सेवा और दस्तावेज़ विश्लेषण जैसे उच्च कैश हिट दर वाले एप्लिकेशन सीधे वाणिज्यिक लागत में भारी गिरावट का एहसास कर सकते हैं, जिससे एआई के बड़े पैमाने पर कार्यान्वयन की लागत बाधाओं को तोड़ने में मदद मिलती है।

डीपसीक की महत्वपूर्ण कीमत में कमी डीपसीक‑V4 के तकनीकी उन्नयन और शेंगटेंग पारिस्थितिकी तंत्र के साथ गहन सहयोग से संबंधित है।

24 अप्रैल को, डीपसीक‑V4 का पूर्वावलोकन संस्करण आधिकारिक तौर पर जारी किया गया था। ओपन सोर्स प्रो और फ्लैश दोनों मॉडल 1 मिलियन टोकन अल्ट्रा-लॉन्ग संदर्भों का समर्थन करते हैं। स्व-विकसित विरल ध्यान वास्तुकला अनुमान कंप्यूटिंग शक्ति की खपत को काफी कम कर देती है। प्रो संस्करण की एकल-टोकन कंप्यूटिंग शक्ति V3.2 का केवल 27% है, और KV कैश 10% तक कम हो गया है, जिससे नीचे से ऊपर तक लागत अनुकूलन प्राप्त होता है।

डीपसीक द्वारा घोषित मापदंडों से पता चलता है कि डीपसीक‑वी4‑प्रो में 49बी सक्रियण पैरामीटर और 33टी प्री-ट्रेनिंग डेटा है, जो इसे उच्च-प्रदर्शन वाले फ्लैगशिप के रूप में स्थापित करता है; डीपसीक‑वी4‑फ्लैश में 13बी सक्रियण पैरामीटर और 32टी पूर्व-प्रशिक्षण डेटा है, जो उच्च गति और कम लागत पर ध्यान केंद्रित करता है।

पिछली पीढ़ी के मॉडल की तुलना में, डीपसीक-वी4-प्रो की एजेंट क्षमताएं काफी बढ़ गई हैं। एजेंटिक कोडिंग मूल्यांकन में, V4-प्रो वर्तमान ओपन सोर्स मॉडल के सर्वोत्तम स्तर पर पहुंच गया है, और अन्य एजेंट-संबंधित मूल्यांकनों में भी अच्छा प्रदर्शन किया है। बताया गया है कि डीपसीक-वी4 डीपसीक के आंतरिक कर्मचारियों द्वारा इस्तेमाल किया जाने वाला एजेंटिक कोडिंग मॉडल बन गया है। मूल्यांकन प्रतिक्रिया के अनुसार, उपयोग का अनुभव सॉनेट 4.5 से बेहतर है, और डिलीवरी की गुणवत्ता क्लाउड ओपस 4.6 नॉन-थिंकिंग मोड के करीब है, लेकिन ओपस 4.6 थिंकिंग मोड के साथ अभी भी एक निश्चित अंतर है।

विश्व ज्ञान मूल्यांकन में, डीपसीक-वी4-प्रो अन्य ओपन सोर्स मॉडल से काफी आगे है और शीर्ष क्लोज्ड सोर्स मॉडल जेमिनी-प्रो-3.1 से थोड़ा कम है। गणित, एसटीईएम और प्रतिस्पर्धी कोड के मूल्यांकन में, डीपसीक-वी4-प्रो ने वर्तमान में सार्वजनिक रूप से मूल्यांकन किए गए सभी ओपन सोर्स मॉडल को पीछे छोड़ दिया और दुनिया के शीर्ष क्लोज्ड सोर्स मॉडल के बराबर था।

डीपसीक-वी4-प्रो की तुलना में, डीपसीक-वी4-फ्लैश विश्व ज्ञान भंडार के मामले में थोड़ा कमतर है, लेकिन यह करीबी तर्क क्षमताओं को दर्शाता है। चूँकि मॉडल पैरामीटर और सक्रियण छोटे हैं, V4-फ़्लैश तेज़ और अधिक किफायती API सेवाएँ प्रदान कर सकता है।

डीपसीक-वी4 ने एक नए ध्यान तंत्र की भी शुरुआत की है जो टोकन आयाम में संपीड़ित होता है और इसे विश्व-अग्रणी लंबी संदर्भ क्षमताओं को प्राप्त करने और पारंपरिक तरीकों की तुलना में कंप्यूटिंग और ग्राफिक्स मेमोरी आवश्यकताओं को काफी कम करने के लिए डीएसए विरल ध्यान (डीपसीक विरल ध्यान) के साथ जोड़ता है।

इससे भी अधिक उल्लेखनीय बात यह है कि एसेंड सुपर नोड उत्पादों की पूरी श्रृंखला डीपसीक वी4 श्रृंखला मॉडल का समर्थन करती है। इसका मतलब यह भी है कि डीपसीक अधिक स्थानीयकरण संकेत जारी करता है।

DeepSeek-V4 ने एक तकनीकी रिपोर्ट में उल्लेख किया है, "फाइन-ग्रेन्ड EP (एक्सपर्ट पैरेलल) योजना को दो प्लेटफार्मों, NVIDIA GPU और Huawei Ascend NPU पर सत्यापित किया गया था। शक्तिशाली गैर-फ्यूज्ड बेसलाइन की तुलना में, इस योजना ने सामान्य तर्क कार्यों में 1.50-1.73 गुना त्वरण हासिल किया; विलंबता-संवेदनशील परिदृश्यों (जैसे सुदृढीकरण सीखने (आरएल) रोलआउट और हाई-स्पीड एजेंट सेवाओं) में, यह तक प्राप्त कर सकता है। 1.96 गुना त्वरण।"

डीपसीक ने इस बात पर जोर दिया कि चूंकि एसेंड सुपर नोड उत्पादों की पूरी श्रृंखला वर्ष की दूसरी छमाही में बैचों में लॉन्च की जाएगी, इसलिए प्रो संस्करण की कीमत में काफी कमी आने की उम्मीद है।

डीपसीक-वी4 के जारी होने के बाद, गोल्डमैन सैक्स ने एक विश्लेषण रिपोर्ट जारी की जिसमें बताया गया कि डीपसीक वी4 का मुख्य महत्व कम लागत पर अधिक जटिल एजेंट अनुप्रयोगों के कार्यान्वयन का समर्थन करना है, जिससे एआई अनुप्रयोगों के पैमाने के लिए एक नई जगह खुलती है। एसेंड सुपर नोड्स को शामिल करने के संबंध में, गोल्डमैन सैक्स का मानना ​​है कि डीपसीक की लागत प्रतिस्पर्धात्मकता को और मजबूत किया जाएगा, जिससे अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए स्थितियां तैयार होंगी। इसके अलावा, चिप्स की निरंतर सख्ती की पृष्ठभूमि के खिलाफ, चीन के शीर्ष एआई मॉडल को घरेलू कंप्यूटिंग शक्ति में स्थानांतरित करने की प्रवृत्ति को प्रमुख खिलाड़ियों द्वारा स्पष्ट रूप से समर्थन दिया गया है।

गोल्डमैन सैक्स की रिपोर्ट में उन समाचार रिपोर्टों का भी हवाला दिया गया है कि Tencent और अलीबाबा 20 बिलियन अमेरिकी डॉलर से अधिक के मूल्यांकन पर डीपसीक में निवेश करने के लिए बातचीत कर रहे हैं। झिपु और मिनीमैक्स का नवीनतम बाजार मूल्य क्रमशः लगभग US$53 बिलियन और US$31 बिलियन है। यह संभावित लेनदेन दुर्लभ शीर्ष-स्तरीय एआई क्षमताओं के लिए दिग्गजों की प्रतिस्पर्धा के तर्क को दर्शाता है।

Huatai Securities का मानना ​​है कि बाजार आसानी से V4 की व्याख्या "लागत में कमी और कम कंप्यूटिंग शक्ति और भंडारण आवश्यकताओं" के रूप में करता है, लेकिन अधिक महत्वपूर्ण सीमांत परिवर्तन यह है कि लंबे संदर्भ की लागत कम होने के बाद, जटिल एजेंटों, बहु-दस्तावेज़ विश्लेषण, दीर्घकालिक कार्यों की उपलब्धता, ऑनलाइन शिक्षण और अन्य परिदृश्य बढ़ जाएंगे, और अनुमान कॉल और भंडारण पहुंच आवृत्ति की संख्या में विस्तार होने की उम्मीद है।