डीपसीक वी4 लाखों संदर्भों की कीमत को 2 सेंट तक कम कर देता है। घरेलू कार्ड एपीआई कीमत को "आधा" कर देंगे?

डीपसीक-वी4 पूर्वावलोकन संस्करण अंततः जारी कर दिया गया है। आज, डीपसीक ने आधिकारिक तौर पर घोषणा की कि दो मॉडल, डीपसीक-वी4-प्रो और डीपसीक-वी4-फ्लैश, मिलियन-शब्द अल्ट्रा-लॉन्ग संदर्भ के साथ जारी किए गए हैं और ओपन सोर्स हैं। अब से, आप नवीनतम डीपसीक-वी4 से बात करने और 1एम (मिलियन) अल्ट्रा-लॉन्ग कॉन्टेक्स्ट मेमोरी के नए अनुभव का पता लगाने के लिए आधिकारिक वेबसाइट या आधिकारिक ऐप पर लॉग इन कर सकते हैं। एपीआई सेवा को एक साथ अद्यतन किया गया है।

पाठ | "बग" कॉलम झोउ वेनमेंग

आधिकारिक बेंचमार्क मूल्यांकन के अनुसार, डीपसीक वी4 का प्रदर्शन संदर्भ लंबाई, ज्ञान, तर्क और एजेंट क्षमताओं के मामले में शीर्ष अंतरराष्ट्रीय क्लोज्ड-सोर्स मॉडल के बराबर है, और अंतरराष्ट्रीय ओपन सोर्स मॉडल के प्रथम श्रेणी स्तर तक पहुंच गया है। "बग" कॉलम में एक तुलना में पाया गया कि एपीआई कॉल कीमतों के संदर्भ में, डीपसीक का वी4 संस्करण, जिसने पिछले साल घरेलू बड़े मॉडल उद्योग में कीमतों में कटौती की थी, ने एक बार फिर उद्योग में "सबसे कम कीमत" निर्धारित की।

"हालांकि घरेलू मॉडलों की प्रति मिलियन टोकन कॉल कीमत में ज्यादा गिरावट नहीं आई है, लंबी संदर्भ लंबाई और अच्छा प्रदर्शन इसे बहुत प्रतिस्पर्धात्मक लाभ देता है!" उद्योग में कुछ लोगों ने "बग" कॉलम के साथ संवाद करते समय अफसोस जताया: "वह बड़ा मॉडल मूल्य कसाई वापस आ गया है!"

प्रदर्शन शीर्ष बंद-स्रोत मॉडल के बराबर है, और ज्ञान और तर्क क्षमताएं अग्रणी हैं

डीपसीक के आधिकारिक परिचय के अनुसार, वी4 श्रृंखला में मॉडल के दो संस्करण शामिल हैं: डीपसीक-वी4-प्रो 1.6टी कुल पैरामीटर, 49बी सक्रियण पैरामीटर और 33टी प्री-ट्रेनिंग डेटा के साथ; 284बी कुल पैरामीटर, 13बी सक्रियण पैरामीटर और 32टी पूर्व-प्रशिक्षण डेटा के साथ डीपसीक-वी4-फ्लैश; दोनों मूल रूप से 1 मिलियन टोकन संदर्भों का समर्थन करते हैं।

डीपसीक द्वारा बताए गए बेंचमार्क परीक्षण डेटा के अनुसार, ज्ञान और तर्क परीक्षणों में, डीपसीक-वी4-प्रो-मैक्स ने एपेक्स शॉर्टलिस्ट और कोडफोर्स परीक्षणों में सर्वश्रेष्ठ प्रदर्शन हासिल किया, और मजबूत तर्क और एल्गोरिदम क्षमताओं को दिखाते हुए क्लाउड-ओपस-4.6-मैक्स, जीपीटी-5.4-एक्सहाई, जेमिन-3.1-प्रो-हाईट आदि जैसे अंतरराष्ट्रीय मॉडल को पीछे छोड़ दिया; SimpleQA में सत्यापित परीक्षण में, यह जेमिनी-3.1-प्रो-हाई से थोड़ा पीछे है लेकिन क्लाउड और जीपीटी से आगे है।

एजेंटिक क्षमता मूल्यांकन में, तीन मॉडल वी4, ओपस-4.6, और जेमिन-3.1-प्रो को एसडब्ल्यूई सत्यापित कार्य पर बांधा गया था, और डीपसीक ने टूलथलॉन कार्य पर जीपीटी-5.4-एक्सहाई के बाद दूसरा स्तर हासिल किया, और टर्मिनल बेंच 2.0 पर ओपस-4.6 से बेहतर स्तर हासिल किया, जो जटिल कमांड निष्पादन और टूल आमंत्रण परिदृश्यों में इसके फायदे को दर्शाता है।

वर्तमान में, डीपसीक-वी4 कंपनी के आंतरिक कर्मचारियों द्वारा उपयोग किया जाने वाला एजेंट कोडिंग मॉडल बन गया है। मूल्यांकन प्रतिक्रिया के अनुसार, उपयोग का अनुभव सॉनेट 4.5 से बेहतर है, और डिलीवरी की गुणवत्ता ओपस 4.6 नॉन-थिंकिंग मोड के करीब है।

गणित, एसटीईएम और प्रतिस्पर्धी कोड के मूल्यांकन में, डीपसीक-वी4-प्रो ने सार्वजनिक रूप से मूल्यांकन किए गए अधिकांश ओपन सोर्स मॉडल को पीछे छोड़ दिया और दुनिया के शीर्ष क्लोज्ड सोर्स मॉडल के बराबर परिणाम प्राप्त किए।

कुल मिलाकर, ज्ञान प्रसंस्करण और तर्क क्षमताओं के मामले में, डीपसीक-वी4 ने घरेलू ओपन सोर्स मॉडल पर चौतरफा बढ़त हासिल की है और यह अंतरराष्ट्रीय मूल्यांकन क्षमताओं के बराबर है। हालाँकि, एजेंटिक क्षमताओं के संदर्भ में, हालांकि नवीनतम डीपसीक-वी4 ने अच्छे सुधार किए हैं, घरेलू और अंतर्राष्ट्रीय प्रथम-स्तरीय क्षमताओं के बीच अंतर नहीं बढ़ा है, और प्रत्येक आगे है।

"मानक विन्यास: 1 मिलियन संदर्भ,कीमत कसाई "वापस" है

विभिन्न बेंचमार्क परीक्षणों में परिलक्षित प्रदर्शन लाभों की तुलना में, इस V4 रिलीज़ की सबसे बड़ी विशेषता लंबी टेक्स्ट क्षमताओं में सफलता और एपीआई कॉल की कीमतों में और कमी है।

DeepSeek-V4 द्वारा शुरू किए गए नए ध्यान तंत्र के लिए धन्यवाद, V4 टोकन आयाम को संपीड़ित करके और इसे DSA विरल ध्यान (DeepSeek Sparse Attention) के साथ जोड़कर विश्व-अग्रणी लंबी संदर्भ क्षमताओं को प्राप्त करता है, और पारंपरिक तरीकों की तुलना में कंप्यूटिंग और ग्राफिक्स मेमोरी की आवश्यकताओं को काफी कम कर देता है, जिससे 1M (एक मिलियन) संदर्भ सभी आधिकारिक DeepSeek सेवाओं के लिए मानक बन जाता है।

एक साल पहले, 1 मिलियन कॉन्टेक्स्ट जेमिनी का विशेष तुरुप का इक्का था। यहां तक कि हाल ही में जारी किए गए अधिकांश मुख्यधारा के घरेलू ओपन सोर्स मॉडल में, मॉडल संदर्भ की लंबाई ज्यादातर 128K-200K रेंज में थी। हालाँकि, डीपसीक ने लाखों संदर्भों को "हाई-एंड क्लोज्ड सोर्स फ़ंक्शन" से सीधे ओपन सोर्स मानक में बदल दिया।

एपीआई मूल्य कॉल के संदर्भ में, मौजूदा GLM-5.1 इनपुट यूनिट कीमत 1.3 युआन-2 युआन/मिलियन टोकन (कैश हिट), और किमी-K2.6 1.1 युआन/मिलियन टोकन (कैश हिट) की तुलना में, डीपसीक-वी4-प्रो और फ्लैश संस्करणों की इनपुट यूनिट कीमतें क्रमशः 1 युआन/मिलियन टोकन और 0.2 युआन/मिलियन टोकन हैं। हालाँकि कीमत में गिरावट बड़ी नहीं है, यह सबसे कम है, और संदर्भ की लंबाई कई बार विस्तारित की गई है।

(डीपसीक-वी4 सीरीज मॉडल की एपीआई कॉल कीमत)

(किमी-के2.6 मॉडल एपीआई कॉल कीमत)

(जीएलएम-5.1 मॉडल एपीआई कॉल कीमत)

"डीपसीक-वी4 की रिलीज से मिली प्रदर्शन सफलता डीपसीक-आर1 की रिलीज की तुलना में कम प्रभावशाली है। प्रदर्शन अभी भी पहले स्तर पर है, लेकिन बढ़त पूरी तरह से विस्तारित नहीं हुई है।" उद्योग के अंदरूनी सूत्रों की राय में, "V4 मॉडल की रिलीज़ लंबी टेक्स्ट क्षमताओं में सुधार और कीमत में और कमी के बारे में है।"

इस व्यक्ति ने अफसोस जताया: "डीपसीक-वी3 और आर1 मॉडल के जारी होने के बाद, अंतर्निहित तकनीकी नवाचार द्वारा लाए गए प्रदर्शन लाभ ने सीधे तौर पर पूरे घरेलू बड़े मॉडल उद्योग की सामूहिक कीमत में कमी को बढ़ावा दिया है। हालांकि वी4 संस्करण के प्रति मिलियन टोकन की कॉल कीमत घरेलू समकक्षों की तुलना में बहुत कम नहीं हुई है, यह अभी भी प्रतिस्पर्धी है। बड़े मॉडल की कीमत कसाई वापस आ गई है!"

"हुआवेई की कंप्यूटिंग शक्ति को वर्ष की दूसरी छमाही में बैचों में जोड़ा जाएगा, और प्रो की कीमत काफी कम हो जाएगी।"

यह ध्यान देने योग्य है कि डीपसीक-वी4 द्वारा जारी एपीआई कीमत की जानकारी के नीचे, आधिकारिक नोटिस में कहा गया है: "हाई-एंड कंप्यूटिंग पावर द्वारा सीमित, प्रो की सेवा थ्रूपुट वर्तमान में बहुत सीमित है। उम्मीद है कि वर्ष की दूसरी छमाही में बैचों में एसेंड 950 सुपर नोड लॉन्च होने के बाद प्रो की कीमत में काफी कमी आएगी।"

इसका मतलब है कि इस बार जारी किए गए v4 श्रृंखला मॉडल को Huawei Ascend 950 सुपर नोड के लिए अनुकूलित किया गया है। जब तक एसेंड 950 लॉन्च किया जाता है, उपयोगकर्ता घरेलू कंप्यूटिंग शक्ति के आधार पर डीपसीक-वी4 का उपयोग करने में सक्षम होंगे जो शीर्ष अंतरराष्ट्रीय क्लोज्ड-सोर्स मॉडल के बराबर है।

आधिकारिक ओपन सोर्स तकनीकी दस्तावेज में, डीपसीक ने भी इसका उल्लेख करते हुए कहा कि v4 ने NVIDIA GPU और HUAWEI Ascend NPUs प्लेटफार्मों पर बढ़िया ईपी (विशेषज्ञ समानांतरवाद) समाधान को सत्यापित किया है। शक्तिशाली गैर-फ्यूजन बेसलाइन की तुलना में, यह सामान्य तर्क कार्यों पर 1.50-1.73 गुना त्वरण प्राप्त कर सकता है, और विलंब-संवेदनशील परिदृश्यों (जैसे आरएल कटौती और उच्च गति प्रॉक्सी सेवाओं) में 1.96 गुना त्वरण प्राप्त कर सकता है।

V4 की रिलीज़ के बाद, Huawei Ascend ने यह भी घोषणा की कि "सुपर नोड उत्पादों की पूरी श्रृंखला DeepSeek V4 श्रृंखला मॉडल का समर्थन करती है।" यह बताया गया है कि एसेंड 950 कर्नेल और मल्टी-स्ट्रीम समानांतर तकनीक को एकीकृत करके ध्यान गणना और मेमोरी एक्सेस ओवरहेड को कम करता है, अनुमान प्रदर्शन में काफी सुधार करता है, और उच्च थ्रूपुट और कम विलंबता डीपसीक वी4 मॉडल अनुमान परिनियोजन प्राप्त करने के लिए कई क्वांटिज़ेशन एल्गोरिदम का संयोजन करता है।

इस महीने की शुरुआत में, एनवीडिया के संस्थापक हुआंग जेनक्सुन ने द्वारकेश पटेल के साथ एक विशेष साक्षात्कार में कहा: "अगर डीपसीक को पहले हुआवेई प्लेटफॉर्म पर जारी किया जाता है, तो यह हमारे देश (संयुक्त राज्य अमेरिका) के लिए विनाशकारी होगा।" हुआंग के विचार में, हालांकि डीपसीक एक ओपन सोर्स मॉडल है और इसका उपयोग एनवीडिया उत्पादों पर भी किया जा सकता है, अगर डीपसीक को विशेष रूप से हुआवेई की कंप्यूटिंग शक्ति के लिए अनुकूलित किया जाता है, तो हाई-एंड कंप्यूटिंग पावर की खरीद पर प्रतिबंध जैसी सीमाओं के कारण एनवीडिया को नुकसान होगा।

अब ऐसा लगता है कि हालांकि डीपसीक ने एनवीडिया की कंप्यूटिंग शक्ति के लिए ईपी समाधान को भी सत्यापित कर लिया है, लेकिन हुआंग रेनक्सुन को जिस बात की चिंता थी वह अभी भी हुई है। उद्योग के अंदरूनी सूत्रों की राय में, "V4 कंप्यूटिंग पावर गेम द्वारा मजबूर एक उत्पाद है। अगले वर्ष में, घरेलू कार्ड पर चलने वाले घरेलू बड़े मॉडल धीरे-धीरे परिपक्व हो जाएंगे।"

मल्टीमॉडल क्षमताएं अभी उभरनी बाकी हैं

दुर्भाग्य से, हालांकि डीपसीक वी4 जारी कर दिया गया है, यह संस्करण अभी भी विंसेंट पिक्चर्स और विंसेंट वीडियो जैसी कई मल्टी-मोडल क्षमताओं के बिना एक शुद्ध टेक्स्ट मॉडल है। यह सामान्य उपयोगकर्ताओं को किसी मॉडल का त्वरित अनुभव और मूल्यांकन करने की अनुमति देता है, जिससे बहुत कठिनाई होती है।

आखिरकार, जैसे-जैसे बड़े भाषा मॉडल की क्षमताओं में सुधार जारी रहता है और मतिभ्रम की दर धीरे-धीरे कम होती जाती है, पारंपरिक और एकल ज्ञान प्रश्न और उत्तर के लिए किसी मॉडल की व्यापक क्षमताओं को निष्पक्ष रूप से प्रतिबिंबित करना मुश्किल होता है। अधिकांश उपयोगकर्ताओं के लिए, यदि वे सहज रूप से V4 मॉडल की क्षमताओं का अनुभव करना चाहते हैं, तो उन्हें इसे डाउनलोड करना होगा और कुछ समय के लिए व्यक्तिगत रूप से इसका उपयोग करना होगा।

V4 श्रृंखला के मॉडलों की रिलीज़ के साथ ही, डीपसीक ने भी हाल ही में खुलासा किया है कि वह 50 बिलियन युआन जुटाने की योजना बना रहा है। डीपसीक के करीबी लोगों ने खुलासा किया कि डीपसीक का प्री-फाइनेंसिंग मूल्यांकन 300 बिलियन युआन, लगभग 44 बिलियन अमेरिकी डॉलर है। फिलहाल टेनसेंट होल्डिंग्स और अलीबाबा ग्रुप डीपसीक में निवेश के लिए बातचीत कर रहे हैं। हालाँकि, डीपसीक ने वित्तपोषण संबंधी मामलों के संबंध में मीडिया पूछताछ का सीधे तौर पर जवाब नहीं दिया है।

शायद, डीपसीक के संस्थापक लियांग वेनफेंग के लिए, जब वैश्विक बड़े मॉडलों की "बुद्धिमत्ता" की वृद्धि धीमी हो रही है, उद्योग की प्रतिभाओं के लिए प्रतिस्पर्धा तेज हो रही है, और उद्योग के मल्टी-मोडल और एजेंटिक रुझान तेजी से उजागर हो रहे हैं, तो अपनी ताकत को मजबूत करने के लिए समय पर वित्तपोषण जुटाने के लिए वी4 की रिलीज का उपयोग करना एक बुद्धिमान कदम है।