बहुप्रतीक्षित, डीपसीक V4 अंततः रिलीज़ हो गया है! अभी-अभी, डीपसीक V4 का लंबे समय से प्रतीक्षित पूर्वावलोकन संस्करण आधिकारिक तौर पर लॉन्च हुआ है। दो संस्करण -वी4-प्रो और वी4-फ्लैश, सभी श्रृंखलाएं 1एम (मिलियन शब्द) अल्ट्रा-लॉन्ग कॉन्टेक्स्ट, सिंक्रोनाइज्ड ओपन सोर्स मॉडल वेट और तकनीकी रिपोर्ट के साथ मानक आती हैं।.

मई दिवस से पहले दो दिनों में, बड़े मॉडलों ने रिलीज़ की एक नई लहर में प्रवेश किया है।

23 अप्रैल को दोपहर में, "जीनियस बॉय" याओ शुन्यू ने Tencent में शामिल होने के बाद अपनी पहली मॉडल उत्तर पुस्तिका सौंपी। Tencent हुनयुआन Hy3 पूर्वावलोकन संस्करण का अनावरण किया गया, 295 बिलियन पैरामीटर MoE आर्किटेक्चर के साथ, पैरामीटर 21B को सक्रिय किया गया, अनुमान दक्षता में 40% की वृद्धि हुई, और इनपुट मूल्य 1.2 युआन/मिलियन टोकन तक कम हो गया।

आज सुबह, OpenAI ने भुगतान करने वाले उपयोगकर्ताओं के लिए GPT-5.5 लॉन्च किया और आधिकारिक तौर पर API योजना की घोषणा की, जो एजेंट वर्कफ़्लो और मल्टी-स्टेप कार्य पूर्णता पर केंद्रित है। संदर्भ विंडो को 1 मिलियन टोकन तक बढ़ा दिया गया है, और एपीआई मूल्य निर्धारण भी बढ़ गया है - इनपुट $5, आउटपुट $30/मिलियन टोकन।

सतह पर, तीनों कंपनियों के रास्ते अलग-अलग हैं: ओपनएआई हाई-एंड क्लोज्ड-सोर्स मार्ग अपनाता है और मूल्य सीमा बढ़ाना जारी रखता है; Tencent मॉडल को अपने स्वयं के पारिस्थितिकी तंत्र में सम्मिलित करता है और बड़े पैमाने पर व्यावसायीकरण का लाभ उठाने के लिए लागत-प्रभावशीलता का उपयोग करता है; डीपसीक ओपन सोर्स परंपरा को जारी रखता है और साथ ही संदर्भ की लंबाई को एक नए समावेशी महत्वपूर्ण बिंदु तक ले जाता है।

वहीं, ये तीन कीवर्ड हैं एजेंट क्षमता, अल्ट्रा-लॉन्ग कॉन्टेक्स्ट, कोड और टूल इनवोकेशन।,यह तीनों कंपनियों द्वारा जारी नए मॉडलों में बार-बार दिखाई देता है। वे सभी एक ही दिशा पर ध्यान केंद्रित करते हैं: मॉडल को लंबी जानकारी संसाधित करने में सक्षम बनाना, अधिक जटिल कार्य श्रृंखलाओं में स्वायत्त रूप से संचालित करना, और वास्तव में वर्कफ़्लो में एम्बेडेड होना।काम".

01

डीपसीक V4 की "व्यावहारिकता"।

डीपसीक की इस रिलीज़ ने लाखों शब्दों के संदर्भ को "उच्च-स्तरीय वैकल्पिक" से "बुनियादी मानक" में बदल दिया है।

इससे पहले, फ्लैगशिप क्लोज्ड-सोर्स मॉडल के उच्च-अंत संस्करणों में 1M स्तर की संदर्भ लंबाई अधिक सामान्य थी, और उन्हें कॉल करने की उच्च लागत अधिकांश डेवलपर्स और छोटे और मध्यम आकार के उद्यमों को प्रतिबंधित करने के लिए पर्याप्त थी।

डीपसीक का दृष्टिकोण बहुत स्पष्ट है: V4-प्रो और V4-फ्लैश दोनों संस्करण मानक के रूप में 1M संदर्भ लंबाई से सुसज्जित हैं। पूर्व एंकर अंतिम प्रदर्शन प्रदान करता है, जबकि बाद वाला एक समावेशी आर्थिक विकल्प प्रदान करता है, जो विभिन्न आवश्यकताओं वाले उपयोगकर्ताओं को पूरी तरह से कवर करता है। "मुख्य क्षमताओं के अंधाधुंध विकेंद्रीकरण" की यह रणनीति अनिवार्य रूप से लंबी पाठ प्रसंस्करण क्षमताओं के लिए उद्योग अधिग्रहण सीमा को पूरी तरह से कम कर देती है।


छवि स्रोत: डीपसीक आधिकारिक वेबसाइट

फ़्लैश संस्करण बेहद कम विलंबता और उच्च लागत प्रदर्शन पर केंद्रित है, और हल्के उच्च-आवृत्ति परिदृश्यों के लिए डीपसीक का मुख्य समाधान है।. 13बी सक्रियण मापदंडों, एक नए टोकन संपीड़न ध्यान तंत्र और डीएसए विरल ध्यान वास्तुकला अनुकूलन के साथ, यह प्रो संस्करण की मुख्य तर्क क्षमताओं के करीब सुनिश्चित करते हुए बेहद तेज प्रतिक्रिया गति प्राप्त करता है। वास्तविक समय संवाद इंटरैक्शन, फ़ंक्शन कॉल पाइपलाइन और यहां तक ​​कि प्रतिक्रिया गति के प्रति संवेदनशील सभी हल्के परिदृश्यों के लिए, यह सुविधा अनुभव में पर्याप्त सुधार ला सकती है।

इससे भी महत्वपूर्ण बात, एक प्रतिस्पर्धी लागत संरचना.

डीपसीक के आधिकारिक एपीआई मूल्य निर्धारण दस्तावेज़ के अनुसार, फ्लैश संस्करण एक स्तरीय बिलिंग नियम को अपनाता है: कैश हिट के लिए इनपुट टोकन 0.2 युआन/मिलियन टोकन जितना कम है, कैश मिस के लिए इनपुट टोकन 1 युआन/मिलियन टोकन है, और आउटपुट टोकन की कीमत 2 युआन/मिलियन टोकन है।


डीपसीक V4 का प्रत्येक संस्करण|छवि स्रोत बन जाता है: डीपसीक एपीआई दस्तावेज़ीकरण

इस तरह की उपयोगकर्ता-अनुकूल कीमत, 1M प्रासंगिक क्षमता के साथ मिलकर जो पूरी श्रृंखला में मानक आती है, "प्रति कॉल लागत" को अब इंजीनियरिंग डिजाइन में मुख्य बाधा नहीं बनाती है - डेवलपर्स कॉल की संख्या और लागत के बीच बार-बार समझौता किए बिना उत्पाद अनुभव और वास्तुकला डिजाइन को प्राथमिकता दे सकते हैं।

फ्लैश "किफायती और तेज" की सार्वभौमिक मांग को हल करता है, जबकि वी4-प्रो एक अन्य मुख्य प्रश्न का उत्तर देता है: ओपन सोर्स बड़े मॉडल की क्षमताओं को कितनी दूर तक बढ़ाया जा सकता है।

क्षमताओं में सबसे सहज छलांग अभी भी लंबे संदर्भ के इर्द-गिर्द घूमती है। डीपसीक सीधे मॉडल संदर्भ लंबाई को पिछली पीढ़ी के V3.2 में 128K से बढ़ाकर 1M (एक मिलियन टोकन) कर देता है। अंतर्निहित वास्तुकला के नवाचार के संयोजन में, यह लंबे संदर्भ गणना और वीडियो मेमोरी आवश्यकताओं को काफी कम कर देता है जबकि यह सुनिश्चित करता है कि पूर्ण संदर्भ विंडो का प्रदर्शन बरकरार है।

इस पैमाने पर, डेवलपर्स अतिरिक्त जटिल पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) सिस्टम बनाने की आवश्यकता के बिना, संपूर्ण कोड लाइब्रेरी, अल्ट्रा-लॉन्ग इंडस्ट्री दस्तावेज़, मल्टी-राउंड प्रोजेक्ट फ़ाइलें और यहां तक ​​कि एंड-टू-एंड प्रोसेसिंग के लिए लाखों शब्दों वाली संपूर्ण किताबें भी सीधे आयात कर सकते हैं, जो लंबी टेक्स्ट प्रोसेसिंग के तकनीकी लिंक को बहुत सरल बनाता है।

अंतर्निहित आर्किटेक्चर के संदर्भ में, प्रो संस्करण 1.6T के कुल पैरामीटर, 49B के सक्रियण पैरामीटर और 33T के पूर्व-प्रशिक्षण डेटा वॉल्यूम के साथ MoE आर्किटेक्चर का उपयोग करता है, जो डीपसीक हाइब्रिड विशेषज्ञ मार्ग का एक व्यापक गहनीकरण है। आधिकारिक मूल्यांकन डेटा से पता चलता है कि गणित, एसटीईएम और प्रतिस्पर्धा-स्तरीय कोड जैसे मुख्य तर्क मूल्यांकन में, यह वर्तमान में सार्वजनिक रूप से मूल्यांकन किए गए सभी ओपन सोर्स मॉडल को पार कर गया है और दुनिया के शीर्ष बंद स्रोत मॉडल के तुलनीय स्तर पर पहुंच गया है।

एजेंट क्षमताओं के संदर्भ में, इसकी डिलीवरी गुणवत्ता क्लाउड ओपस 4.6 नॉन-थिंकिंग मोड के करीब है, आंतरिक उपयोग फीडबैक एंथ्रोपिक सॉनेट 4.5 से बेहतर है, और यह डीपसीक के आंतरिक कर्मचारियों के लिए मुख्य एजेंट कोडिंग टूल बन गया है।

कार्यात्मक स्तर पर, V4 श्रृंखला के दोनों संस्करण गैर-सोच मोड और सोच मोड दोनों का समर्थन करते हैं। डेवलपर्स Reasoning_effort पैरामीटर के माध्यम से सोच की तीव्रता को अनुकूलित कर सकते हैं। साथ ही, वे Json आउटपुट, टूल कॉल और वार्तालाप उपसर्ग निरंतरता क्षमताओं का पूर्ण समर्थन करते हैं।

मूल्य निर्धारण के संदर्भ में,प्रो संस्करण भी लागत प्रभावी मार्ग जारी रखता है, आधिकारिक मूल्य निर्धारण है: कैश हिट के लिए इनपुट टोकन 1 युआन/मिलियन टोकन है, कैश मिस के लिए इनपुट टोकन 12 युआन/मिलियन टोकन है, आउटपुट टोकन की कीमत 24 युआन/मिलियन टोकन है, जो समान स्तर के विदेशी फ्लैगशिप क्लोज्ड-सोर्स मॉडल से काफी कम है।

एपीआई एक्सेस ने भी बेहद कम सीमा हासिल कर ली है। डेवलपर्स को मूल आधार_यूआरएल को संशोधित करने की आवश्यकता नहीं है। पहुंच को पूरा करने के लिए उन्हें केवल मॉडल पैरामीटर को संबंधित संस्करण नाम से बदलने की आवश्यकता है। यह OpenAI ChatCompletions और एंथ्रोपिक इंटरफ़ेस प्रारूपों के साथ भी संगत है।

"बढ़ी हुई क्षमताएं + कम लागत" का यह संयोजन शीर्ष स्तर की बड़ी मॉडल क्षमताओं को अब कुछ निर्माताओं का विशेष संसाधन नहीं बनाता है। जैसे-जैसे उद्योग धीरे-धीरे पैरामीटर हथियारों की दौड़ के दुष्चक्र में फंसता जा रहा है, डीपसीक लाखों संदर्भों के मानक विन्यास और पूर्ण-लिंक ओपन सोर्स विकल्पों के साथ बड़े मॉडलों के सार्वभौमिकरण के लिए एक नया मॉडल प्रदान करता है।

साथ ही, डीपसीक वी4 ने मुख्यधारा के एजेंट उत्पादों जैसे क्लाउड कोड, ओपनक्लाव, ओपनकोड और कोडबडी के लिए विशेष अनुकूलन और अनुकूलन किया है, और कोडिंग कार्यों और दस्तावेज़ निर्माण जैसे वास्तविक परिदृश्यों में इसके प्रदर्शन में सुधार किया गया है। मॉडल के मूल्य का अंततः वास्तविक विकास और कार्य प्रक्रियाओं में परीक्षण किया जाना चाहिए।

02

ओपन सोर्स बने रहें और एपीआई को पूरी तरह से ओपन बनाएं

डीपसीक ओपन सोर्स रूट जारी रखता है और सभी एपीआई कॉल को सीधे खोलता है।

वर्तमान में, डीपसीक-वी4 के मॉडल वेट को एक साथ हगिंग फेस और मॉडलस्कोप प्लेटफॉर्म पर डाउनलोड के लिए खोल दिया गया है, और सहायक तकनीकी रिपोर्ट भी सार्वजनिक कर दी गई है, जो स्थानीय तैनाती और माध्यमिक विकास के लिए डेवलपर्स का समर्थन करती है।

कुछ निर्माताओं द्वारा "ओपन सोर्स कैस्ट्रेटेड वर्जन, क्लोज्ड सोर्स फुल वर्जन" के उद्योग अभ्यास से अलग, दो ओपन सोर्स संस्करण पूरी तरह से आधिकारिक क्लाउड एपीआई के अनुरूप सभी क्षमताओं को बरकरार रखते हैं - जिसमें गैर-सोच/सोच दोहरे मोड, 1 एम अल्ट्रा-लॉन्ग संदर्भ दोषरहित प्रसंस्करण, एजेंट विशेष अनुकूलन और पूर्ण टूल कॉलिंग क्षमताएं शामिल हैं, बिना किसी कार्यात्मक कैस्ट्रेशन के।

इसका मतलब यह है कि चाहे वे छोटे और मध्यम आकार के स्टार्टअप, व्यक्तिगत डेवलपर्स, या वैज्ञानिक अनुसंधान संस्थान हों, वे शून्य सीमा पर लाखों संदर्भों, शीर्ष-स्तरीय तर्क और एजेंट क्षमताओं के साथ एक बड़ा मॉडल आधार प्राप्त कर सकते हैं, और अब उच्च-अंत मॉडल क्षमताओं के लिए उच्च बंद-स्रोत इंटरफ़ेस शुल्क का भुगतान करने की आवश्यकता नहीं है।

कार्यान्वयन सीमा को और कम करने के लिए, डीपसीक ने एक साथ मॉडल फाइन-ट्यूनिंग, मात्रा निर्धारण और अनुमान त्वरण के लिए पूर्ण-प्रक्रिया टूल श्रृंखला को ओपन सोर्स किया, वीएलएलएम और टीजीआई जैसे मुख्यधारा अनुमान ढांचे और लैंगचेन और लामाइंडेक्स जैसे मुख्यधारा एजेंट ढांचे के 0 दिन के मूल अनुकूलन को पूरा किया। इसने घरेलू कंप्यूटिंग पावर प्लेटफार्मों के लिए एक पूर्ण-स्टैक परिनियोजन समाधान भी खोला, जिससे डेवलपर्स को विभिन्न हार्डवेयर वातावरणों में अनुप्रयोगों को जल्दी से लागू करने की अनुमति मिली।

साथ ही, डीपसीक ने एक स्पष्ट मॉडल पुनरावृत्ति संक्रमण योजना भी दी है: पुराने एपीआई इंटरफ़ेस मॉडल नाम डीपसीक-चैट और डीपसीक-रीज़नर का उपयोग तीन महीने (24 जुलाई, 2026) में बंद हो जाएगा। वर्तमान चरण में, ये दो मॉडल नाम क्रमशः डीपसीक-वी4-फ्लैश के गैर-सोच मोड और सोच मोड की ओर इशारा करते हैं, जिससे डेवलपर्स के लिए सुचारू रूप से माइग्रेट करने के लिए पर्याप्त समय बचता है।

03

एआई "बुनियादी ढांचा मॉडल" बनाने के लिए दृढ़ संकल्प

इन दो दिनों की रिलीज़ों को एक साथ देखने पर, एक प्रवृत्ति स्पष्ट होती है: प्रत्येक कंपनी एजेंट क्षमताओं में तेजी ला रही है।

पिछले दो वर्षों में, बड़े मॉडलों पर सार्वजनिक और पूंजी बाजार का ध्यान काफी हद तक "स्मार्टनेस" पर केंद्रित रहा है, लेकिन अब यह "कौन चीजों को अधिक स्थिरता से पूरा कर सकता है" पर केंद्रित हो गया है। GPT-5.5 की रिलीज़ का फोकस इस पर नहीं है कि मल्टी-मॉडल समझ में कितना सुधार हुआ है, बल्कि एजेंट प्रोग्रामिंग, कंप्यूटर उपयोग और ज्ञान कार्य जैसे परिदृश्यों में इसकी निरंतर निष्पादन क्षमताएं हैं। Tencent हुनयुआन Hy3 का मुख्य विक्रय बिंदु वास्तविक दुनिया में इसकी "कार्य करने की क्षमता" भी है। डीपसीक V4 वास्तविक कार्यभार के स्पष्ट लक्ष्य के साथ सीधे एजेंट क्षमताओं और लंबी संदर्भ प्रसंस्करण पर ध्यान केंद्रित करता है।

इस बदलाव के पीछे यह तथ्य है कि पूरा उद्योग "मॉडल यूटिलिटी" में प्रतिस्पर्धा की ओर बढ़ रहा है। आजकल, उपयोगकर्ता और एंटरप्राइज़ ग्राहक इस बारे में कम चिंतित हैं कि आपका मॉडल एक निश्चित मूल्यांकन में कहां रैंक करता है। उन्हें इस बात की परवाह है कि मॉडल और उत्पाद उन्हें कितना काम करने में मदद कर सकते हैं: क्या यह मॉडल मुझे कोड लिखने में मदद कर सकता है, क्या यह जटिल दस्तावेज़ों को संभाल सकता है, क्या यह त्रुटियों के बिना बहु-चरणीय कार्य कर सकता है, और क्या यह उचित लागत पर चल सकता है।


छवि स्रोत: डीपसीक आधिकारिक वेबसाइट

आज प्रकाशित लेख के अंत में, डीपसीक ने "ज़ुन्ज़ी" से एक वाक्य उद्धृत किया: "प्रशंसा से प्रलोभित न हों, बदनामी से न डरें, सीधी लाइन में काम करें और अपने प्रति ईमानदार रहें", अपने स्वयं के तकनीकी मार्ग को जारी रखना। बड़े मॉडल प्रतियोगिता के वर्तमान संदर्भ में, इस वाक्य का अर्थ बहुत स्पष्ट है - बाहरी मूल्यांकन और शोर से परेशान न हों, और चीजों को सही करने पर ध्यान केंद्रित करें।

पिछले एक साल में डीपसीक की कार्रवाइयों ने वास्तव में इस तर्क को लागू किया है: वैश्विक डेवलपर पारिस्थितिक प्रभाव स्थापित करने के लिए खुले स्रोत और खुलेपन का उपयोग करना, उच्च अंत एआई क्षमताओं के उपयोग में बाधाओं को तोड़ने के लिए अंतिम लागत-प्रभावशीलता का उपयोग करना, और डेवलपर्स और एंटरप्राइज़ उपयोगकर्ताओं के सबसे वास्तविक दर्द बिंदुओं को हल करने के लिए ठोस अंतर्निहित वास्तुकला नवाचार का उपयोग करना।

R1 अनुमान मॉडल के उद्भव से लेकर V4 तक लंबी संदर्भ क्षमताओं को पहली बार सार्वभौमिक सीमा तक धकेलने तक, डीपसीक अपेक्षाकृत "धीमे" तरीके से अधिक कठिन काम कर रहा है -शीर्ष मॉडल क्षमताओं को कुछ लोगों के लिए एक उपकरण से एक ऐसे बुनियादी ढांचे में बदलें जिसे अधिक लोग सीधे कॉल कर सकें.