18 जून को, जब आप डीपसीक वेब पेज और ऐप खोलेंगे, तो लगभग सभी उपयोगकर्ता पाएंगे कि पिछले त्वरित मोड और विशेषज्ञ मोड के दाईं ओर एक छवि पहचान मोड है। इसका मतलब यह है कि कई उपयोगकर्ता जिनका ग्रेस्केल द्वारा परीक्षण नहीं किया गया है, वे अंततः छवियों को संसाधित करने के लिए डीपसीक का उपयोग कर सकते हैं।

वर्तमान में, डीपसीक ने आधिकारिक तौर पर एक सार्वजनिक परिचय जारी नहीं किया है, और मॉडल इंटरफ़ेस अभी भी "आंतरिक परीक्षण के तहत छवि समझ फ़ंक्शन" प्रदर्शित करता है। कयास लगाए जा रहे हैं कि इस बार यह फुल टेस्ट पुश है। हालाँकि, डीपसीक मल्टी-मोडल टीम के प्रमुख चेन ज़ियाओकांग ने आज सोशल मीडिया पर उल्लेख किया कि विज़ुअल मोड को आधिकारिक तौर पर वेब पेजों और एप्लिकेशन पर लॉन्च किया गया है, "इन नई आँखों को आज़माएँ।"

गौरतलब है कि सिर्फ 5 दिन पहले चेन जियाओकांग ने हॉट स्पॉट का पीछा किया था और पहचान के लिए आंटी गूज लेग के "ग्रीन डक लेग" को डीपसीक में भेजा था। उत्तर से देखते हुए, डीपसीक यह पहचानने में सक्षम था कि यह हंस का पैर नहीं था, और यह भी सुझाव दिया कि हरा रंग खाद्य सुरक्षा के लिए खतरा हो सकता है। "अगर उस समय डीपसीक होता, तो इस साल 'डक वॉर' नहीं होता।" उसने मजाक किया.

इस टिप्पणी क्षेत्र में, कुछ उपयोगकर्ताओं ने पूछा कि विज़ुअल फ़ंक्शन अभी तक उपलब्ध क्यों नहीं है। उस समय, चेन ज़ियाओकांग ने उत्तर दिया, "केवल कुछ ही उपयोगकर्ता ग्रेस्केल (परीक्षण) का उपयोग कर सकते हैं।" इस साल अप्रैल के अंत में, डीपसीक इमेज रिकग्निशन मोड ने एक ग्रेस्केल परीक्षण शुरू किया, और इसे मई में उपयोगकर्ताओं की एक विस्तृत श्रृंखला के लिए खोल दिया गया। हालाँकि, कई उपयोगकर्ताओं ने अभी भी इसका उपयोग नहीं किया था जब तक कि ऐसा नहीं लगा कि यह परीक्षण के लिए सभी उपयोगकर्ताओं के लिए खुला था।
छवि पहचान में डीपसीक कितना प्रभावी है? चाइना बिजनेस न्यूज़ के एक रिपोर्टर ने शुरुआत की और इसका अनुभव किया, और विभिन्न स्थितियों में प्रभाव अलग-अलग थे।
मैंने डीपसीक को शंघाई में बंड का एक वास्तुशिल्प चित्र भेजा और पूछा कि यह कहाँ है। डीपसीक ने 16 सेकंड में सामान्य उत्तर दिया. इसने चार मुख्य इमारतों का विश्लेषण किया और यह भी उत्तर दिया कि सफेद आर्च ब्रिज "संभवतः झापू रोड ब्रिज" है, जो एक क्लासिक फोटोग्राफी कोण है।

हालाँकि, डीपसीक इन दिनों लोकप्रिय केप वर्डीन गोलकीपर वोज़िन्हा को नहीं पहचान पा रहा है। डीपसीक ने गहराई से सोचने में एक मिनट से अधिक समय बिताया। विचार प्रक्रिया के दौरान, केप वर्डे का कई बार उल्लेख किया गया था, लेकिन यह विशिष्ट खिलाड़ी के अनुरूप नहीं हो सका। अंत में, इसने बिल्कुल गलत उत्तर दिया।

ऐसा इसलिए हो सकता है क्योंकि वोज़्निया पहले प्रसिद्ध नहीं था और बड़े मॉडल प्रशिक्षण डेटा में शामिल नहीं था। साथ ही, डीपसीक के छवि पहचान मोड में ऑनलाइन खोज फ़ंक्शन नहीं है, इसलिए यह वर्तमान हॉट आंकड़ों की पहचान नहीं कर सकता है।
रिपोर्टर ने देखा कि सोशल प्लेटफ़ॉर्म पर, उन उपयोगकर्ताओं की प्रतिक्रिया थी जो लंबे समय से ग्रेस्केल परीक्षणों द्वारा कवर किए गए थे। डीपसीक की छवि पहचान क्षमता घरेलू मॉडलों के औसत स्तर से अधिक है, लेकिन शीर्ष विदेशी मॉडलों की तुलना में, जटिल छवि समझ और विस्तृत तर्क में अभी भी अंतर था।
विशेष रूप से, दैनिक स्क्रीनशॉट, त्रुटि संदेश, टेबल, कागजात और वेब पेज सामग्री जैसे परिदृश्यों में, डीपसीक की छवि पहचान मूल रूप से पर्याप्त और बहुत तेज़ है। लेकिन अगर यह अधिक जटिल चित्र है, जैसे मल्टी-लेयर लॉजिक फ़्लो चार्ट या जटिल डेटा चार्ट, तो सटीकता कम होने लगेगी। हालाँकि, उपर्युक्त उपयोगकर्ताओं का मानना है कि कीमत और खुलेपन को देखते हुए, डीपसीक अभी भी उपयोग करने लायक है।
अभी 30 अप्रैल को, डीपसीक ने मल्टी-मोडल तकनीक पर एक रिपोर्ट जारी की, "थिंकिंग विद विसौल प्रिमिटिव्स", जिसमें मल्टी-मोडल तकनीक के पीछे के विवरण बताए गए हैं। लेकिन जल्द ही सभी को पता चला कि अधिकारी ने मल्टी-मोडल वेयरहाउस और पेपर के मूल पाठ को रातोंरात हटा दिया, और जीथब इंटरफ़ेस पहले से ही "404" स्थिति में था।
उस वक्त बाहरी दुनिया से कई तरह की अटकलें लगाई जा रही थीं. कुछ का मानना था कि डीपसीक अभी तैयार नहीं था, जबकि अन्य का मानना था कि पेपर में बहुत अधिक जानकारी सामने आई है। पेपर में, डीपसीक का मानना है कि मौजूदा मल्टी-मोडल मॉडल अदृश्यता (धारणा अंतर) के कारण नहीं, बल्कि "गलत संकेत" (उद्धरण अंतर) के कारण जटिल कार्यों पर विफल हो जाता है। मल्टीमॉडल इंटेलिजेंस का भविष्य केवल "अधिक पिक्सेल देखने" के बारे में नहीं है, बल्कि भाषा और दृष्टि के बीच एक सटीक और स्पष्ट संदर्भ पुल बनाने के बारे में है।
फिलहाल, डीपसीक ने सार्वजनिक रूप से इमेज रिकग्निशन मोड के लॉन्च की घोषणा नहीं की है। इस मोड के तकनीकी विवरण और अधिक समाचारों के लिए अभी भी आधिकारिक परिचय की प्रतीक्षा करनी होगी।