18 जून को, डीपसीक मल्टी-मोडल शोधकर्ता चेन ज़ियाओकांग ने पोस्ट किया कि डीपसीक का इमेज रिकग्निशन मोड आधिकारिक तौर पर वेब और ऐप पर लॉन्च किया गया है। क्वेरी में पाया गया कि डीपसीक के ऐप साइड पर छवि पहचान मोड अभी भी "छवि समझ फ़ंक्शन आंतरिक परीक्षण के तहत है" का संकेत देता है, लेकिन वेब पेज पर ऐसा कोई संकेत नहीं है।



हालाँकि, मीडिया परीक्षणों से पता चला है कि डीपसीक लोगों की पहचान करने में कम सटीक है। उदाहरण के लिए, यह अपने मालिक लियांग वेनफ़ेंग को नहीं पहचान सका। एक पल में उसने उसे वांग ज़िंग के रूप में पहचाना, और दूसरे पल में उसने उसे किसी और के रूप में पहचाना।


हालाँकि, सामान्य वस्तुओं और प्रसिद्ध इमारतों की पहचान अपेक्षाकृत सटीक रही है।

रिपोर्ट्स के मुताबिक, दो महीने पहले डीपसीक इमेज रिकग्निशन मोड को आधिकारिक तौर पर ग्रेस्केल में लॉन्च किया गया था। एक देशी विज़ुअल इंटरेक्शन पोर्टल के रूप में, डीपसीक छवि पहचान मोड तेज़ मोड और विशेषज्ञ मोड के साथ एक स्वतंत्र प्रथम-स्तरीय फ़ंक्शन है। यह प्रारंभिक शुद्ध पाठ मॉडल की क्षमता सीमाओं से पूरी तरह छुटकारा दिलाता है और छवियों और पाठ के साथ एक एकीकृत संवाद अनुभव प्राप्त करता है।
यह याद दिलाया जाना चाहिए कि डीपसीक छवि पहचान मोड एक साधारण छवि पाठ निष्कर्षण उपकरण या एक साधारण ओसीआर उपकरण नहीं है, बल्कि एक पूर्ण दृश्य समझ बंद लूप बनाने के लिए स्व-विकसित डीपसीक-ओसीआर2 दृश्य कारण प्रवाह तंत्र पर निर्भर करता है। उपयोगकर्ताओं को केवल टेक्स्ट प्रश्नों के साथ सीधे चित्र अपलोड करने की आवश्यकता होती है, और सिस्टम एक साथ ऑब्जेक्ट पहचान, दृश्य विश्लेषण, चार्ट डिस्सेप्लर, फाइन टेक्स्ट निष्कर्षण और विवरण खनन पूरा कर सकता है।
बताया गया है कि डीपसीक ने हाल ही में अपनी सीरीज़ ए फाइनेंसिंग पूरी की है, जिसमें लगभग 51 बिलियन युआन की वित्तपोषण राशि और लगभग 400 बिलियन युआन का निवेश के बाद का कॉर्पोरेट मूल्यांकन है।