डीपसीक छवि पहचान मोड ऑनलाइन है लेकिन मैं अपने बॉस लियांग वेनफेंग

18 जून को, डीपसीक मल्टी-मोडल शोधकर्ता चेन ज़ियाओकांग ने पोस्ट किया कि डीपसीक का इमेज रिकग्निशन मोड आधिकारिक तौर पर वेब और ऐप पर लॉन्च किया गया है। क्वेरी में पाया गया कि डीपसीक के ऐप साइड पर छवि पहचान मोड अभी भी "छवि समझ फ़ंक्शन आंतरिक परीक्षण के तहत है" का संकेत देता है, लेकिन वेब पेज पर ऐसा कोई संकेत नहीं है।

हालाँकि, मीडिया परीक्षणों से पता चला है कि डीपसीक लोगों की पहचान करने में कम सटीक है। उदाहरण के लिए, यह अपने मालिक लियांग वेनफ़ेंग को नहीं पहचान सका। एक पल में उसने उसे वांग ज़िंग के रूप में पहचाना, और दूसरे पल में उसने उसे किसी और के रूप में पहचाना।

हालाँकि, सामान्य वस्तुओं और प्रसिद्ध इमारतों की पहचान अपेक्षाकृत सटीक रही है।

रिपोर्ट्स के मुताबिक, दो महीने पहले डीपसीक इमेज रिकग्निशन मोड को आधिकारिक तौर पर ग्रेस्केल में लॉन्च किया गया था। एक देशी विज़ुअल इंटरेक्शन पोर्टल के रूप में, डीपसीक छवि पहचान मोड तेज़ मोड और विशेषज्ञ मोड के साथ एक स्वतंत्र प्रथम-स्तरीय फ़ंक्शन है। यह प्रारंभिक शुद्ध पाठ मॉडल की क्षमता सीमाओं से पूरी तरह छुटकारा दिलाता है और छवियों और पाठ के साथ एक एकीकृत संवाद अनुभव प्राप्त करता है।

यह याद दिलाया जाना चाहिए कि डीपसीक छवि पहचान मोड एक साधारण छवि पाठ निष्कर्षण उपकरण या एक साधारण ओसीआर उपकरण नहीं है, बल्कि एक पूर्ण दृश्य समझ बंद लूप बनाने के लिए स्व-विकसित डीपसीक-ओसीआर2 दृश्य कारण प्रवाह तंत्र पर निर्भर करता है। उपयोगकर्ताओं को केवल टेक्स्ट प्रश्नों के साथ सीधे चित्र अपलोड करने की आवश्यकता होती है, और सिस्टम एक साथ ऑब्जेक्ट पहचान, दृश्य विश्लेषण, चार्ट डिस्सेप्लर, फाइन टेक्स्ट निष्कर्षण और विवरण खनन पूरा कर सकता है।

बताया गया है कि डीपसीक ने हाल ही में अपनी सीरीज़ ए फाइनेंसिंग पूरी की है, जिसमें लगभग 51 बिलियन युआन की वित्तपोषण राशि और लगभग 400 बिलियन युआन का निवेश के बाद का कॉर्पोरेट मूल्यांकन है।