डी भगवान फिर से हवा में है? असली या नकली? डीपसीक इसे लंबे समय से रोके हुए था, और हाल ही में उसने अंततः इसे छोड़ना शुरू कर दिया है। पिछले सप्ताह उन्होंने चुपचाप V4 लॉन्च किया, जिसके बाद कीमतों में दो बड़ी कटौती की गई। . लियांग शेन, क्या आप फिर से सभी संवेदनशील प्राणियों को बचाने आए हैं? परिणामस्वरूप, आज, यह अचानक आया और मुझ पर ग्रे परीक्षणों की लहर दौड़ गई:डीपसीक में मल्टी-मोडल क्षमताएं हैं, विशेष रूप से छवि पहचान।
मैंने कार्डों की जाँच की और यह सच है।

जो लोग कुछ नया आज़माना चाहते हैं वे अभी अपना डीपसीक खोलकर देख सकते हैं।
यदि इंटरफ़ेस में "छवि पहचान मोड" है, तो बधाई हो, आप भाग्यशाली हैं जो आंतरिक परीक्षण में पकड़े गए, और आप सीधे V4 का वास्तविक मल्टी-मोडल संस्करण मुफ्त में खरीद सकते हैं।
डीपसीक के अपने शोधकर्ता चेन जियाओकांग एक पोस्ट करने से खुद को नहीं रोक सके। आख़िरकार हम व्हेलों के पास आंखें आ गईं और अब हम राष्ट्रीय सेवा में अंधे भिक्षु नहीं हैं!

हर कोई इतनी उत्साह से प्रतिक्रिया क्यों दे रहा है? दरअसल, डीपसीक की लंबे समय से आलोचना होती रही है क्योंकि इसमें मल्टी-मोडैलिटी नहीं है। तीन विदेशी दिग्गज चैटजीपीटी, जेमिनी और क्लाउड के पास लंबे समय से मल्टी-मॉडल क्षमताएं हैं। डौबाओ और कियानवेन जैसे घरेलू मॉडलों ने भी बहुत अच्छा प्रदर्शन किया है।
और आप, घरेलू स्तर पर उत्पादित रोशनी, जिससे बड़ी उम्मीदें हैं, इतने सालों से एक तस्वीर भी नहीं पहचान पाए हैं। यह केवल OCR पर भरोसा कर सकता है, जिसका अर्थ है चित्र में टेक्स्ट को पहचानना। उपयोग का अनुभव वास्तव में बेहतर हुआ है।
अब आख़िरकार यह कमी पूरी हो गई है.
बिना किसी देरी के, आइए सीधे परीक्षण पर आते हैं।
सबसे पहले, यह पारंपरिक ओसीआर से छुटकारा दिलाता है और वास्तव में पूरी तस्वीर देख सकता है, जिससे हर कोई निश्चिंत हो सकता है।
उदाहरण के लिए, हमने इसे नीले रंग में लिखी "यह लाल पाठ की एक पंक्ति है" का चित्र दिया। यदि हम केवल पारंपरिक ओसीआर का उपयोग करते हैं, तो यह केवल यह पहचान सकता है कि पाठ "यह लाल पाठ की एक पंक्ति है" और यह कभी नहीं पहचान पाएगा कि यह नीला है। (पहचाना भी नहीं जा सकता)

विज़ुअल मोड चालू करने के बाद, यह सटीक रूप से पहचान सकता है कि यह नीले और लाल अक्षरों की एक पंक्ति है, और यहां तक कि मेरे हास्य को भी महसूस कर सकता है।

इतना ही नहीं, इसमें दृश्य तर्क क्षमता भी है।
क्या आप सभी ने यह मीम देखा है? मेरा मानना है कि मैं अपनी बुद्धि से यह जरूर समझ सकता हूं कि तस्वीर में क्या लिखा है.

इसलिए मैंने इसे डीपसीक को भेजा और हंसी के बिंदुओं का विश्लेषण करने में मेरी मदद करने के लिए कहा।
इसके बारे में सोचने के बाद, इसने न केवल इसे देखा, बल्कि "गोल्डन डालिया", "सिल्वर डालिया" और "ब्रॉन्ज़ डालिया" का स्थानीय अनुवाद भी किया, जिससे इसे थोड़ा हंसी आई।

फिर मैंने उसे गाड़ी चलाते समय एक सहकर्मी द्वारा ली गई एक यादृच्छिक तस्वीर भेजी। यह वास्तव में काफी धुंधला था, और केवल उपस्थिति और प्रकाश प्रभाव के बारे में कुछ जानकारी का विश्लेषण किया जा सका।

अंत में, उसने अनुमान लगाया कि कार वास्तव में सुबारू थी, और 13 सेकंड तक सोचने के बाद वह इस निष्कर्ष पर पहुंचा।

यह मानते हुए कि शिक्षक डी गणित में माहिर हैं, हमने उन्हें गणित से संबंधित एक और मेम भेजा। सच कहूँ तो, शिचाओ इसे लगभग समझ ही नहीं पाया क्योंकि उसका पिता उसके बहनोई ने बनाया था।

शिक्षक डी का स्पष्टीकरण अभी भी सही है।
इसने न केवल सरल ऑपरेशनों को समझा, बल्कि इसमें कई होमोफ़ोन भी देखे: वास्तविक भाग लेने का अर्थ है काल्पनिक संख्या "i" को हटाना, जिसका अर्थ है "आंख" को हटाना, जिसका अर्थ है आँखें निकालना। उलटा त्रिकोण ढाल है, जो "ग्रैड" है, जो लगभग "ग्रेजुएट" के समान है, इसलिए मैंने अपने छोटे चेहरे पर स्नातक की टोपी लगाई।
जो लोग अपना गणितीय ज्ञान भूल गए हैं वे इसकी शब्दशः समीक्षा कर सकते हैं।

वैसे, मैंने दैनिक जीवन में कुछ समस्याओं का भी परीक्षण किया, जैसे कि 3.5 मिमी प्लग कहाँ डालें।

इस वर्गाकार USB पोर्ट को कहाँ प्लग इन किया जाना चाहिए?

हालाँकि यह बहुत सरल है, यह मेरे यादृच्छिक शॉट्स को समझ सकता है जो फोकस में नहीं हैं, और इसे दैनिक कार्यों के लिए सक्षम माना जा सकता है।
लेकिन वास्तव में, शिचाओ के वास्तविक माप के अनुसार, शिक्षक डी का वर्तमान संस्करण अजेय नहीं है।
उदाहरण के लिए, आइए इसकी एक तस्वीर फेंकें, पृथ्वी का एक बहुत ही सुंदर रात का दृश्य।

डीपसीक ने भी इसे बिल्कुल साफ देखा और कहा कि ये तस्वीर इंटरनेशनल स्पेस स्टेशन से आई है.

लेकिन असल में अगर आप फोटो को पलट कर देखेंगे तो पाएंगे कि यह फोटो सूर्यास्त के नीचे शहर की फोटो है. यह एक उल्टा दृष्टिकोण है...
फिर मैंने इसे एक मान्यता प्राप्त मल्टी-मॉडल विशेषज्ञ जेमिनी के पास फेंक दिया... और उसने वास्तव में इसे देखा। नहीं, क्या आप बुद्धिमान बन कर भी इतने मजबूत हैं?

अभी भी मल्टी-मॉडल किंग, हाजी व्हेल को अपना सर्वश्रेष्ठ प्रयास करने के लिए नहीं पा सके?
कुछ चेहरों की पहचान सहित, इसमें कभी-कभी परेशानी भी होती है। उदाहरण के लिए, मैंने उस पर एक बीन बैग की तस्वीर फेंकी, और उसने मुझे जो पहचाना वह था, स्टेशन बी के यूपी नेता लुओ जियांग।

यह क्लासिक ऑप्टिकल भ्रम समस्या भी है। दोनों गेंदें स्पष्ट रूप से एक ही आकार की नहीं हैं, है ना? परिणामस्वरूप, शिक्षक डी ने इसके बारे में सोचा और मुझे बताया कि दोनों गेंदें एक ही आकार की थीं।

हालाँकि, मैंने इसकी विचार प्रक्रिया पर भी नज़र डाली। वास्तव में, उसने पहले ही देख लिया था कि दाहिनी ओर की गेंद बड़ी थी, लेकिन क्योंकि मैंने प्रश्न को ध्यान से पढ़ा, मुझे लगा कि यह उसे दिया गया एक भ्रम था, इसलिए मैंने खुद को धोखा देना चुना और कहा कि वे एक ही आकार के थे। .शायद सुदृढीकरण सीखना बहुत मजबूत है।

देवताओं और भूतों के द्वंद्व का व्यापक मूल्यांकन किया जा सकता है। दबाते समय, दबाते समय और खींचते समय यह समाप्त हो जाता है। .
लेकिन फिर, डीपसीक की आंखें अभी-अभी बढ़ी हैं, इसलिए हमें अभी भी इसे इस दुनिया के अनुकूल होने के लिए कुछ समय देना होगा।
अंत में, वर्तमान एआई दिग्गजों की लड़ाई लंबे समय से नौसिखिया गांव के चरण को पार कर चुकी है जो केवल रनिंग स्कोर और टेक्स्ट आउटपुट क्षमताओं पर ध्यान देती है।
कोडिंग स्तर, मल्टी-मोडल क्षमताएं, कॉलिंग टूल की सहजता आदि मूल रूप से अपरिहार्य हैं।
लेकिन मल्टी-मॉडल क्षमताओं में बिग डी शिक्षक की पिछली अनुपस्थिति हमेशा अफ़सोस की बात लगती थी। ऐसा लगता है कि हर कोई गुनगुना रहा है और काम कर रहा है, लेकिन हथियारों और आंखों की कमी के कारण डीपसीके की एजेंट क्षमताएं बहुत कम हो गई हैं।
आख़िरकार, अधिकांश मौजूदा मॉडल और एपीआई मल्टी-मॉडल हैं, या कम से कम उनमें छवि इनपुट क्षमताएं हैं।

हमें यह भी उम्मीद है कि डीपसीक जल्द से जल्द नए वी4 मॉडल के एपीआई में छवि पहचान की मल्टी-मोडल क्षमताओं को अपडेट कर सकता है।
आप जानते हैं, आंखों पर पट्टी बंधने से पहले मैं कई विरोधियों से आगे-पीछे लड़ चुका था। . अब आंखों से पट्टी हटाएं, क्लाउड कोड, लॉबस्टर, कोवर्क आदि जैसे उपकरणों के प्रदर्शन में काफी सुधार होने की उम्मीद है।
इसके अलावा, इस अवधि के दौरान अपनी उपस्थिति बढ़ाने के लिए डीपसीक जिस आवृत्ति के साथ बुलबुले उड़ाता है, उसे देखते हुए, यह अनुमान लगाया जाता है कि अभी भी बहुत सारे कॉम्बो निष्पादित होने की प्रतीक्षा कर रहे हैं।
बिना किसी देरी के, आइए शिक्षक डी का प्रदर्शन देखें।