डी भगवान फिर से हवा में है? असली या नकली? डीपसीक इसे लंबे समय से रोके हुए था, और हाल ही में उसने अंततः इसे छोड़ना शुरू कर दिया है। पिछले सप्ताह उन्होंने चुपचाप V4 लॉन्च किया, जिसके बाद कीमतों में दो बड़ी कटौती की गई। . लियांग शेन, क्या आप फिर से सभी संवेदनशील प्राणियों को बचाने आए हैं? परिणामस्वरूप, आज, यह अचानक आया और मुझ पर ग्रे परीक्षणों की लहर दौड़ गई:डीपसीक में मल्टी-मोडल क्षमताएं हैं, विशेष रूप से छवि पहचान।

मैंने कार्डों की जाँच की और यह सच है।


जो लोग कुछ नया आज़माना चाहते हैं वे अभी अपना डीपसीक खोलकर देख सकते हैं।

यदि इंटरफ़ेस में "छवि पहचान मोड" है, तो बधाई हो, आप भाग्यशाली हैं जो आंतरिक परीक्षण में पकड़े गए, और आप सीधे V4 का वास्तविक मल्टी-मोडल संस्करण मुफ्त में खरीद सकते हैं।

डीपसीक के अपने शोधकर्ता चेन जियाओकांग एक पोस्ट करने से खुद को नहीं रोक सके। आख़िरकार हम व्हेलों के पास आंखें आ गईं और अब हम राष्ट्रीय सेवा में अंधे भिक्षु नहीं हैं!


हर कोई इतनी उत्साह से प्रतिक्रिया क्यों दे रहा है? दरअसल, डीपसीक की लंबे समय से आलोचना होती रही है क्योंकि इसमें मल्टी-मोडैलिटी नहीं है। तीन विदेशी दिग्गज चैटजीपीटी, जेमिनी और क्लाउड के पास लंबे समय से मल्टी-मॉडल क्षमताएं हैं। डौबाओ और कियानवेन जैसे घरेलू मॉडलों ने भी बहुत अच्छा प्रदर्शन किया है।

और आप, घरेलू स्तर पर उत्पादित रोशनी, जिससे बड़ी उम्मीदें हैं, इतने सालों से एक तस्वीर भी नहीं पहचान पाए हैं। यह केवल OCR पर भरोसा कर सकता है, जिसका अर्थ है चित्र में टेक्स्ट को पहचानना। उपयोग का अनुभव वास्तव में बेहतर हुआ है।

अब आख़िरकार यह कमी पूरी हो गई है.

बिना किसी देरी के, आइए सीधे परीक्षण पर आते हैं।

सबसे पहले, यह पारंपरिक ओसीआर से छुटकारा दिलाता है और वास्तव में पूरी तस्वीर देख सकता है, जिससे हर कोई निश्चिंत हो सकता है।

उदाहरण के लिए, हमने इसे नीले रंग में लिखी "यह लाल पाठ की एक पंक्ति है" का चित्र दिया। यदि हम केवल पारंपरिक ओसीआर का उपयोग करते हैं, तो यह केवल यह पहचान सकता है कि पाठ "यह लाल पाठ की एक पंक्ति है" और यह कभी नहीं पहचान पाएगा कि यह नीला है। (पहचाना भी नहीं जा सकता)


विज़ुअल मोड चालू करने के बाद, यह सटीक रूप से पहचान सकता है कि यह नीले और लाल अक्षरों की एक पंक्ति है, और यहां तक ​​कि मेरे हास्य को भी महसूस कर सकता है।


इतना ही नहीं, इसमें दृश्य तर्क क्षमता भी है।

क्या आप सभी ने यह मीम देखा है? मेरा मानना ​​है कि मैं अपनी बुद्धि से यह जरूर समझ सकता हूं कि तस्वीर में क्या लिखा है.


इसलिए मैंने इसे डीपसीक को भेजा और हंसी के बिंदुओं का विश्लेषण करने में मेरी मदद करने के लिए कहा।

इसके बारे में सोचने के बाद, इसने न केवल इसे देखा, बल्कि "गोल्डन डालिया", "सिल्वर डालिया" और "ब्रॉन्ज़ डालिया" का स्थानीय अनुवाद भी किया, जिससे इसे थोड़ा हंसी आई।


फिर मैंने उसे गाड़ी चलाते समय एक सहकर्मी द्वारा ली गई एक यादृच्छिक तस्वीर भेजी। यह वास्तव में काफी धुंधला था, और केवल उपस्थिति और प्रकाश प्रभाव के बारे में कुछ जानकारी का विश्लेषण किया जा सका।


अंत में, उसने अनुमान लगाया कि कार वास्तव में सुबारू थी, और 13 सेकंड तक सोचने के बाद वह इस निष्कर्ष पर पहुंचा।


यह मानते हुए कि शिक्षक डी गणित में माहिर हैं, हमने उन्हें गणित से संबंधित एक और मेम भेजा। सच कहूँ तो, शिचाओ इसे लगभग समझ ही नहीं पाया क्योंकि उसका पिता उसके बहनोई ने बनाया था।


शिक्षक डी का स्पष्टीकरण अभी भी सही है।

इसने न केवल सरल ऑपरेशनों को समझा, बल्कि इसमें कई होमोफ़ोन भी देखे: वास्तविक भाग लेने का अर्थ है काल्पनिक संख्या "i" को हटाना, जिसका अर्थ है "आंख" को हटाना, जिसका अर्थ है आँखें निकालना। उलटा त्रिकोण ढाल है, जो "ग्रैड" है, जो लगभग "ग्रेजुएट" के समान है, इसलिए मैंने अपने छोटे चेहरे पर स्नातक की टोपी लगाई।

जो लोग अपना गणितीय ज्ञान भूल गए हैं वे इसकी शब्दशः समीक्षा कर सकते हैं।


वैसे, मैंने दैनिक जीवन में कुछ समस्याओं का भी परीक्षण किया, जैसे कि 3.5 मिमी प्लग कहाँ डालें।


इस वर्गाकार USB पोर्ट को कहाँ प्लग इन किया जाना चाहिए?


हालाँकि यह बहुत सरल है, यह मेरे यादृच्छिक शॉट्स को समझ सकता है जो फोकस में नहीं हैं, और इसे दैनिक कार्यों के लिए सक्षम माना जा सकता है।

लेकिन वास्तव में, शिचाओ के वास्तविक माप के अनुसार, शिक्षक डी का वर्तमान संस्करण अजेय नहीं है।

उदाहरण के लिए, आइए इसकी एक तस्वीर फेंकें, पृथ्वी का एक बहुत ही सुंदर रात का दृश्य।


डीपसीक ने भी इसे बिल्कुल साफ देखा और कहा कि ये तस्वीर इंटरनेशनल स्पेस स्टेशन से आई है.


लेकिन असल में अगर आप फोटो को पलट कर देखेंगे तो पाएंगे कि यह फोटो सूर्यास्त के नीचे शहर की फोटो है. यह एक उल्टा दृष्टिकोण है...

फिर मैंने इसे एक मान्यता प्राप्त मल्टी-मॉडल विशेषज्ञ जेमिनी के पास फेंक दिया... और उसने वास्तव में इसे देखा। नहीं, क्या आप बुद्धिमान बन कर भी इतने मजबूत हैं?


अभी भी मल्टी-मॉडल किंग, हाजी व्हेल को अपना सर्वश्रेष्ठ प्रयास करने के लिए नहीं पा सके?

कुछ चेहरों की पहचान सहित, इसमें कभी-कभी परेशानी भी होती है। उदाहरण के लिए, मैंने उस पर एक बीन बैग की तस्वीर फेंकी, और उसने मुझे जो पहचाना वह था, स्टेशन बी के यूपी नेता लुओ जियांग।


यह क्लासिक ऑप्टिकल भ्रम समस्या भी है। दोनों गेंदें स्पष्ट रूप से एक ही आकार की नहीं हैं, है ना? परिणामस्वरूप, शिक्षक डी ने इसके बारे में सोचा और मुझे बताया कि दोनों गेंदें एक ही आकार की थीं।


हालाँकि, मैंने इसकी विचार प्रक्रिया पर भी नज़र डाली। वास्तव में, उसने पहले ही देख लिया था कि दाहिनी ओर की गेंद बड़ी थी, लेकिन क्योंकि मैंने प्रश्न को ध्यान से पढ़ा, मुझे लगा कि यह उसे दिया गया एक भ्रम था, इसलिए मैंने खुद को धोखा देना चुना और कहा कि वे एक ही आकार के थे। .शायद सुदृढीकरण सीखना बहुत मजबूत है।


देवताओं और भूतों के द्वंद्व का व्यापक मूल्यांकन किया जा सकता है। दबाते समय, दबाते समय और खींचते समय यह समाप्त हो जाता है। .

लेकिन फिर, डीपसीक की आंखें अभी-अभी बढ़ी हैं, इसलिए हमें अभी भी इसे इस दुनिया के अनुकूल होने के लिए कुछ समय देना होगा।

अंत में, वर्तमान एआई दिग्गजों की लड़ाई लंबे समय से नौसिखिया गांव के चरण को पार कर चुकी है जो केवल रनिंग स्कोर और टेक्स्ट आउटपुट क्षमताओं पर ध्यान देती है।

कोडिंग स्तर, मल्टी-मोडल क्षमताएं, कॉलिंग टूल की सहजता आदि मूल रूप से अपरिहार्य हैं।

लेकिन मल्टी-मॉडल क्षमताओं में बिग डी शिक्षक की पिछली अनुपस्थिति हमेशा अफ़सोस की बात लगती थी। ऐसा लगता है कि हर कोई गुनगुना रहा है और काम कर रहा है, लेकिन हथियारों और आंखों की कमी के कारण डीपसीके की एजेंट क्षमताएं बहुत कम हो गई हैं।

आख़िरकार, अधिकांश मौजूदा मॉडल और एपीआई मल्टी-मॉडल हैं, या कम से कम उनमें छवि इनपुट क्षमताएं हैं।


हमें यह भी उम्मीद है कि डीपसीक जल्द से जल्द नए वी4 मॉडल के एपीआई में छवि पहचान की मल्टी-मोडल क्षमताओं को अपडेट कर सकता है।

आप जानते हैं, आंखों पर पट्टी बंधने से पहले मैं कई विरोधियों से आगे-पीछे लड़ चुका था। . अब आंखों से पट्टी हटाएं, क्लाउड कोड, लॉबस्टर, कोवर्क आदि जैसे उपकरणों के प्रदर्शन में काफी सुधार होने की उम्मीद है।

इसके अलावा, इस अवधि के दौरान अपनी उपस्थिति बढ़ाने के लिए डीपसीक जिस आवृत्ति के साथ बुलबुले उड़ाता है, उसे देखते हुए, यह अनुमान लगाया जाता है कि अभी भी बहुत सारे कॉम्बो निष्पादित होने की प्रतीक्षा कर रहे हैं।

बिना किसी देरी के, आइए शिक्षक डी का प्रदर्शन देखें।