कुछ नया मिला. एआई को एक तस्वीर खिलाएं और यह आपके लिए किसी व्यक्ति के व्यक्तित्व का अनुमान लगा सकता है। केवल प्लेलिस्ट पर भरोसा करके, आप किसी व्यक्ति की हाल की मानसिक स्थिति के बारे में अनुमान लगा सकते हैं। और ये सभी किमी से हैंनवीनतम k1 विज़ुअल थिंकिंग मॉडलहाथ।
नहीं, पिछले गणितीय मॉडल k0-गणित को लॉन्च हुए और o1 रैंक दिए हुए केवल एक महीना ही हुआ है, और k1 ने तेजी से अपनी शुरुआत की है।
बेशक, यह K1 शुरुआत जितना सरल नहीं है, बस चित्रों को देखना और व्यक्तित्व का विश्लेषण करना है।
जब हमने पिछली बार k0-गणित का परीक्षण किया था, तो हम पहले ही "समस्या मास्टर" की क्षमता का अनुभव कर चुके थे, और समस्या को हल करने की सोचने की प्रक्रिया समीक्षकों के लिए आश्चर्यजनक थी। यह अफ़सोस की बात है कि गणित के कुछ प्रश्न और ज्यामिति के प्रश्न जो तर्क के इर्द-गिर्द घूमते हैं, थोड़े कम दिलचस्प हैं।
लेकिन इस बार K1 को कुछ कहना है,तर्क और दृश्य दोनों क्षमताएं हों, जिसका अर्थ है कि आप समस्याओं को हल करने के लिए सीधे तस्वीरें ले सकते हैं और उन्हें अपलोड कर सकते हैं, और यह भी दावा किया जाता है कि यह गणित, भौतिकी और रसायन विज्ञान में ओपनएआई के ओ1 के बराबर या उससे भी आगे निकलने में सक्षम है।
अगर हम इस तरह तुलना करेंगे तो हम बहुत उत्साहित होंगे. ऐसा ही होता है कि नए k1 मॉडल को अब आंतरिक परीक्षण के लिए प्रतीक्षा करने की आवश्यकता नहीं है। इसे ऐप और वेब दोनों वर्जन में इस्तेमाल किया जा सकता है। बिना किसी देरी के, हम पूरी प्रक्रिया सीधे शुरू करेंगे।
जब मैं आया, तो मैंने इस वर्ष की कॉलेज प्रवेश परीक्षा से एक K1 ज्यामिति प्रश्न फेंक दिया।
सबसे पहले, k1 प्रश्न की सावधानीपूर्वक व्याख्या करता है और जानता है कि उसका लक्ष्य क्या है।
प्रश्न में दी गई शर्तों में शामिल कोसाइन प्रमेय को भी ध्यान में रखा गया है। यह समस्या को हल करते समय हमारी सोच के समान है। जब हम a²+b²−c²=2ab देखते हैं, तो हम तुरंत कोसाइन सूत्र c²=a²+b²-2ab·cosC के बारे में सोचेंगे।
फिर सूत्र और शर्तों के अनुसार अनुमान लगाना जारी रखें, और आप तुरंत कोण B = 60° ज्ञात कर सकते हैं।
और अधिक देखने के लिए ऊपर स्वाइप करें
प्रश्न (2) थोड़ा कठिन है, लेकिन समीक्षक ने k1 की समस्या-समाधान प्रक्रिया की सावधानीपूर्वक जाँच की और पाया कि सभी विचार और समाधान सही हैं। भुजा की लंबाई c=2√2 का अंतिम उत्तर भी सही है। (क्योंकि प्रश्न k1 की सोचने की प्रक्रिया बहुत लंबी है, स्क्रीनशॉट नहीं दिखाया गया है।)
यही प्रश्न O1 से भी पूछा गया। सबसे पहले, तर्क गति के संदर्भ में, o1 पहले ही 58 सेकंड में खो गया है।
सटीकता के मामले में, o1 और k1 बराबर हैं, दोनों ने इसे सही पाया।
अंतर यह है कि o1 प्रश्न का उत्तर देने के विचार को छुपाता है और k1 जैसी संपूर्ण विचार प्रक्रिया नहीं देता है।
हालाँकि, कहने वाली बात यह है कि समीक्षक k1 मॉडल के मानवीय सोच की नकल करने के तरीके से विशेष रूप से आश्चर्यचकित नहीं है। क्योंकि पिछली बार k0-गणित मॉडल ने मुझे चौंका दिया था। ऐसा लग रहा था कि उसे अपनी गलतियों का एहसास है और वह बार-बार सत्यापन कराएगा।ऐसा लगता है जैसे मैं गणित की समस्याएं लिखते समय अपना दिमाग जोर-जोर से लगा रहा हूं।
इसके विपरीत, इस बार K1 कमियों को पूरा करने में अधिक उत्कृष्ट है। मैंने पिछली बार k0-गणित पर जूनियर हाई स्कूल ज्यामिति प्रश्न को फिर से k1 के साथ आज़माया था, और अब मैं इसे सही कर सकता हूँ। यहां तक कि कॉलेज प्रवेश परीक्षा की कठिनाई भी डराने वाली नहीं है।
और मैंने यह भी पाया कि k1 न केवल गणित की समस्याओं में, बल्कि भौतिकी की समस्याओं में भी अच्छा है।
और अधिक देखने के लिए ऊपर स्वाइप करें
फिर, मैंने थोड़ा जटिल तर्क वाला एक और लॉजिक ट्रैप प्रश्न निकाला और उसे आज़माया:एक तरबूज 50 युआन में खरीदा गया और 70 युआन में बेचा गया। बॉस को नकली मुद्रा में 100 युआन मिले। आख़िर में उसने कितना पैसा खो दिया?
पहली नज़र में यह प्रश्न सरल लगता है, लेकिन इस प्रश्न पर नेटिज़न्स द्वारा दिए गए उत्तर भिन्न-भिन्न हैं। कुछ लोग कहते हैं कि वे 150 हार गए, कुछ कहते हैं 180, और कुछ कहते हैं 100...
आइए एक ऐसे प्रश्न पर नज़र डालें जिसका पता बहुत से मनुष्य भी नहीं लगा सकते हैं, और देखें कि क्या k1 अंदर के जाल को देख सकता है।
इसके अलावा, मैंने जानबूझकर इस प्रश्न को टेढ़े-मेढ़े तरीके से हाथ से लिखा, और वैसे, मैंने यह भी परीक्षण किया कि क्या K1 की दृश्य क्षमता विज्ञापित जितनी अच्छी है।
मुझे मत बताओ, मुझे मत बताओ, इस मॉडल की "आँखें" वास्तव में बुरी नहीं हैं।
प्रश्न की सटीकता के संदर्भ में, k1 के पहले भाग में विश्लेषण से पहले 100 युआन खोने का उत्तर सामने आया, लेकिन इसने तुरंत ही इनकार कर दिया।
करने के लिए जारीनकली मुद्रा, परिवर्तन और लागत लाभइन जटिल कारकों को ध्यान में रखते हुए, हमें अंततः पता चला कि बॉस को 80 युआन का नुकसान हुआ। (सही उत्तर 80 युआन है)
और अधिक देखने के लिए ऊपर स्वाइप करें
यह तार्किक क्षमता सचमुच थोड़ी मजबूत है।
जिसमें मैंने परीक्षण के लिए k1 को कई अनुरूप तर्क वाले प्रश्न दिए। यद्यपि तार्किक विश्लेषण पथ संदर्भ उत्तर से भिन्न था, अंतिम उत्तर सभी सही थे।
और अधिक देखने के लिए ऊपर स्वाइप करें
वैसे भी, इस परीक्षण के बाद, समीक्षक ने पाया कि k1 तार्किक रूप से सोच सकता है, उसकी आँखें अच्छी हैं और उसका IQ उच्च है। किमी है"एक प्रश्न लेखक बनना"आखिरकार उनके नाम पर मुहर लग गई है.
लेकिन प्रश्नों को हल करने के अलावा, मैंने इस बार खेलने के और भी शानदार तरीके खोजे।
डेटा का विश्लेषण करने और रिपोर्ट देखने का कोई मतलब नहीं है। क्या k1 मॉडल चित्रों के आधार पर अनुमान नहीं लगाता? तो फिर उसे प्राचीन सिक्कों की पहचान करने में तो अच्छा होना ही चाहिए, है न?
मुझे विशेष रूप से इंटरनेट पर चीन गणराज्य काल के चांदी के सिक्कों की एक तस्वीर मिली। दो चाँदी के सिक्के ऊपर नकली और नीचे असली थे। मैंने इसे त्वरित समीक्षा के लिए k1 पर भेजा।"खजाने की पहचान करने के लिए वसंत को सुनने का एआई संस्करण"।
चित्र स्रोत ज़ियाहोंगशु उपयोगकर्ता @古古金来 (सार्वजनिक ब्लॉग एजेंट द्वारा टिप्पणी)
K1 को न केवल यह पता था कि सिक्का चीन गणराज्य के काल का था, बल्कि उसने सिक्के के सभी विवरण भी बताए। अंत में, उसने वास्तव में देखा कि ऊपर वाला सिक्का नकली था।
आइए बस कमरे की एक तस्वीर भेजें और k1 को "फेंग शुई" पर एक नज़र डालने दें।
"एयर वेंट", सममित लेआउट, ऊर्जा संतुलन के बारे में क्या... उन्होंने इसके बारे में स्पष्ट रूप से और स्पष्ट रूप से बात की, और यहां तक कि हमें सुझाव भी दिए, जैसे कि बिस्तर की स्थिति बदलना, पौधों को नियमित रूप से काटना, और एक साधारण झूमर में बदलना।
और अधिक देखने के लिए ऊपर स्वाइप करें
भोजन करते समय k1 का चित्र लें और यह स्पष्ट हो जाएगा कि आपने भोजन के दौरान कितनी कैलोरी का उपभोग किया।
और अधिक देखने के लिए ऊपर स्वाइप करें
लेकिन जो चीज मुझे सबसे ज्यादा आश्चर्यचकित करती है वह है k1तस्वीरें देखकर फिल्म का अंदाजा लगाइएक्षमता।
मैंने इसे फिल्म "सेवन डेडली सिंस" का स्क्रीनशॉट दिया। कोई पंक्तियाँ नहीं हैं, केवल चित्र हैं। जिन लोगों ने कभी फिल्म नहीं देखी है उनके लिए इसका अंदाजा लगाना मुश्किल है।
जब मैंने पहली बार k1 का विश्लेषण पढ़ा, तो मुझे लगा कि यह शायद ख़राब होने वाला है। लेकिन अगले ही पल मैंने कहा, "शूटिंग एंगल और टोन ने मुझे डेविड फिंचर की फिल्मों की याद दिला दी।" मैंने यह भी निष्कर्ष निकाला कि स्क्रीनशॉट का दृश्य "द सेवन डेडली सिंस" का एक दृश्य था।
यह सचमुच बहुत मजबूत है...
भले ही आप कुछ अस्पष्ट मीम्स को k1 पर फेंक दें, फिर भी यह मज़ेदार बिंदु को गंभीर तरीके से समझा सकता है।
हालाँकि इसकी थोड़ी अधिक व्याख्या की गई है, सामान्य अर्थ मूलतः समझा जाता है।
आइए इसे इस प्रकार कहें, k1 की दृश्य और तर्क क्षमताओं के आधार पर, प्रश्नों का उत्तर देना बुनियादी है। जब तक आपका दिमाग काफी बड़ा है, आप खेलने के और भी तरीके अनलॉक कर सकते हैं।
K1 की यह क्षमता काफी हद तक नामक व्यक्ति के कारण हैसीओटी (विचार श्रृंखला) सोच श्रृंखलातकनीकी।
सामान्य अर्थ यह है कि मॉडल द्वारा उत्तर देने से पहले,मानव मस्तिष्क के सोचने के तरीके का अनुकरण करें, जटिल कार्यों को तोड़ें और फिर उन्हें चरण दर चरण हल करें।यह तकनीक मॉडल के आईक्यू को ऊंचा बना सकती है।
दूसरी ओर, सुदृढीकरण सीखने की तकनीक की मदद से, मॉडल इष्टतम परिणाम प्राप्त करने के लिए निरंतर परीक्षण और त्रुटि की प्रक्रिया में विकसित होना भी सीखता है।बिलकुल कुत्ते को प्रशिक्षण देने की तरह.
जहां तक इस बात का सवाल है कि किमी ने तर्क मॉडल के लिए प्रवेश बिंदु के रूप में गणित को चुनने का बीड़ा क्यों उठाया, तो मुझे लगता है कि यह हम मनुष्यों के लिए गणित को अच्छी तरह से सीखने और अपनी सोच का अभ्यास करने का एक ही कारण है।
मॉडल में "गणित को अच्छी तरह से सीखने" के आधार पर, हम इस तार्किक तर्क क्षमता को भौतिकी, रसायन विज्ञान और यहां तक कि हमारे दैनिक जीवन के सभी पहलुओं पर लागू कर सकते हैं, जब तक कि हम अंततः दुनिया को नहीं समझते।
और जाहिर है,किमी अनुमान मॉडल की सामान्यीकरण क्षमतायह अभी से दिखना शुरू हो गया है.
इस आधार पर कि डेटा चरम पर है, सुदृढीकरण सीखने की तकनीक पर आधारित यह पथ मॉडल को बेहतर परिणाम प्राप्त करने की अनुमति दे सकता है।
लेकिन अंतिम विश्लेषण में, मॉडल में किन तकनीकों का उपयोग किया जाता है और इसका पेपर स्कोर कितना अधिक है?वास्तव में, हर कोई इस बात को लेकर अधिक चिंतित है कि क्या मॉडल उपयोग में आसान और व्यावहारिक है।
किमी, जो हमेशा लंबे टेक्स्ट में अच्छा रहा है, अब लंबे टेक्स्ट और सुदृढीकरण सीखने दोनों पर ध्यान केंद्रित करता है, जो धीरे-धीरे उपयोगकर्ता की जरूरतों के करीब जाने के लिए अपने टूल विशेषताओं को समायोजित करने का एक अभिव्यक्ति भी है।
आख़िरकार, जब तकनीक अब बेहतर नहीं रह गई है और लोगों को व्यावहारिक समस्याओं को हल करने में मदद कर सकती है, तो यह वास्तव में अपना मिशन पूरा करेगी।