क्या सुपर-इंटेलिजेंट एआई चुपचाप उभरेगा? नए शोध का कहना है कि यह अचानक

क्या कृत्रिम बुद्धिमत्ता (एआई) अधीक्षण अचानक उभरेगी, या वैज्ञानिक इसके उद्भव की भविष्यवाणी करेंगे और दुनिया को चेतावनी देने का अवसर देंगे? हाल ही में बड़े भाषा मॉडल (जैसे चैटजीपीटी) के उदय के साथ इस समस्या पर बहुत अधिक ध्यान दिया गया है, इन कृत्रिम बुद्धिमत्ता ने आकार में बढ़ने के साथ-साथ महत्वपूर्ण नई क्षमताएं प्राप्त की हैं।किसी ने "उद्भव" की घटना की ओर इशारा किया, एक ऐसी घटना जिसमें तथाकथित कृत्रिम बुद्धिमत्ता मॉडल तेजी से अविश्वसनीय तरीकों से बुद्धि प्राप्त करते हैं। लेकिन एक हालिया अध्ययन इन स्थितियों को "प्रेत" कहता है - कलाकृतियाँ जो सिस्टम परीक्षण के दौरान उत्पन्न होती हैं - और सुझाव देती हैं कि नवाचार क्षमताओं का निर्माण वास्तव में एक क्रमिक प्रक्रिया है।

"मुझे लगता है कि उन्होंने यह कहकर अच्छा काम किया, 'कुछ भी जादुई नहीं हुआ," मोज़िला फाउंडेशन के एक कम्प्यूटेशनल वैज्ञानिक डेबोरा राजी ने कहा, जो कृत्रिम बुद्धिमत्ता ऑडिटिंग का अध्ययन करते हैं। "यह एक अच्छी, ठोस, माप-आधारित आलोचना है।"

यह कार्य पिछले दिसंबर में न्यू ऑरलियन्स में न्यूरआईपीएस मशीन लर्निंग सम्मेलन में प्रस्तुत किया गया था।

बड़ा बेहतर है

बड़े भाषा मॉडलों को आम तौर पर बड़े पैमाने पर पाठ या अन्य जानकारी के साथ प्रशिक्षित किया जाता है ताकि यह अनुमान लगाया जा सके कि आगे क्या होगा। विशिष्ट प्रशिक्षण के बिना भी, वे भाषाओं का अनुवाद कर सकते हैं, गणितीय समस्याओं को हल कर सकते हैं, कविता लिख सकते हैं या कोड की गणना कर सकते हैं। मॉडल जितना बड़ा होगा (कुछ में सौ अरब से अधिक ट्यून करने योग्य पैरामीटर होंगे), उतना ही बेहतर प्रदर्शन करेगा। कुछ शोधकर्ताओं को संदेह है कि ये उपकरण अंततः कृत्रिम सामान्य बुद्धिमत्ता (एजीआई) को जन्म दे सकते हैं जो अधिकांश कार्यों में मानव प्रदर्शन से मेल खा सकता है या उससे भी अधिक हो सकता है।

नया अध्ययन कुछ तरीकों से उद्भव के दावे का परीक्षण करता है। सबसे पहले, वैज्ञानिकों ने चार-अंकीय जोड़ में चार-स्तरीय OpenAIGPT-3 मॉडल की क्षमताओं की तुलना की। पूर्ण सटीकता के संदर्भ में, तीसरे और चौथे सबसे बड़े मॉडल के बीच प्रदर्शन अंतर 0% से लेकर 100% के करीब है। लेकिन जब सही ढंग से अनुमानित उत्तरों की संख्या को देखते हैं, तो प्रदर्शन के स्तर में अंतर कम चरम होता है। शोधकर्ताओं ने यह भी पाया कि मॉडल को कई परीक्षण प्रश्न देने से वक्र भी समतल हो गया - ऐसे में छोटे मॉडल ने कभी-कभी सही उत्तर दिया।

इसके बाद शोधकर्ताओं ने कई कार्यों पर Google के LaMDA भाषा मॉडल के प्रदर्शन की जांच की। जब विडंबना का पता लगाने या कहावतों का अनुवाद करने की बात आती है, तो इसमें बुद्धिमत्ता में तेज वृद्धि देखी गई, जो अक्सर सही या गलत उत्तरों के साथ बहुविकल्पीय प्रश्न होते हैं। लेकिन जब शोधकर्ताओं ने प्रत्येक उत्तर के लिए निर्दिष्ट मॉडल की संभाव्यता (एक सतत मीट्रिक) की जांच की, तो उद्भव के संकेत गायब हो गए।

अंत में, शोधकर्ताओं ने कंप्यूटर विज़न की जांच की, एक ऐसा क्षेत्र जहां उभरने की बहुत कम चर्चा है। उन्होंने मॉडल को छवियों को संपीड़ित करने और फिर पुनर्निर्माण करने के लिए प्रशिक्षित किया। लेकिन जब तक शुद्धता के लिए सख्त सीमाएं निर्धारित की जाती हैं, वे महत्वपूर्ण उद्भव को प्रेरित कर सकते हैं। कृत्रिम बुद्धिमत्ता और सामान्य ज्ञान का अध्ययन करने वाले वाशिंगटन विश्वविद्यालय के कंप्यूटर वैज्ञानिक येजिन चोई ने कहा, "जिस तरह से उन्होंने सर्वेक्षण को डिजाइन किया वह बहुत रचनात्मक था।"

अभी इंकार नहीं किया गया है

अध्ययन के सह-लेखक और स्टैनफोर्ड विश्वविद्यालय के कंप्यूटर वैज्ञानिक सनमी कोएजो ने कहा कि लोगों के लिए उद्भव के बारे में सोचना बेतुका नहीं है क्योंकि कुछ सिस्टम अप्रत्याशित "चरण परिवर्तन" प्रदर्शित करते हैं। उन्होंने यह भी कहा कि यह अध्ययन बड़े भाषा मॉडल (भविष्य की प्रणालियों की तो बात ही छोड़ दें) के साथ ऐसा होने की संभावना को पूरी तरह से खारिज नहीं कर सकता है, लेकिन उन्होंने कहा कि "आज तक के वैज्ञानिक शोध दृढ़ता से सुझाव देते हैं कि भाषा मॉडल के अधिकांश पहलू वास्तव में पूर्वानुमान योग्य हैं।"

राजी यह देखकर खुश हैं कि शिक्षा जगत तंत्रिका नेटवर्क आर्किटेक्चर विकसित करने के बजाय बेंचमार्किंग पर अधिक ध्यान केंद्रित कर रहा है। वह चाहती हैं कि शोधकर्ता एक कदम आगे बढ़ें और पूछें कि ये कार्य वास्तविक दुनिया के अनुप्रयोगों से कैसे संबंधित हैं। उदाहरण के लिए, क्या GPT-4 जैसे एलएसएटी (लॉ स्कूल एडमिशन टेस्ट) में अच्छा प्रदर्शन करने का मतलब यह है कि मॉडल पैरालीगल कार्य भी कर सकता है?

इस कार्य का एआई सुरक्षा और नीति पर भी प्रभाव पड़ता है। राजी ने कहा, "एजीआई की भीड़ उद्भव क्षमता की कहानी का प्रचार कर रही है।" निराधार भय के कारण नियमों का दमन हो सकता है या अधिक दबाव वाले जोखिमों से ध्यान भटक सकता है। उन्होंने कहा, "मॉडल में सुधार हो रहा है और वे उपयोगी हैं।" "लेकिन वे अभी भी सचेत होने से बहुत दूर हैं।"