12 दिसंबर की खबर के मुताबिक, टेस्ला और स्पेसएक्स के सीईओ एलोन मस्क के स्वामित्व वाले एक कृत्रिम बुद्धिमत्ता स्टार्टअप xAI ने हाल ही में अपना चैट रोबोट ग्रोक जारी किया, लेकिन ऐसा लगता है कि कुछ गलत हो गया है। शुक्रवार को सुरक्षा परीक्षक जैक्स विंटरबॉर्न ने सोशल मीडिया प्लेटफॉर्म पर एक स्क्रीनशॉट पोस्ट किया
इससे लोगों में उत्सुकता जगी क्योंकि ग्रोक को OpenAI द्वारा विकसित नहीं किया गया था, और दोनों पार्टियाँ अभी भी प्रतिस्पर्धी हैं।
इससे भी अधिक दिलचस्प बात यह है कि एक्सएआई के लोगों ने इस बात से इनकार नहीं किया कि यह व्यवहार उनके एआई मॉडल में हुआ था। इगोर बाबुस्किन ने अपने उत्तर में लिखा: "समस्या यह है कि जब हम ग्रोक को प्रशिक्षित कर रहे थे, तो नेटवर्क चैटजीपीटी आउटपुट से भरा हुआ था, और हमने गलती से उनमें से कुछ का उपयोग किया। जब हमने पहली बार इस समस्या पर ध्यान दिया तो हम भी बहुत आश्चर्यचकित हुए। वैसे भी, यह समस्या बहुत दुर्लभ है, और अब जब हम इसके बारे में जानते हैं, तो हम यह सुनिश्चित करेंगे कि ग्रोक के भविष्य के संस्करणों में यह समस्या न हो। चिंता न करें, ग्रोक को विकसित करने के लिए किसी ओपनएआई कोड का उपयोग नहीं किया गया था।"
बाबुश्किन के जवाब में, विंटरबॉर्न ने लिखा: "आपके उत्तर के लिए धन्यवाद। मैं कहूंगा कि यह स्थिति असामान्य नहीं है और जब कोड निर्माण की बात आती है तो यह अक्सर होता है। फिर भी, मैं इस पर आगे चर्चा करने के लिए इसे उन लोगों पर छोड़ दूंगा जो बड़े भाषा मॉडल और कृत्रिम बुद्धिमत्ता में विशेषज्ञ हैं। आखिरकार, मैं सिर्फ एक आम आदमी हूं।"
हालाँकि, कई विशेषज्ञों को बाबुश्किन का स्पष्टीकरण असंबद्ध लगा। बड़े भाषा मॉडल आम तौर पर अपने प्रशिक्षण डेटा को शब्दशः प्रकट नहीं करते हैं, और यह समझ में आएगा यदि ग्रोक ओपनएआई की नीतियों का ऑनलाइन उल्लेख करता है। OpenAI नीति के आधार पर प्रतिक्रिया देने से इनकार करने के लिए विशेष प्रशिक्षण की आवश्यकता हो सकती है। ऐसा होने का सबसे संभावित कारण यह है कि ग्रोक ने ओपनएआई बड़े भाषा मॉडल के आउटपुट डेटा को ठीक किया है।
एआई शोधकर्ता साइमन विलिसन ने एक साक्षात्कार में कहा: "मैं इस बारे में थोड़ा सशंकित हूं। क्या ग्रोक इस तरह का व्यवहार सिर्फ इसलिए कर रहा है क्योंकि इंटरनेट चैटजीपीटी-जनरेटेड सामग्री से भर गया है? मैंने हगिंगफेस पर बहुत सारे ओपन-वेट मॉडल देखे हैं जो समान व्यवहार प्रदर्शित करते हैं, जैसे वे भी चैटजीपीटी के समान हैं। ऐसा इसलिए है क्योंकि ये मॉडल ओपनएआईएपीआई का उपयोग करके या चैटजीपीटी द्वारा उत्पन्न डेटासेट का उपयोग करके उत्पन्न डेटासेट पर ठीक से ट्यून किए गए हैं। मुझे लगता है इसकी अधिक संभावना है कि ग्रोक को नेटवर्क डेटा पर आधारित दुर्घटना के बजाय चैटजीपीटी आउटपुट वाले डेटासेट पर ट्यून किया गया है।
जैसे-जैसे ओपनएआई के बड़े भाषा मॉडल अधिक से अधिक शक्तिशाली होते जा रहे हैं, कुछ कृत्रिम बुद्धिमत्ता परियोजनाओं (विशेष रूप से ओपन सोर्स परियोजनाओं) के लिए अपने स्वयं के कृत्रिम बुद्धिमत्ता मॉडल के आउटपुट को ठीक करने के लिए अन्य बड़े भाषा मॉडल द्वारा उत्पन्न सिंथेटिक डेटा का उपयोग करना आम हो गया है। एआई मॉडल के व्यवहार को बेहतर बनाने से विशिष्ट उद्देश्य पूरे हो सकते हैं, जैसे प्रारंभिक प्रशिक्षण के बाद कोडिंग क्षमताओं में सुधार। इस साल मार्च में, स्टैनफोर्ड विश्वविद्यालय के शोधकर्ताओं के एक समूह ने उस समय हलचल मचा दी जब उन्होंने अनुदेश ट्रैकिंग को बेहतर बनाने के लिए OpenAI के GPT-3 मॉडल (टेक्स्ट-डेविन्सी-003 नाम दिया गया) के आउटपुट का उपयोग किया।
ऑनलाइन, हम आसानी से कई ओपन सोर्स डेटासेट पा सकते हैं जिन्हें शोधकर्ताओं ने चैटजीपीटी आउटपुट से एकत्र किया है। इसलिए xAI ने कुछ विशिष्ट लक्ष्यों को प्राप्त करने के लिए डेटासेट में से किसी एक का उपयोग करके ग्रोक को ठीक किया हो सकता है। यह प्रथा इतनी आम है कि विश्वकोश-शैली जीवन मार्गदर्शिका वेबसाइट विकिहाउ पर "डेटा सेट बनाने के लिए चैटजीपीटी का उपयोग कैसे करें" शीर्षक से एक लेख भी है।
यह भविष्य में अधिक जटिल कृत्रिम बुद्धिमत्ता उपकरण बनाने के लिए कृत्रिम बुद्धिमत्ता उपकरणों का उपयोग करने का एक तरीका है, जैसे लोगों ने माइक्रोप्रोसेसरों को डिजाइन करने के लिए माइक्रो कंप्यूटर का उपयोग करना शुरू किया जो कागज और पेंसिल चित्रों की तुलना में अधिक जटिल थे। हालाँकि, प्रशिक्षण डेटा को अधिक सावधानी से फ़िल्टर करके xAI भविष्य में इससे बचने में सक्षम हो सकता है।
जबकि मशीन लर्निंग समुदाय में दूसरों का काम उधार लेना आम बात हो सकती है (हालांकि यह आमतौर पर सेवा की शर्तों के खिलाफ है), इस घटना ने ओपनएआई और एक्सएआई के बीच प्रतिस्पर्धा को तेज कर दिया है, जो ओपनएआई की मस्क की पिछली आलोचना से भी पहले की है। जैसे ही खबर फैली कि ग्रोक ओपनएआई मॉडल डेटा उधार ले सकता है, आधिकारिक चैटजीपीटी खाते ने एक्सएआई का मज़ाक उड़ाते हुए एक पोस्ट भी पोस्ट किया, जिसमें कहा गया, "हमारे बीच बहुत कुछ समान है" और विंटरबॉर्न की पोस्ट का हवाला दिया। मस्क ने पलटवार करते हुए कहा, "आप इस मंच से सभी प्रशिक्षण डेटा एकत्र करते हैं, आपको यह पता होना चाहिए!"