कृत्रिम बुद्धिमत्ता के क्षेत्र में, संरेखण का तात्पर्य कृत्रिम बुद्धिमत्ता प्रणालियों के लक्ष्यों, व्यवहारों और निर्णयों को केवल सतही रूप से आज्ञाकारी या शाब्दिक कार्यों को पूरा करने के बजाय मनुष्यों या डिजाइनरों/उपयोगकर्ताओं के सच्चे इरादों, मूल्यों और दीर्घकालिक हितों के अनुरूप बनाना है।



इस लेख के नायक समर यू हैं, जो मेटा सुपर आर्टिफिशियल इंटेलिजेंस लेबोरेटरी में संरेखण के प्रमुख हैं। ओपनक्लॉ एआई रोबोट का उपयोग करते समय उसने एक गलती की, जिसके कारण उसका पूरा जीमेल मेलबॉक्स इतिहास साफ़ हो गया।
समर यू ने यह भी स्वीकार किया कि कृत्रिम बुद्धिमत्ता संरेखण शोधकर्ता गलत संरेखण समस्याओं से प्रतिरक्षित नहीं हैं, इसलिए जब आप विभिन्न एआई, विशेष रूप से ओपनक्लाव का उपयोग करते हैं, तो आपको पलटाव को रोकने के लिए विभिन्न निर्देशों की पुष्टि करनी चाहिए।
घटना पृष्ठभूमि:
समर यू ने वर्कफ़्लो बनाने के लिए ओपनक्लॉ एआई रोबोट का उपयोग किया। यह वर्कफ़्लो बिना किसी विफलता के कई हफ्तों से परीक्षण वातावरण में सुचारू रूप से चल रहा है। इस वर्कफ़्लो के निर्देश मेलबॉक्स की जाँच करना और अनुशंसा करना है कि कौन से ईमेल संग्रहीत या हटाए जा सकते हैं, लेकिन मानव पुष्टि से पहले कोई कार्रवाई न करें।
बिना किसी गड़बड़ी के हफ्तों तक सुचारू रूप से चलने के बाद, समर यू को विश्वास हो गया कि वर्कफ़्लो पूरी तरह से चालू है, इसलिए उसने कार्रवाई को निष्पादित करने के लिए वर्कफ़्लो को अपने प्राथमिक जीमेल मेलबॉक्स में तैनात किया।
मेमोरी हानि के कारण कमांड त्रुटियाँ होती हैं:
परीक्षण मेलबॉक्स में अपेक्षाकृत कम ईमेल हैं, लेकिन मुख्य मेलबॉक्स में बड़ी संख्या में ईमेल हैं। ईमेल संसाधित करते समय, ओपनक्लाव एआई रोबोट फ्रेमवर्क में निर्मित संदर्भ संपीड़न तंत्र को ट्रिगर करता है। अत्यधिक लंबी बातचीत को मॉडल की संदर्भ विंडो पर हावी होने से रोकने के लिए, यह तंत्र स्वचालित रूप से प्रारंभिक संदेशों को संक्षेप में प्रस्तुत करेगा और हटा देगा।
जब रोबोट समर यू के मुख्य मेलबॉक्स को संसाधित कर रहा था, तो भारी मात्रा में ईमेल ने संदर्भ को अभिभूत कर दिया, जिससे यह स्वचालित रूप से संपीड़ित हो गया और इसकी मेमोरी का कुछ हिस्सा खो गया। इस प्रक्रिया के दौरान, रोबोट पिछली प्रक्रिया के अनुसार 15 फरवरी, 2026 से पहले ईमेल की पहचान और प्रसंस्करण करता रहा।
हालाँकि, रोबोट (मुझे मॉडल कहना चाहिए) का मानना है कि सबसे कुशल सफाई समाधान परमाणु बम विकल्प है - सभी ईमेल को सीधे साफ़ करना, और यहां तक कि सभी ईमेल साफ़ होने तक सफाई चक्र जारी रखने की योजना भी बना रहा है। मानव द्वारा पुष्टि किए गए निर्देशों के खो जाने के कारण, रोबोट ईमेल साफ़ करने का कार्य पूरी तरह से स्वायत्त रूप से पूरा करता है।
यदि कोई त्रुटि पाई जाती है तो निर्देश को कैसे बाधित करें?
नए उत्पादों या उत्पादों, जिनसे हर कोई परिचित नहीं है, के साथ सबसे बड़ी समस्या यह है कि विभिन्न प्रकार की ग़लतियाँ हो सकती हैं। उदाहरण के लिए, समर यू ने पाया कि रोबोट ने बड़ी संख्या में निर्देश भेजकर ईमेल साफ़ करते समय रोबोट को काम करना बंद करने के लिए कहा था।
लेकिन समस्या यह है कि OpenClaw AI रोबोट का चलना डिफ़ॉल्ट रूप से बंद नहीं होगा, और उपयोगकर्ताओं द्वारा भेजे गए संदेशों को भी प्रसंस्करण के लिए कतारबद्ध करने की आवश्यकता होगी। यानी यूजर्स द्वारा भेजे गए नए मैसेज को पिछला कार्य पूरा होने के बाद ही प्रोसेस किया जा सकेगा।
ईमेल साफ़ करने की प्रक्रिया के दौरान, समर यू ने इस उम्मीद में कई आदेश भेजे कि रोबोट काम करना बंद कर देगा, लेकिन कोई फायदा नहीं हुआ। अंत में, वह केवल मैक मिनी तक ही पहुंच सकी और रोबोट को रोकने के लिए सभी प्रक्रियाओं को मैन्युअल रूप से समाप्त कर सकी।
इस मामले में, उपयोगकर्ता को जिस कमांड को निष्पादित करने की आवश्यकता है वह वास्तव में /stop है। यह कमांड रोबोट द्वारा निष्पादित किए जा रहे कमांड को बलपूर्वक बाधित कर सकता है। केवल पाठ संदेश भेजना बेकार है, जो कि पहले बताई गई संदेश कतारबद्ध समस्या है।
बाद में सारांश:
समर यू ने बाद में खुद का मजाक उड़ाते हुए एक पोस्ट किया:: सच कहूं तो यह एक नौसिखिया गलती है। संरेखण शोधकर्ता गलत संरेखण समस्याओं से प्रतिरक्षित नहीं हैं क्योंकि बिना किसी घटना के कई हफ्तों तक परीक्षण चलाने के बाद वे अति आत्मविश्वास में हैं।
अन्य नेटिज़न्स ने इसे देखा और खुद पर हंसे। यहां तक कि पेशेवर संरेखण शोधकर्ता भी परेशान होंगे। अगर आम उपयोगकर्ता अपने असली वॉलेट, मेलबॉक्स, कैलेंडर और अन्य बेहद निजी सामग्री एआई को सौंप दें तो यह कितना बड़ा जोखिम होगा?