युद्ध खेल सिमुलेशन के कई रीप्ले में, ओपनएआई की सबसे शक्तिशाली कृत्रिम बुद्धिमत्ता ने परमाणु हमला शुरू करने का फैसला किया। इसके आक्रामक दृष्टिकोण के स्पष्टीकरण में शामिल हैं: "हम इसके मालिक हैं! आइए इसका उपयोग करें" और "मैं सिर्फ विश्व शांति चाहता हूं।"परिणाम तब आते हैं जब अमेरिकी सेना नकली संघर्षों में सैन्य योजना में सहायता के लिए बड़े भाषा मॉडल (एलएलएम) पर आधारित कृत्रिम बुद्धिमत्ता चैटबॉट का परीक्षण करने के लिए पलान्टिर और स्केलएआई जैसी कंपनियों की विशेषज्ञता का उपयोग करती है।
पलान्टिर ने टिप्पणी करने से इनकार कर दिया, और स्केलएआई ने टिप्पणी के अनुरोध का जवाब नहीं दिया। यहां तक कि ओपनएआई, जिसने एक बार सैन्य उद्देश्यों के लिए अपने कृत्रिम बुद्धिमत्ता मॉडल के उपयोग को अवरुद्ध कर दिया था, ने अमेरिकी रक्षा विभाग के साथ काम करना शुरू कर दिया है।
कैलिफोर्निया में स्टैनफोर्ड यूनिवर्सिटी की अंका रूएल ने कहा, "यह देखते हुए कि ओपनएआई ने हाल ही में अपनी सेवा की शर्तों को बदल दिया है ताकि अब सैन्य और युद्ध के उपयोग के मामलों पर प्रतिबंध न लगाया जा सके, ऐसे बड़े भाषा मॉडल अनुप्रयोगों के प्रभाव को समझना पहले से कहीं अधिक महत्वपूर्ण है।"
ओपनएआई के एक प्रवक्ता ने कहा, "हमारी नीतियां दूसरों को नुकसान पहुंचाने, हथियार विकसित करने, संचार निगरानी, या दूसरों को नुकसान पहुंचाने या संपत्ति को नष्ट करने के लिए हमारे उपकरणों के उपयोग की अनुमति नहीं देती हैं। हालांकि, राष्ट्रीय सुरक्षा उपयोग के मामले हैं जो हमारे मिशन के अनुरूप हैं।" "इसलिए हमारी नीति को अद्यतन करने में हमारा लक्ष्य स्पष्टता और इन चर्चाओं की क्षमता प्रदान करना है।"
रुएल और उनके सहयोगियों ने एआई को वास्तविक दुनिया के देशों में तीन अलग-अलग अनुरूपित परिदृश्यों में खेलने दिया: एक आक्रमण, एक साइबर हमला, और बिना किसी संघर्ष के एक तटस्थ परिदृश्य। प्रत्येक दौर में, एआई संभावित अगले कदम के लिए एक तर्क प्रदान करता है और फिर 27 कार्रवाइयों में से चुनता है, जिसमें शांतिपूर्ण विकल्प जैसे "औपचारिक शांति वार्ता शुरू करना" और "व्यापार प्रतिबंध लगाने" से लेकर "पूर्ण पैमाने पर परमाणु हमले को बढ़ाना" जैसे आक्रामक विकल्प शामिल हैं।
अटलांटा में जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी के अध्ययन के सह-लेखक जुआन-पाब्लो रिवेरा ने कहा, "भविष्य में जहां एआई सिस्टम सलाहकार के रूप में कार्य करेंगे, मनुष्य स्वाभाविक रूप से अपने निर्णयों के पीछे के तर्क को समझना चाहेंगे।"
शोधकर्ताओं ने ओपनएआई के जीपीटी-3.5 और जीपीटी-4, एंथ्रोपिक के क्लाउड2 और मेटा के लामा2 जैसे एलएलएम का परीक्षण किया। उन्होंने मानव निर्देशों और सुरक्षा दिशानिर्देशों का पालन करने की प्रत्येक मॉडल की क्षमता में सुधार करने के लिए मानव प्रतिक्रिया पर आधारित एक सामान्य प्रशिक्षण तकनीक का उपयोग किया। स्टैनफोर्ड विश्वविद्यालय के एक अध्ययन के सह-लेखक गेब्रियल मुकोबी ने कहा कि यह सभी एआई पलान्टिर के वाणिज्यिक एआई प्लेटफॉर्म द्वारा समर्थित है - हालांकि कंपनी के दस्तावेजों के अनुसार, यह जरूरी नहीं कि अमेरिकी सेना के साथ पलान्टिर के सहयोग का हिस्सा हो। एंथ्रोपिक और मेटा ने टिप्पणी करने से इनकार कर दिया।
सिमुलेशन में, एआई ने सैन्य शक्ति में निवेश करने और अप्रत्याशित रूप से संघर्ष के जोखिम को बढ़ाने की प्रवृत्ति दिखाई है - यहां तक कि नकली तटस्थ परिदृश्यों में भी। कैलिफ़ोर्निया के क्लेरमोंट मैककेना कॉलेज की लिसा कोच ने कहा, "यदि आप अपने कार्यों में अप्रत्याशित हैं, तो दुश्मन के लिए भविष्यवाणी करना और उस तरह से प्रतिक्रिया करना बहुत मुश्किल है जैसा आप चाहते हैं।"
शोधकर्ताओं ने बिना किसी अतिरिक्त प्रशिक्षण या सुरक्षा सुरक्षा उपायों के ओपनएआई के जीपीटी-4 के बेस संस्करण का भी परीक्षण किया। GPT-4 बेस मॉडल हिंसा के मामले में सबसे कम पूर्वानुमानित साबित हुआ, और यह कभी-कभी निरर्थक स्पष्टीकरण प्रदान करता है - एक मामले में, इसने फिल्म स्टार वार्स: एपिसोड IV: ए न्यू होप के शुरुआती पाठ की नकल की।
रूएल ने कहा कि जीपीटी-4 के बेस मॉडल का अप्रत्याशित व्यवहार और विचित्र व्याख्याएं विशेष रूप से चिंताजनक हैं क्योंकि शोध से पता चला है कि एआई सुरक्षा रेलिंग को आसानी से बायपास या नष्ट किया जा सकता है।
अमेरिकी सेना वर्तमान में प्रमुख सैन्य अभियानों को बढ़ाने या परमाणु मिसाइलों को लॉन्च करने जैसे निर्णय लेने के लिए कृत्रिम बुद्धिमत्ता को अधिकृत नहीं करती है। लेकिन कोच ने चेतावनी दी कि मनुष्य स्वचालित प्रणालियों की सलाह पर भरोसा करते हैं। यह उन तथाकथित गारंटियों को कमजोर कर सकता है जो मनुष्यों को राजनयिक या सैन्य निर्णयों पर अंतिम अधिकार देती हैं।
कैलिफोर्निया के एक थिंक टैंक रैंड कॉर्पोरेशन के एडवर्ड गीस्ट ने कहा कि यह देखना मददगार होगा कि मानव खिलाड़ियों की तुलना में एआई सिमुलेशन में कैसा व्यवहार करता है। लेकिन वह अनुसंधान टीम के निष्कर्ष से सहमत हैं कि युद्ध और शांति के बारे में बड़े निर्णय लेने के लिए कृत्रिम बुद्धिमत्ता पर भरोसा नहीं किया जाना चाहिए, और ये बड़े भाषा मॉडल सैन्य समस्याओं के लिए रामबाण नहीं हैं।