पेंटागन ने एआई कंपनियों को वर्गीकृत data_5iter.com पर मॉडलों को प्रशिक्षित करने की अनुमति देने की योजना बनाई है

एमआईटी टेक्नोलॉजी रिव्यू के अनुसार, अमेरिकी रक्षा विभाग एक बड़े बदलाव की योजना बना रहा है: जेनेरिक कृत्रिम बुद्धिमत्ता कंपनियों के लिए एक अत्यधिक गोपनीय प्रशिक्षण वातावरण का निर्माण करना ताकि वे वर्गीकृत सैन्य खुफिया डेटा पर बड़े मॉडलों के सैन्य संस्करणों को प्रशिक्षित कर सकें। इसका मतलब यह है कि जो मॉडल मूल रूप से गोपनीय वातावरण में केवल "पढ़ रहे थे" और "सवालों का जवाब दे रहे थे" वे भविष्य में गोपनीय डेटा को सीधे प्रशिक्षण सामग्री के रूप में उपयोग कर सकते हैं, जिससे मॉडल में संवेदनशील जानकारी "लिख" जाएगी।

पहले से ही, कुछ जेनरेटिव एआई मॉडल, जैसे एंथ्रोपिक क्लाउड, को ईरानी लक्ष्यों सहित सवालों के जवाब देने और विश्लेषण में सहायता के लिए वर्गीकृत वातावरण में तैनात किया जा रहा है। हालाँकि, ये मॉडल वर्तमान में केवल मौजूदा क्षमताओं के आधार पर गोपनीय जानकारी संसाधित करते हैं, और स्वयं मॉडल को प्रशिक्षित और अद्यतन करने के लिए डेटा का पुन: उपयोग नहीं करेंगे। यदि वर्गीकृत डेटा पर प्रशिक्षित करने की अनुमति दी जाती है, तो मॉडल के विशिष्ट सैन्य कार्यों को करने में अधिक सटीक और कुशल होने की उम्मीद है, लेकिन यह अभूतपूर्व सुरक्षा जोखिम भी पेश करेगा।

एक अनाम अमेरिकी रक्षा अधिकारी ने कहा कि वर्गीकृत डेटा पर सेना के कस्टम मॉडल के प्रशिक्षण से विशिष्ट अभियानों में इसके प्रदर्शन और विश्वसनीयता में उल्लेखनीय सुधार होने की उम्मीद है। यह योजना अमेरिकी सेना में अधिक शक्तिशाली एआई मॉडल की बढ़ती मांग के बीच आई है: पेंटागन ने अपने मॉडलों को वर्गीकृत वातावरण में चलाने के लिए ओपनएआई और मस्क के एक्सएआई के साथ समझौता किया है, और ईरान के साथ बढ़ते संघर्ष के जवाब में अमेरिकी सेना को "एआई-प्रथम लड़ाकू बल" में बदलने के उद्देश्य से एक नई कृत्रिम बुद्धिमत्ता रणनीति अपना रहा है। प्रेस समय तक, पेंटागन ने इस प्रशिक्षण योजना पर आधिकारिक तौर पर कोई टिप्पणी नहीं की है।

प्रासंगिक ऑपरेटिंग मोड से परिचित दो लोगों के अनुसार, उपरोक्त प्रशिक्षण की व्यवस्था वर्गीकृत परियोजनाओं के लिए प्रमाणित डेटा सेंटर में की जाएगी, जहां एआई मॉडल के एक निश्चित संस्करण को उसी सुरक्षित वातावरण में वर्गीकृत डेटा के साथ जोड़ा जाएगा। रक्षा अधिकारी के अनुसार, हालांकि डेटा का स्वामित्व अमेरिकी रक्षा विभाग के पास रहता है, दुर्लभ मामलों में, एआई कंपनी के कर्मचारियों को भी गोपनीय डेटा तक पहुंचने की अनुमति दी जा सकती है यदि संबंधित कर्मियों के पास उचित सुरक्षा मंजूरी हो। वास्तव में वर्गीकृत डेटा को छूने से पहले, पेंटागन ने प्रशिक्षित मॉडल की सटीकता और प्रभावशीलता में वास्तविक सुधार का आकलन करने के लिए इसे वाणिज्यिक उपग्रह इमेजरी जैसे अवर्गीकृत डेटा पर परीक्षण करने की योजना बनाई है।

अमेरिकी सेना ने ड्रोन और टोही विमानों द्वारा एकत्र की गई छवियों और वीडियो पर ऑब्जेक्ट पहचान करने के लिए लंबे समय से कंप्यूटर विज़न मॉडल की पुरानी पीढ़ी का उपयोग किया है, और ऐसे डेटा पर एल्गोरिदम को प्रशिक्षित करने के लिए सरकारी अनुबंधों के माध्यम से कंपनियों को नियुक्त किया है। हाल के वर्षों में, सरकारी परिदृश्यों के लिए समर्पित बड़े भाषा मॉडल और चैटबॉट संस्करण भी एक के बाद एक सामने आए हैं, जैसे एंथ्रोपिक द्वारा लॉन्च किया गया क्लाउड गॉव, जो बहुभाषी क्षमताओं और एक सुरक्षित वातावरण में तैनाती पर जोर देता है। हालाँकि, रक्षा अधिकारियों का यह बयान पहली बार स्पष्ट रूप से सामने आया है कि OpenAI और xAI जैसी कंपनियाँ जो बड़े पैमाने पर भाषा मॉडल विकसित करती हैं, गोपनीय डेटा पर सीधे सरकार द्वारा अनुकूलित मॉडल को प्रशिक्षित कर सकती हैं।

गूगल और ओपनएआई में एआई नीति के पूर्व प्रमुख और अब सेंटर फॉर स्ट्रैटेजिक एंड इंटरनेशनल स्टडीज (सीएसआईएस) के तहत वाधवानी एआई सेंटर के निदेशक आलोक मेहता ने बताया कि गोपनीय वातावरण में सिर्फ "पढ़ने और जवाब देने" की तुलना में, मॉडल को प्रशिक्षित करने के लिए गोपनीय डेटा का उपयोग करना वास्तव में नए जोखिम लाएगा। उनका मानना है कि सबसे बड़ी समस्या यह है कि मॉडल प्रशिक्षण द्वारा अवशोषित गोपनीय जानकारी भविष्य में विभिन्न उपयोगकर्ताओं द्वारा पूछताछ या कॉल किए जाने पर "पुनः सामने" आ सकती है। यह विशेष रूप से खतरनाक है जब सुरक्षा के विभिन्न स्तरों और विभिन्न खुफिया जरूरतों के साथ कई सेवाओं या सेवाओं में मॉडलों का एक सेट साझा किया जाता है।

उदाहरण के लिए, मेहता ने कहा कि यदि किसी मॉडल के पास अत्यधिक संवेदनशील मानव खुफिया जानकारी तक पहुंच है, जैसे कि एक गुप्त संचालक की पहचान, तो वह जानकारी गलती से सेना की किसी अन्य शाखा को "लीक" हो सकती है, जब मॉडल का उपयोग सेना की किसी अन्य शाखा द्वारा किया जाता था, जिसके पास पहुंच नहीं थी। इससे न केवल खुफिया स्रोतों और अग्रिम पंक्ति के कर्मियों के लिए जीवन या मृत्यु का खतरा पैदा होगा, बल्कि इसे पूरी तरह से रोकना तकनीकी रूप से भी मुश्किल होगा, खासकर जब एक ही मॉडल कई इकाइयों द्वारा साझा किया जाता है। इसके विपरीत, उनका मानना है कि सेना के भीतर गोपनीय जानकारी को "लॉक" करना और इसे खुले इंटरनेट या एआई कंपनियों में वापस प्रवाहित होने से बचाना अपेक्षाकृत आसान है।

वर्तमान में, अमेरिकी सरकार ने कुछ प्रासंगिक बुनियादी ढांचे की स्थापना की है: उदाहरण के लिए, सुरक्षा कंपनी पलान्टिर को सरकार के लिए एक सुरक्षा प्रणाली बनाने के लिए कई बड़े पैमाने पर अनुबंध प्राप्त हुए हैं जो एआई कंपनियों को जानकारी वापस किए बिना गोपनीय विषयों पर सवालों और जवाब दे सकते हैं। इन प्रणालियों में, अधिकारी वर्गीकृत सामग्री के बारे में मॉडल से सवाल कर सकते हैं, जबकि डेटा एक नियंत्रित वातावरण तक ही सीमित है। हालाँकि, समान सुरक्षा वास्तुकला को प्रशिक्षण में लागू करना, न कि केवल अनुमान लगाने और प्रश्न उत्तर देने में, एक नई तकनीकी और प्रबंधन चुनौती बनी हुई है।

इस साल जनवरी में, रक्षा सचिव पीट हेगसेथ ने एक ज्ञापन जारी कर इस क्षेत्र में पेंटागन के रेसिंग लेआउट को बढ़ावा देने के लिए पूरे रक्षा प्रणाली में अधिक एआई क्षमताओं की शुरूआत में तेजी लाने का आग्रह किया। जेनरेटिव एआई का उपयोग वास्तविक युद्ध में किया गया है, जैसे संभावित लक्ष्यों की रैंकिंग करना और प्राथमिकता वाले हमले के सुझाव देना। इसका उपयोग प्रशासनिक कार्यों जैसे अनुबंध लिखने और रिपोर्ट व्यवस्थित करने में भी किया गया है। रक्षा क्षेत्र के परिप्रेक्ष्य से, मूल रूप से मानव विश्लेषकों द्वारा किए जाने वाले कई कार्य भविष्य में मजबूत एआई मॉडल पर निर्भर हो सकते हैं, लेकिन इसका मतलब यह भी है कि बड़ी मात्रा में गोपनीय डेटा को मॉडलों के लिए खोला जाना चाहिए।

मेहता ने कहा कि सेना शायद चाहती है कि एआई कुछ सूक्ष्म निर्णय सीखे जो अनुभव पर बहुत अधिक निर्भर करते हैं, जैसे कि एक वरिष्ठ विश्लेषक की तरह छवियों में अत्यंत सूक्ष्म सुरागों की पहचान करना, या नई प्राप्त खुफिया जानकारी और ऐतिहासिक जानकारी के बीच जटिल संबंध बनाना। इस प्रयोजन के लिए, ख़ुफ़िया एजेंसियों का विशाल और बहुभाषी पाठ, ऑडियो, छवि और वीडियो डेटा प्रशिक्षण सामग्री के स्रोत बन सकते हैं। हालाँकि, उन्होंने इस बात पर भी जोर दिया कि बाहरी दुनिया को यह समझाना मुश्किल है कि किन विशिष्ट कार्यों के लिए गोपनीय डेटा पर प्रशिक्षण की आवश्यकता होती है, क्योंकि रक्षा विभाग के पास अपनी विशिष्ट क्षमताओं को गुप्त रखने के लिए एक मजबूत प्रोत्साहन है और वह नहीं चाहता है कि अन्य देश इस क्षेत्र में संयुक्त राज्य अमेरिका की तकनीकी सीमाओं को सटीक रूप से समझें।

बाहरी दुनिया की नजर में, पेंटागन का कदम न केवल अग्रिम पंक्ति की जरूरतों का जवाब है, बल्कि एक उच्च जोखिम वाली प्रौद्योगिकी शर्त भी है: एक बार जब गोपनीय खुफिया जानकारी बड़े मॉडलों में गहराई से अंतर्निहित हो जाती है, तो सेना को स्वचालित विश्लेषण और निर्णय लेने में सहायता क्षमताएं प्राप्त होंगी जो पारंपरिक प्रणालियों से कहीं अधिक हैं। हालाँकि, इसे अत्यधिक मॉडल "मेमोरी", आकस्मिक लीक और धुंधली पहुंच सीमाओं जैसे नए सुरक्षा जोखिमों का भी सामना करना पड़ेगा। वर्तमान में, अमेरिकी रक्षा एजेंसियां "सैन्य लाभ प्राप्त करने" और "सुरक्षा जोखिमों को नियंत्रित करने" के बीच एक संतुलन खोजने की कोशिश कर रही हैं, जिसे अत्यधिक पृथक सुरक्षित डेटा केंद्र, सख्त पहुंच नियंत्रण और स्तरित और अनुकूलित मॉडल परिनियोजन विधियों की स्थापना करके व्यवहार में पूरी तरह से परीक्षण नहीं किया गया है।