यह अनुचित नहीं है कि AI, AI को हरा नहीं सकता। हाल ही में, एआई डिटेक्शन उपकरण लाखों लोगों द्वारा देखी गई मृत शिशुओं की तस्वीरों का लगातार उत्तर देने में असमर्थ थे। AI पिक्चर डिटेक्टर फिर से विकसित किया गया है! हाल ही में, मध्य पूर्व में संघर्षों की बड़ी संख्या में तस्वीरें इंटरनेट पर सामने आई हैं, जिससे दुनिया को पता चलता है कि ऐसी विषम परिस्थितियों में जीवन कितना नाजुक और असहाय है।
उनमें से, एक "जले हुए बच्चे" की तस्वीर इतनी क्रूर है कि उस पर विश्वास नहीं किया जा सकता।
तो, किसी ने यह पता लगाने के लिए तस्वीरों को एआई पिक्चर डिटेक्टर में डाल दिया कि क्या ये तस्वीरें एआई द्वारा उत्पन्न की गई थीं।
निश्चित रूप से, इस तस्वीर की पहचान एआई डिटेक्टर - ऑप्टिक द्वारा "एआई जनरेटेड" के रूप में की गई थी।
4chan पर, एक "मूल चित्र" भी था जहां मूल लाश वास्तव में एक कुत्ते की थी।
इसलिए नेटिज़न्स ने गुस्से में पोस्टर के ट्वीट के नीचे टिप्पणियाँ छोड़ दीं, और झूठी प्रलय के दिन की दहशत फैलाने के लिए एआई-जनरेटेड तस्वीरों का उपयोग करने के लिए उन पर हमला किया।
यह ट्वीट, जो मानता है कि फोटो AI द्वारा तैयार की गई थी, 2 दिनों से भी कम समय में 21 मिलियन बार पढ़ा गया है।
लेकिन जल्द ही नेटिज़न्स को पता चला कि उन्होंने तस्वीरें एक ही एआई डिटेक्टर पर डाल दी हैं, और एआई और इंसानों दोनों द्वारा पता लगाने के परिणाम लगभग यादृच्छिक थे।
किसी ने पता लगाया कि जब तक एक ही तस्वीर को क्रॉप किया जाता है या पृष्ठभूमि का रंग काले और सफेद में बदल दिया जाता है, तब तक डिटेक्टर सोचेगा कि तस्वीर एक इंसान द्वारा ली गई थी।
यहां तक कि कभी-कभी जब डिटेक्टर "सिक्का उछालता है", तो सिक्का खड़ा हो जाएगा...
तो क्या यह चित्र AI द्वारा तैयार किया गया था?
अंत में, एआई डिटेक्टर अधिकारी ने भी इस घटना के बारे में ट्वीट किया, यह मानते हुए कि उनके पास यह निर्धारित करने का कोई तरीका नहीं था कि छवि एआई द्वारा बनाई गई थी, और उम्मीद थी कि हर कोई इस पर तर्कसंगत रूप से चर्चा करेगा।
AI इमेज डिटेक्टर कितना अविश्वसनीय है?
यूसी बर्कले के प्रोफेसर और डिजिटल इमेज प्रोसेसिंग पर दुनिया के अग्रणी विशेषज्ञों में से एक हनी फरीद ने कहा कि इस छवि में ऐसा कुछ भी नहीं है जो यह दर्शाता हो कि यह एआई द्वारा उत्पन्न किया गया था।
फरीद ने कहा, "एआई छवि जनरेटर के साथ सबसे बड़ी समस्याओं में से एक अत्यधिक संरचित आकार और सीधी रेखाएं हैं।" "यदि आप टेबल के पैर और स्क्रू देखते हैं और सब कुछ सही दिखता है, तो यह लगभग असंभव है कि छवि एआई द्वारा बनाई गई थी।"
उदाहरण के लिए, इस प्रसिद्ध "स्पंजबॉब स्क्वेयरपैंट्स मेड 9/1" चित्र में, खिड़की के बाहर ट्विन टावर्स की रेखाएँ सीधी नहीं हैं, और विमान के डैशबोर्ड सभी एक साथ मुड़े हुए हैं। यह "ए में ए" दिखता है।
फरीद ने कहा, "हम उस तस्वीर में देख पाए कि वस्तु की संरचना सटीक थी, छायांकन सटीक था, और कोई कलाकृतियाँ नहीं थीं - जिससे मुझे विश्वास हुआ कि तस्वीर पूरी तरह से वास्तविक होनी चाहिए।"
फ़रीद ने अपने स्वयं के अन्य एआई छवि डिटेक्टरों के माध्यम से छवि को भी पहचाना, और चार अन्य एआई छवि पहचान उपकरण भी सहमत हुए कि छवि एआई-जनरेटेड नहीं थी।
फरीद ने कहा, "एआई डिटेक्टर एक उपकरण है, लेकिन यह टूलकिट का केवल एक हिस्सा है। उपयोगकर्ता को पूरी छवि पर परीक्षणों की एक श्रृंखला चलाने की आवश्यकता होती है, और केवल एक बटन दबाना और उत्तर प्राप्त करना असंभव है।"
एआई डिटेक्शन टूल ऑप्टिक अपनी डिटेक्शन तकनीक का विशिष्ट विवरण नहीं देता है।
ऑप्टिक वेबसाइट यह भी बताती है कि "एआई डिटेक्टर गलत परिणाम दे सकते हैं।"
एआई इमेज डिटेक्शन तकनीक
प्रोफेसर फरीद ने पिछले साल एक पेपर लिखा था जिसमें बताया गया था कि एआई मैपिंग टूल द्वारा उत्पादित छवियों की स्थिरता का आकलन कैसे किया जाए।
छवि पर स्थिरता का आकलन करके, यह निर्धारित करने में मदद मिल सकती है कि छवि एआई द्वारा बनाई गई थी या नहीं।
पेपर लिंक: https://arxiv.org/abs/2206.14617?ref=404media.co
प्रोफेसर विश्लेषण के तीन संबंधित भौतिक आधारित तरीकों की रूपरेखा तैयार करके शुरू करते हैं, जिनमें से प्रत्येक छवि निर्माण प्रक्रिया में निहित परिप्रेक्ष्य ज्यामिति के समान मौलिक सिद्धांतों का उपयोग करता है।
लोपी बिन्दु
समानांतर घटती रेखाएँ एक लुप्त बिंदु पर एकत्रित होती हैं।
चित्र 1(ए) में टाइलों के बीच की रेखाएँ समानांतर हैं। जब छवि बनाई जाती है, तो ये सभी रेखाएँ एक लुप्त बिंदु पर एकत्रित हो जाती हैं। यदि किसी दृश्य में समानांतर रेखाएं गहराई के हिसाब से कैमरे से दूर हैं, तो एक लुप्त बिंदु मौजूद होता है, हालांकि यह छवि के बाहर गिर सकता है।
यदि किसी दृश्य में समानांतर रेखाएं गहराई में नहीं जाती हैं, अर्थात, यदि वे लेंस सेंसर (किसी भी दूरी पर) के बिल्कुल समानांतर हैं, तो समानांतर रेखाओं को समानांतर रेखाओं के रूप में चित्रित किया जाएगा, और व्यावहारिक उद्देश्यों के लिए लुप्त बिंदु को अनंत पर माना जा सकता है। यह ज्यामिति परिप्रेक्ष्य प्रक्षेपण की मूल बातों से उत्पन्न होती है।
परिप्रेक्ष्य प्रक्षेपण के तहत, दृश्य में बिंदु (X, Y, Z) को बिंदु (fX/Z, fY/Z) पर चित्रित किया जाता है, जहां f लेंस की फोकल लंबाई है।
चूँकि छवि में एक बिंदु की स्थिति दूरी Z के व्युत्क्रमानुपाती होती है, प्रक्षेपित बिंदु दूरी के फलन के रूप में संकुचित होते हैं, जिससे छवि में रेखाएँ एकत्रित हो जाती हैं;
2. समानान्तर तलों पर समांतर रेखाएँ एक ही लुप्त बिंदु पर एकत्रित होती हैं
चित्र 1(बी) में दूर का बॉक्स फर्श पर टाइलों के साथ संरेखित है ताकि बॉक्स के किनारे टाइल्स के बीच की रेखा के समानांतर हों। चूँकि समानांतर तलों पर समानांतर रेखाएँ एक लुप्त बिंदु साझा करती हैं, बॉक्स के किनारों और टाइल फर्श के लुप्त बिंदु समान होते हैं;
3. समतल पर सभी सीधी रेखाओं के लुप्त बिंदु लुप्त रेखा पर स्थित होते हैं।
समानांतर रेखाओं के कई समूह हैं, समानांतर रेखाओं का प्रत्येक समूह अलग-अलग लुप्त बिंदुओं पर परिवर्तित होता है, जैसा चित्र 1(सी) में दिखाया गया है। यदि समानांतर रेखाओं का एक समूह दृश्य में एक ही तल पर फैला हो, तो उनके लुप्त बिंदु लुप्त रेखा पर होंगे। लुप्त रेखा की दिशा समानांतर रेखा द्वारा फैलाए गए समतल के सापेक्ष लेंस के घूमने से निर्धारित होती है
छाया
कुछ हद तक आश्चर्य की बात है कि लुप्त बिंदुओं के पीछे की वही ज्यामिति छाया डालने के लिए भी काम करती है।
ऊपर की छवि बॉक्स पर बिंदुओं को जोड़ने वाली तीन किरणों और डाली गई छाया पर उनके संबंधित बिंदुओं को दिखाती है। छवि सीमा का विस्तार करने के बाद, यह पाया गया कि ये तीन किरणें एक बिंदु पर प्रतिच्छेद करती हैं, जो दृश्य को रोशन करने वाले प्रकाश स्रोत के प्रक्षेपण से मेल खाती है।
छाया, वस्तुओं और रोशनी पर यह ज्यामितीय बाधा यह रखती है कि प्रकाश स्रोत पास में है (डेस्क लैंप) या दूर है (सूर्य), और सतह की स्थिति और अभिविन्यास की परवाह किए बिना जिस पर छाया डाली जाती है।
बेशक, यह विश्लेषण मानता है कि दृश्य एक प्राथमिक प्रकाश स्रोत द्वारा प्रकाशित है, जैसा कि प्रति वस्तु केवल एक ही डाली गई छाया की उपस्थिति से स्पष्ट है।
उपरोक्त उदाहरण में, दृश्य को रोशन करने वाला प्रकाश स्रोत लेंस के सामने है, इसलिए प्रकाश स्रोत का प्रक्षेपण छवि तल के ऊपरी आधे भाग में है।
हालाँकि, यदि प्रकाश लेंस के पीछे है, तो प्रकाश स्रोत का प्रक्षेपण छवि तल के निचले आधे हिस्से में होगा। इस उलटाव के कारण, वस्तु बाधाओं की छाया भी उलटी होनी चाहिए।
इसलिए, किसी छवि के कास्ट शैडो विश्लेषण में तीन संभावनाओं पर विचार करना चाहिए:
(1) प्रकाश लेंस के सामने स्थित है, प्रकाश स्रोत का प्रक्षेपण छवि तल के ऊपरी भाग में स्थित है, और बाधाएं डाली गई छाया पर टिकी हुई हैं और वस्तु को घेरती हैं;
(2) प्रकाश लेंस के पीछे है, और प्रकाश स्रोत का प्रक्षेपण छवि तल के निचले आधे हिस्से पर है, जिसमें बाधाएं वस्तु से जुड़ी हुई हैं और डाली गई छाया के आसपास हैं;
(3) प्रकाश किरण सीधे लेंस के केंद्र के ऊपर या नीचे स्थित होती है, और प्रकाश स्रोत का प्रक्षेपण अनंत पर स्थित होता है, और बाधाएं अनंत पर प्रतिच्छेद करेंगी। यदि इनमें से किसी भी स्थिति के परिणामस्वरूप सभी बाधाओं का एक सामान्य प्रतिच्छेदन होता है, तो छाया डालना शारीरिक रूप से उचित है।
प्रतिबिंब
नीचे चित्र 2 में दिखाया गया दृश्य एक समतल दर्पण में प्रतिबिंबित तीन बक्सों का है।
इस चित्र का निचला भाग वास्तविक और आभासी बक्सों के बीच ज्यामितीय संबंध को दर्शाता है।
नारंगी रेखा दर्पण का प्रतिनिधित्व करती है, जो बक्सों के दो सेटों के बीच में स्थित है। पीली रेखाएँ वास्तविक और आभासी बक्सों पर संगत बिंदुओं को जोड़ती हैं। रेखाएँ एक दूसरे के समानांतर और दर्पण के लंबवत होती हैं।
अब विचार करें कि दृश्य पर आरोपित होने पर ये समानांतर रेखाएँ कैसी दिखाई देती हैं। दर्पण के तल से देखने पर जो रेखाएँ समानांतर होती हैं, वे अब समानांतर नहीं रहतीं। इसके बजाय, परिप्रेक्ष्य प्रक्षेपण के कारण, ये समानांतर रेखाएं एक बिंदु पर परिवर्तित हो जाती हैं, जैसे दुनिया में समानांतर रेखाएं एक लुप्त बिंदु पर परिवर्तित हो जाती हैं।
चूँकि दृश्य में संगत बिंदुओं को जोड़ने वाली रेखाएँ और उनके प्रतिबिंब हमेशा समानांतर होते हैं, इसलिए भौतिक रूप से उचित होने के लिए इन रेखाओं का छवि में एक सामान्य प्रतिच्छेदन बिंदु होना चाहिए।
केस विश्लेषण
ऊपर चित्र 3 फर्श और काउंटर टॉप की ज्यामितीय परिप्रेक्ष्य स्थिरता के विश्लेषण के साथ एआई-संश्लेषित छवियों के तीन प्रतिनिधि उदाहरण दिखाता है।
प्रत्येक छवि लगातार गायब होने वाले बिंदुओं (नीले रंग में प्रस्तुत) के प्रमाण के रूप में टाइल फर्श के परिप्रेक्ष्य ज्यामिति को सटीक रूप से (कुछ पिक्सेल के भीतर) कैप्चर करती है। हालाँकि, समानांतर मेसा का लुप्त बिंदु (सियान में दिखाया गया है) ज्यामितीय रूप से मेसा के लुप्त बिंदु के अनुरूप नहीं है।
टाइल्स को तदनुसार संरेखित करें। भले ही काउंटरटॉप टाइल के समानांतर न हो, सियान लुप्त बिंदु को टाइल फर्श के लुप्त बिंदु द्वारा परिभाषित लुप्त रेखा (लाल रंग में प्रस्तुत) पर स्थित होना चाहिए। ध्यान दें कि चित्र 3 के ऊपरी दाएं कोने में छवि के लिए, टाइल फर्श पर क्षैतिज रेखाएं लगभग समानांतर हैं, इसलिए संबंधित लुप्त बिंदु अनंत पर हैं और इसलिए एक दूसरे को नहीं काटते हैं।
हालाँकि इन छवियों में लुप्त बिंदु स्थानीय रूप से सुसंगत हैं, वे विश्व स्तर पर सुसंगत नहीं हैं। 25 समग्र रसोई छवियों में से प्रत्येक में एक ही पैटर्न पाया गया।
ऊपर दी गई तस्वीर शीघ्र शब्दों का उपयोग करके बनाई गई एक ब्लॉक तस्वीर है। छाया में विसंगतियाँ स्पष्ट हैं।
उपरोक्त चित्र 8 एआई-जनित छवि पर ज्यामितीय विश्लेषण लागू करने का परिणाम दिखाता है जिसमें प्रतिबिंब शामिल हैं जो काफी सटीक प्रतीत होते हैं।
हालाँकि ये प्रतिबिंब देखने में तो ध्वनियुक्त लगते हैं, लेकिन ये ज्यामितीय रूप से सुसंगत नहीं होते हैं।
पिछले अनुभागों में डाली गई छायाओं और ज्यामितीय संरचनाओं के विपरीत, DALL·E-2 को उचित प्रतिबिंबों को संश्लेषित करने में कठिनाई होती है, संभवतः क्योंकि ऐसे प्रतिबिंब इसके प्रशिक्षण छवि डेटासेट में कम आम हैं।
एआई-जनित छवियों की सीमाओं की इस समझ के आधार पर, छवि स्थिरता का पता लगाना यह निर्धारित करने में बहुत सहायक हो सकता है कि छवि एआई द्वारा संश्लेषित की गई थी या नहीं।
छवि पहचानना कठिन है, AI AI को मात देता है
एआई छवि जनरेटर लगातार विकसित हो रहा है।
वर्ष की पहली छमाही में, मिडजर्नी लोकप्रिय हो गया। यह पर्याप्त यथार्थवादी चित्र उत्पन्न करने में सक्षम था, लेकिन इसने कई लोगों को मूर्ख बनाया।
86 वर्षीय पोप एक सफेद तरबूज टोपी, एक घंटी मुंह के साथ एक सफेद डाउन जैकेट, एक धातु क्रॉस हार, और एक गंभीर अभिव्यक्ति पहनते हैं।
उस समय, एक बार जब यह तस्वीर जारी हुई, तो इसने सोशल मीडिया पर सभी को धोखा दिया और कई नेटिज़न्स द्वारा इसे बेतहाशा अग्रेषित किया गया। कुछ लोगों ने तो पोप को बहुत फैशनेबल भी कहा।
जब सभी ने इसे सच मान लिया, तो किसी ने अचानक बताया कि यह एआई द्वारा उत्पन्न किया गया था, और कई लोग तुरंत चकित रह गए।
यह सिर्फ उनमें से एक है। मस्क की नई प्रेमिका, जीएम सीईओ बर्रा आदि की कई झूठी और प्रसारित तस्वीरें भी हैं, जो इस हद तक पहुंच गई हैं कि वे पूरी तरह से नकली हैं।
इस घटना ने सीधे तौर पर मस्क और एप्पल के सह-संस्थापक स्टीफन वोज्नियाक जैसे प्रौद्योगिकी नेताओं से एआई अनुसंधान और विकास को निलंबित करने के लिए कॉल शुरू कर दी।
हालाँकि AI पीढ़ी मज़ेदार और सुविधाजनक है, लेकिन यह पूरे उद्योग के लिए जोखिम लाती है।
यदि यह पर्याप्त छोटा नहीं है, तो इसका उपयोग गलत उद्देश्यों वाले लोगों द्वारा गलत जानकारी फैलाने, बौद्धिक संपदा अधिकारों का उल्लंघन करने, या "नकली तस्वीरें" बनाने आदि के लिए किया जाएगा।
अगले कुछ महीनों में, मिडजॉर्नी नवीनतम V6 संस्करण जारी करेगा। वर्तमान V5 संस्करण छवि निर्माण के यथार्थवाद में बहुत उत्तम रहा है।
अन्य एआई छवि जनरेटर भी तेजी से पुनरावृत्त हो रहे हैं। कुछ समय पहले, OpenAI ने हाल ही में DALL·E3 जारी किया था। उसी समय, माइक्रोसॉफ्ट बिंग इमेज जेनरेशन ने भी DALL·E3 का उपयोग किया।
बेशक, शोधकर्ता ऐसे उपकरण बनाने के लिए भी कड़ी मेहनत कर रहे हैं जो छवियों की पहचान कर सकें। मुख्य बात यह है कि एआई छवि जनरेटर के निरंतर उन्नयन को कैसे बनाए रखा जाए?
एआई डिटेक्शन टूल प्रतियोगिता
अब, एक दर्जन से अधिक कंपनियां यह पहचानने के लिए उपकरण उपलब्ध करा रही हैं कि छवियां एआई द्वारा उत्पन्न की गई हैं या नहीं। उनके नामों में सेंसिटीएआई (डीप फेक डिटेक्शन), फिक्टिटियस.एआई (साहित्यिक चोरी का पता लगाना), ओरिजनैलिटी.एआई आदि शामिल हैं।
कृत्रिम बुद्धिमत्ता ट्रस्ट और सुरक्षा कंपनी ऑप्टिक ने एक "AIorNot" वेबसाइट लॉन्च की है।
इस वेबसाइट पर, आप फ़ोटो अपलोड कर सकते हैं या छवि URL पेस्ट कर सकते हैं, और वेबसाइट स्वचालित रूप से निर्धारित करेगी कि फ़ोटो AI द्वारा बनाई गई थी या नहीं। आपके द्वारा अपलोड की जा सकने वाली छवियों की संख्या की कोई सीमा नहीं है।
वैकल्पिक रूप से, आप ऑप्टिक के ट्विटर अकाउंट @optic_xyz पर एक छवि पोस्ट या रीट्वीट कर सकते हैं, या #aiornot जोड़ सकते हैं, और आपको छवि के विश्वास प्रतिशत सहित एक उत्तर मिलेगा।
कंपनी के सीईओ एंड्री डोरोनिचव ने कहा कि ऑप्टिक के एआई उपकरण मानव आंखों के लिए अदृश्य कलाकृतियों, जैसे छवि में चमक और रंग में बदलाव, के लिए प्रत्येक छवि की जांच कर सकते हैं।
आश्चर्यजनक रूप से, टूल की सटीकता 95% है।
हालाँकि, मिडजॉर्नी जैसे एआई इमेज जेनरेशन टूल के अपग्रेड और पुनरावृत्ति के साथ, "एआईओरनॉट" की सटीकता गिरकर 88.9% हो गई है।
उदाहरण के लिए, पोप की इस तस्वीर के लिए, एआई का मानना है कि 87% संभावना है कि यह किसी इंसान द्वारा बनाई गई है।
सफ़ेद डाउन जैकेट में पोप की छवि ऑप्टिक अपडेट से पहले मूर्ख बन गई
वास्तव में, कुछ नेटिज़न्स ने कहा कि यदि आप इस तस्वीर को ध्यान से देखेंगे, तो आपको कृत्रिम बुद्धिमत्ता पीढ़ी के स्पष्ट संकेत मिलेंगे, जिनमें कई स्पष्ट रूप से धुंधले विवरण क्षेत्र शामिल हैं:
-एक अधूरा सा हाथ किसी ऐसी चीज को पकड़ने की कोशिश कर रहा है जो कॉफी कप की तरह नहीं दिखती है, जिसके किनारे पर दाग हैं
-पोप द्वारा पहना गया क्रॉस समकोण के आकार का नहीं है। इसमें मिट्टी से बना हुआ बैठा हुआ यीशु भी है।
-चश्मा चेहरे के रंग से मेल नहीं खाता
ये सभी बिंदु दर्शाते हैं कि यह कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न किया गया है। यह केवल वास्तविकता की सतह को समझता है, लेकिन उन मूलभूत नियमों को नहीं जो यह नियंत्रित करते हैं कि भौतिक वस्तुएं कैसे परस्पर क्रिया करती हैं।
ऑप्टिक के टूल के अलावा, सामग्री में टैग जोड़ने वाली एक कृत्रिम बुद्धिमत्ता कंपनी, हाइव ने हाल ही में अपने स्वयं के मुफ्त एआई-जनित सामग्री डिटेक्टर को अपडेट किया है।
इस AI टूल को DALL-E, स्टेबलडिफ्यूजन और मिडजर्नी की लाखों छवियों पर प्रशिक्षित किया गया था।
हाइव का अनुमान है कि यह लगभग 95% एआई-जनित छवियों का सटीक रूप से पता लगा सकता है, विशेष रूप से साझा की गई छवियां जो ऑनलाइन वायरल हो जाती हैं, अक्सर अन्य छवि पहचान परिणामों से बेहतर होती हैं।
सीईओ केविन गुओ ने कहा कि जब लोग कृत्रिम बुद्धिमत्ता वाली छवियां साझा करते हैं, तो वे सबसे यथार्थवादी नकली छवियां चुनेंगे, ताकि लोग आसानी से पहचान सकें कि वास्तविक क्या है।
बाईं ओर की छवि एक एआई-जनरेटेड छवि है जिसे दो उंगलियों और एक अजीब हाई-फाइव द्वारा पहचाना जा सकता है, जबकि यह वास्तव में एक नियमित आईस्टॉक फोटो में दाईं ओर की छवि जैसा दिखता है।
ऑप्टिक की तरह, हाइव भी बिंग इमेजक्रिएटर से छवियों का पता लगाने में विफल रहा।
हालाँकि, ये पता लगाने वाले उपकरण स्थिर नहीं रहते हैं। एआई छवि एकीकरण मॉडल के पुनरावृत्त होते ही उन्हें अद्यतन और उन्नत किया जाएगा।
वास्तव में, एआई छवि पहचान केवल उद्योग में पहचान उपकरणों पर निर्भर नहीं रह सकती है। मॉडल प्रशिक्षण के दौरान रेलिंग स्थापित की जानी चाहिए।
कई कृत्रिम बुद्धिमत्ता छवि जनरेटरों में एक "ब्लैकलिस्ट" भी होती है जो सीमित करती है कि कुछ सामग्री उत्पन्न की जा सकती है या नहीं।
उदाहरण के लिए, बिंग इमेजक्रिएटर प्रसिद्ध सार्वजनिक हस्तियों की छवियां बनाने के लिए कहने वाले उपयोगकर्ता के संकेतों को फ़्लैग और ब्लॉक कर देगा।
मिडजॉर्नी में "मानव मॉडरेटर" हैं और यह उपयोगकर्ता अनुरोधों को एल्गोरिदमिक रूप से मॉडरेट करने का एक तरीका पेश कर रहा है।
एक DALL·E3 तकनीकी रिपोर्ट भी है जिसमें कहा गया है कि जब आप चैटजीपीटी से कुछ "फल चित्र" या काले और सफेद लोगों से जुड़े चित्र बनाने के लिए कहते हैं, तो इनपुट प्रॉम्प्ट सीधे फिर से लिखा जाएगा।
AI में वॉटरमार्क जोड़ें, बड़े निर्माता यह कर रहे हैं
इसके अलावा, जेनरेटर एआई की सुरक्षा बढ़ाने के लिए डिजिटल वॉटरमार्किंग भी महत्वपूर्ण साधनों में से एक है। Microsoft और Google जैसे प्रौद्योगिकी दिग्गज पहले ही अपने उत्पादों में इसका उपयोग कर चुके हैं।
माइक्रोसॉफ्ट ने सितंबर में सरफेस कॉन्फ्रेंस में DALL E3 द्वारा संचालित छवियां उत्पन्न करने की बिंग की क्षमता पेश की।
साथ ही, यह सुनिश्चित करने के लिए कि छवियों का दुरुपयोग न हो, Microsoft टीम निर्माण के समय और तारीख सहित प्रत्येक छवि के लिए अदृश्य वॉटरमार्क उत्पन्न करने के लिए एन्क्रिप्शन विधियों का उपयोग करती है।
कोई भी व्यक्ति प्रत्येक छवि पर क्लिक कर सकता है और आसानी से पहचान सकता है कि यह एआई द्वारा तैयार की गई है या नहीं।
मेटा में ओपन सोर्स स्टेबलसिग्नेचर भी है, जो एआई द्वारा स्वचालित रूप से उत्पन्न छवियों में सीधे डिजिटल वॉटरमार्क एम्बेड कर सकता है।
पेपर का पता: https://arxiv.org/pdf/2303.15435.pdf
यह उल्लेखनीय है कि स्टेबलसिग्नेचर द्वारा उत्पन्न डिजिटल वॉटरमार्क क्रॉपिंग, संपीड़न और रंग परिवर्तन जैसे विनाशकारी कार्यों से प्रभावित नहीं होता है, और इसे छवि के मूल स्रोत पर वापस खोजा जा सकता है।
इसे डिफ्यूजन, GAN और अन्य मॉडलों, जैसे स्टेबलडिफ्यूजन, पर लागू किया जा सकता है।
Google ने वॉटरमार्क और AI-जनित छवियों का पता लगाने और पहचानने के लिए Google क्लाउड नेक्स्ट पर SynthID भी जारी किया।
सिंथआईडी दो गहन शिक्षण मॉडल का उपयोग करता है, एक वॉटरमार्किंग के लिए और एक पहचान के लिए। उन्हें छवियों के विभिन्न सेट पर एक साथ प्रशिक्षित किया जा सकता है।
संयुक्त मॉडल को कई लक्ष्यों के लिए अनुकूलित किया गया है, जिसमें वॉटरमार्क सामग्री की सही पहचान करना और वॉटरमार्क को मूल सामग्री के साथ सहज रूप से संरेखित करके वॉटरमार्क छुपाने में सुधार करना शामिल है।
SynthID द्वारा उत्पन्न डिजिटल वॉटरमार्क सीधे छवि के पिक्सेल में एम्बेडेड होता है और मानव आंखों के लिए अदृश्य होता है। लेकिन SynthID उनका पता लगा सकता है और उनकी पहचान कर सकता है।
SynthID इस संभावना का आकलन करने में मदद कर सकता है कि छवि Imagen द्वारा बनाई गई थी
कैलिफोर्निया विश्वविद्यालय, रिवरसाइड में इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग के प्रोफेसर अमित रॉय-चौधरी ने कहा कि छवि पृष्ठभूमि को ध्यान से देखकर, हम अपनी आंखों से नकली छवियों का बेहतर पता लगा सकते हैं।
हालाँकि, AI मॉडल की बढ़ती पुनरावृत्ति के साथ, "चकाचौंध भरी आँख" रखना बहुत मुश्किल है।