OpenAI अपने नवीनतम टेक्स्ट-टू-इमेज जनरेटर को अधिक व्यापक रूप से लॉन्च कर रहा है। गुरुवार को कंपनी नए DALL-E3 मॉडल को चैटजीपीटी एप्लिकेशन में चैटजीपीटीप्लस और एंटरप्राइज ग्राहकों के लिए उपयोग के लिए उपलब्ध कराएगी। OpenAI ने कहा कि उसने मॉडल के लिए एक सुरक्षा शमन स्टैक तैयार किया है, जिससे उसे अपनी रिलीज़ का विस्तार करने की अनुमति मिल गई है।

DALL-E3 पहली बार पिछले महीने जारी किया गया था, और OpenAI ने दिखाया कि छवि जनरेटर द्वारा उपयोग के लिए उपयोगकर्ताओं को लंबे समय तक, अधिक दृश्य वर्णनात्मक संकेतों को लिखने के लिए ChatGPT का लाभ उठाने की अनुमति देकर पिछले DALL-E2 में कैसे सुधार हुआ। DALL-E3 को बिंग चैट और बिंग इमेज जेनरेटर में जोड़ा गया, जिससे माइक्रोसॉफ्ट का प्लेटफ़ॉर्म जनता के लिए व्यापक मॉडल एक्सेस प्रदान करने वाला पहला प्लेटफ़ॉर्म बन गया - चैटजीपीटी से भी पहले।

हानिकारक इमेजरी को कम करने के लिए विज्ञापित सुरक्षा उपाय हमेशा काम नहीं करते थे, उपयोगकर्ताओं ने वर्ल्ड ट्रेड सेंटर की छवियां बनाईं जिनमें स्पंजबॉब स्क्वेयरपैंट और अन्य पात्र इमारतों की ओर विमान उड़ा रहे थे। हालाँकि Microsoft ने कुछ संकेतों को अवरुद्ध करने का प्रयास किया है, अन्य सरल समाधानों ने समान परिणाम उत्पन्न किए हैं।

टेक्स्ट-टू-इमेज जेनरेटर जैसे मिडजॉर्नी, स्टेबलडिफ्यूजन और DALL-E के पुराने संस्करण सभी विवाद का कारण बने हैं। प्रौद्योगिकी ने कॉपीराइट छवि सामग्री, गैर-सहमति वाली नग्नता, नस्ल बदलने वाले विषयों और सार्वजनिक हस्तियों की फोटोयथार्थवादी गलतबयानी का निर्यात किया है।

ओपनएआई ने इस बार व्यापक दृष्टिकोण का वादा किया है और DALL-E3 पर किए गए शोध को प्रदर्शित करने वाली एक वेबसाइट प्रदान की है। कंपनी का कहना है कि यह "इस संभावना को सीमित कर देगा कि मॉडल जीवित कलाकारों और सार्वजनिक हस्तियों की छवियों द्वारा स्टाइल की गई सामग्री तैयार करेंगे, और उत्पन्न छवियों के जनसांख्यिकीय प्रतिनिधित्व में सुधार करेंगे।" OpenAI में एक आंतरिक "प्रोवेंस क्लासिफायर" टूल भी है, जिसके बारे में उसका कहना है कि यह यह पता लगाने में 99% सटीक है कि कोई छवि DALL-E3 द्वारा बनाई गई थी या नहीं।