मंगलवार को एक लाइवस्ट्रीम के दौरान, ओपनएआई के सीईओ सैम ऑल्टमैन ने एक साल से अधिक समय में चैटजीपीटी की छवि निर्माण क्षमताओं में पहले बड़े अपग्रेड की घोषणा की। ChatGPT अब छवियों और तस्वीरों को मूल रूप से बनाने और संशोधित करने के लिए कंपनी के GPT-4o मॉडल का लाभ उठा सकता है। GPT-4o लंबे समय से कृत्रिम बुद्धिमत्ता चैटबॉट प्लेटफ़ॉर्म का आधार रहा है, लेकिन अब तक यह मॉडल केवल टेक्स्ट उत्पन्न और संपादित कर सकता था, चित्र नहीं।

ऑल्टमैन ने कहा कि GPT-4o नेटिव इमेज जेनरेशन अब ChatGPT और OpenAI के AI वीडियो जेनरेशन उत्पाद सोरा में लाइव है, जो कंपनी के $200 प्रति माह प्रो प्लान के ग्राहकों के लिए उपलब्ध है। ओपनएआई ने कहा कि यह सुविधा जल्द ही चैटजीपीटी के प्लस और मुफ्त उपयोगकर्ताओं के साथ-साथ कंपनी की एपीआई सेवाओं का उपयोग करने वाले डेवलपर्स के लिए भी शुरू की जाएगी।

छवि आउटपुट के साथ GPT-4o छवि निर्माण मॉडल की तुलना में लंबे समय तक "सोचता" है, यह प्रभावी रूप से DALL-E3 को प्रतिस्थापित करता है, जो OpenAI द्वारा वर्णित अधिक सटीक और विस्तृत छवियों का उत्पादन करता है। GPT-4o मौजूदा छवियों को संपादित कर सकता है, जिसमें लोगों वाली छवियां भी शामिल हैं - उन्हें रूपांतरित करना या अग्रभूमि और पृष्ठभूमि वस्तुओं जैसे विवरणों को "ठीक" करना।

ओपनएआई ने यह खुलासा नहीं किया कि नई छवि निर्माण सुविधा को लागू करने के लिए उसने किस छवि डेटा का उपयोग किया है। कई जेनेरिक एआई विक्रेता प्रशिक्षण डेटा को प्रतिस्पर्धात्मक लाभ के रूप में देखते हैं और इसलिए इसके बारे में और इसके आसपास की जानकारी को गुप्त रखते हैं। लेकिन प्रशिक्षण डेटा विवरण से बौद्धिक संपदा से संबंधित मुकदमेबाजी भी शुरू हो सकती है, एक अन्य कारण यह है कि कंपनियां बहुत अधिक जानकारी का खुलासा करने में अनिच्छुक हैं। 

ओपनएआई एक ऑप्ट-आउट फॉर्म प्रदान करता है जो रचनाकारों को यह अनुरोध करने की अनुमति देता है कि उनके कार्यों को उनके प्रशिक्षण डेटा सेट से हटा दिया जाए। कंपनी ने यह भी कहा कि वह अपने वेब-स्क्रैपिंग बॉट को वेबसाइटों से छवियों सहित प्रशिक्षण डेटा एकत्र करने से प्रतिबंधित करने के अनुरोध का सम्मान करती है।

चैटजीपीटी की उन्नत छवि निर्माण क्षमताएं Google के प्रमुख मॉडलों में से एक, जेमिनी 2.0 फ्लैश के लिए प्रयोगात्मक देशी छवि आउटपुट के बाद आती हैं। यह शक्तिशाली फीचर सोशल मीडिया पर वायरल हो रहा है - और जरूरी नहीं कि अच्छे कारणों से। जेमिनी2.0 फ्लैश के ग्राफिक्स घटक में कुछ सुरक्षाएं हैं, जो लोगों को वॉटरमार्क हटाने और कॉपीराइट वर्णों को चित्रित करने वाली छवियां बनाने की अनुमति देती हैं।