माइक्रोसॉफ्ट ने हाल ही में अपना नवीनतम पीढ़ी का टेक्स्ट जेनरेशन इमेज मॉडल MAI-Image-2.5 जारी किया, और इसने तुरंत एरेना की नवीनतम टेक्स्ट जेनरेशन रैंकिंग में तीसरा स्थान हासिल कर लिया, जिससे पता चलता है कि AI इमेज जेनरेशन के क्षेत्र में इसकी समग्र ताकत स्पष्ट रूप से उद्योग के नेताओं के साथ पकड़ बना रही है। फिलहाल इस सूची में ओपनएआई का जीपीटी-इमेज-2 1388 स्कोर के साथ पहले स्थान पर है।

माइक्रोसॉफ्ट ने कहा कि एमएआई-इमेज-2.5 ने विभिन्न छवि शैलियों में अपने प्रदर्शन में व्यापक सुधार किया है, छवियों को उत्पन्न करने के लिए उपयोगकर्ता के संकेतों को बेहतर ढंग से फिट कर सकता है, और टेक्स्ट रेंडरिंग और स्क्रीन विवरण में महत्वपूर्ण सुधार किए हैं।

माइक्रोसॉफ्ट ने शुरुआत में पिछले साल अपना स्व-विकसित इमेज जेनरेशन मॉडल MAI-Image-1 लॉन्च किया था। यह मॉडल एरेना की इमेज एरेना रैंकिंग में केवल 9वें स्थान पर था, जो उस समय अन्य प्रयोगशालाओं के शीर्ष मॉडलों से काफी अलग था। इसके बाद Microsoft ने मॉडल को Bing.com/create और Bing मोबाइल एप्लिकेशन में एकीकृत किया और इसे उपयोगकर्ताओं के लिए उपलब्ध कराया। इस साल मार्च में, माइक्रोसॉफ्ट एआई टीम ने दूसरी पीढ़ी की एमएआई-इमेज-2 जारी की, जिसने प्राकृतिक प्रकाश प्रदर्शन, त्वचा के रंग की बहाली आदि में महत्वपूर्ण सुधार लाए और पहली बार एरेना रैंकिंग के शीर्ष तीन में पहुंच गई, केवल Google के जेमिनी-3.1-फ्लैश-इमेज-प्रीव्यू और ओपनएआई की जीपीटी-इमेज-1.5-हाई-फिडेलिटी को पीछे छोड़ते हुए। यह डेवलपर्स को कॉल करने के लिए कोपायलट, बिंग इमेज क्रिएटर और माइक्रोसॉफ्ट फाउंड्री एपीआई से भी जुड़ा हुआ है।

इस आधार पर, नई पीढ़ी MAI-Image-2.5 मॉडल की समग्र क्षमताओं को और मजबूत करती है। माइक्रोसॉफ्ट ने कहा कि MAI-Image-2.5 उपयोगकर्ता के टेक्स्ट संकेतों को अधिक सटीक रूप से समझ और निष्पादित कर सकता है, उत्पन्न छवियां विवरण और समग्र संरचना में अधिक सुसंगत हैं, और टेक्स्ट सामग्री का प्रतिपादन अधिक विश्वसनीय है। वस्तुओं, प्रकाश व्यवस्था, अनुपात, दृश्य संरचनाओं और स्थानिक संबंधों की अधिक सटीक समझ के साथ मॉडल की दृश्य तर्क क्षमताओं को भी बढ़ाया गया है, जिससे ऐसी छवियां उत्पन्न करने में मदद मिलती है जो वास्तविक दृश्यों और उपयोगकर्ता की अपेक्षाओं के अनुरूप हैं।

HJRDuJKbsAAbMCN.jpg

माइक्रोसॉफ्ट ने विशेष रूप से इस बात पर जोर दिया कि एमएआई-इमेज-2.5 ने टेक्स्ट रेंडरिंग, शैलीबद्ध चित्रण और वाणिज्यिक छवियों में सबसे स्पष्ट प्रगति की है, जिसमें पोस्टर, पैकेजिंग प्रूफिंग, ब्रांड रचनात्मकता और उत्पाद छवियां इत्यादि शामिल हैं, जो उच्च गुणवत्ता वाले आउटपुट का उत्पादन कर सकते हैं। पिछली पीढ़ी के मॉडल की तुलना में, नए मॉडल द्वारा उत्पन्न छवियों में पाठ स्पष्ट और तेज है, लेआउट अधिक स्थिर है, और ब्रांड दृश्य तत्व अधिक प्रमुख हैं और अधिक समग्र बनावट है, जो वाणिज्यिक डिजाइन और विपणन अनुप्रयोगों की आवश्यकताओं के अनुरूप है।

माइक्रोसॉफ्ट एआई के प्रमुख मुस्तफा सुलेमान ने सोशल प्लेटफॉर्म पर कहा कि एमएआई-इमेज-2.5 एरिना विंसेंटियन चार्ट रैंकिंग में तीसरे स्थान पर है, जो छवि निर्माण की गुणवत्ता में एक और महत्वपूर्ण छलांग है। उन्होंने यह भी भविष्यवाणी की कि आगामी बिल्ड कॉन्फ्रेंस में, Microsoft AI टीम अधिक संबंधित अपडेट और रिलीज़ लाएगी। उन्होंने कहा कि यह एआई इमेजिंग के क्षेत्र में माइक्रोसॉफ्ट के प्रयासों में एक और कदम है, और यह भविष्य में मॉडल क्षमताओं और उत्पाद रूपों की पुनरावृत्ति को बढ़ावा देना जारी रखेगा।

वर्तमान में, MAI-Image-2.5 एरिना के माध्यम से परीक्षण उपयोग के लिए सभी उपयोगकर्ताओं के लिए खुला है, और उपयोगकर्ता सीधे प्लेटफ़ॉर्म पर अन्य मॉडलों के साथ इसकी तुलना और अनुभव कर सकते हैं। माइक्रोसॉफ्ट की योजना के अनुसार, यह नया मॉडल अगले दो हफ्तों में एमएआई प्लेग्राउंड और माइक्रोसॉफ्ट फाउंड्री पर भी लॉन्च किया जाएगा, जो आम उपयोगकर्ताओं और डेवलपर्स को अधिक विविध जेनरेटिव इमेज निर्माण और एकीकरण विकल्प प्रदान करेगा।