Apple शोधकर्ताओं ने एक नया ओपन सोर्स कृत्रिम बुद्धिमत्ता मॉडल जारी किया है जो उपयोगकर्ताओं के प्राकृतिक भाषा निर्देशों के आधार पर छवियों को संपादित कर सकता है। एमजीआईई एमएलएलएम-गाइडेडइमेजएडिटिंग का संक्षिप्त नाम है, जो उपयोगकर्ता के अनुरोधों की व्याख्या करने और पिक्सेल-स्तरीय संचालन करने के लिए मल्टीमॉडल लार्ज लैंग्वेज मॉडल (एमएलएलएम) का उपयोग करता है।

यह मॉडल किसी छवि के हर पहलू को संपादित करने में सक्षम है। वैश्विक फोटो संवर्द्धन में चमक, कंट्रास्ट, या तीक्ष्णता शामिल हो सकती है, या स्केचिंग जैसे कलात्मक प्रभाव लागू हो सकते हैं। स्थानीय संपादन किसी छवि में विशिष्ट क्षेत्रों या वस्तुओं के आकार, आकार, रंग या बनावट को संशोधित कर सकता है, जबकि फ़ोटोशॉप-शैली के संशोधनों में क्रॉप करना, आकार बदलना, घुमाना और फ़िल्टर जोड़ना, या यहां तक ​​कि पृष्ठभूमि बदलना और छवि को मिश्रित करना शामिल है।

पिज़्ज़ा की तस्वीर के लिए उपयोगकर्ता का इनपुट हो सकता है "इसे स्वास्थ्यवर्धक बनाएं।" सामान्य ज्ञान तर्क का उपयोग करके, मॉडल टमाटर और जड़ी-बूटियों जैसी सब्जी सामग्री जोड़ सकता है। वैश्विक अनुकूलन इनपुट अनुरोध "कंट्रास्ट बढ़ाएं, अधिक प्रकाश का अनुकरण करें" के रूप में हो सकते हैं, जबकि फ़ोटोशॉप-शैली संशोधन मॉडल को फोटो की पृष्ठभूमि से लोगों को हटाने के लिए कह सकते हैं, छवि का ध्यान विषय के चेहरे के भावों पर स्थानांतरित कर सकते हैं।

Apple ने MGIE बनाने के लिए कैलिफोर्निया विश्वविद्यालय के शोधकर्ताओं के साथ सहयोग किया और 2024 इंटरनेशनल कॉन्फ्रेंस ऑन लर्निंग रिप्रेजेंटेशन (ICLR) में एक पेपर प्रकाशित किया। मॉडल GitHub पर उपलब्ध है, जिसमें कोड, डेटा और पूर्व-प्रशिक्षित मॉडल शामिल हैं।

कई महीनों में कृत्रिम बुद्धिमत्ता अनुसंधान में यह Apple की दूसरी सफलता है। दिसंबर के अंत में, Apple ने खुलासा किया कि उसने एक अभिनव फ़्लैश मेमोरी उपयोग तकनीक का आविष्कार करके iPhones और अन्य मेमोरी-बाधित Apple उपकरणों पर बड़े भाषा मॉडल (LLMs) को तैनात करने में प्रगति की है।

पिछले कुछ महीनों से, Apple एक "AppleGPT" का परीक्षण कर रहा है जो ChatGPT को टक्कर दे सकता है। ब्लूमबर्ग के मार्क गुरमन के अनुसार, एआई का काम ऐप्पल के लिए प्राथमिकता है, और कंपनी बड़े भाषा मॉडल के लिए "अजाक्स" ढांचा तैयार कर रही है।

द इंफॉर्मेशन और विश्लेषक जेफ पु दोनों का दावा है कि Apple 2024 के अंत के आसपास iPhone और iPad पर किसी प्रकार की जेनरेटिव आर्टिफिशियल इंटेलिजेंस सुविधा लॉन्च करेगा, जब iOS 18 लॉन्च होगा। गुरमन के अनुसार, आईओएस 18 में चैटजीपीटी जैसी जेनरेटिव एआई क्षमताओं के साथ सिरी का एक उन्नत संस्करण शामिल होने की बात कही गई है और इसमें आईफोन के इतिहास में "सबसे बड़ा" सॉफ्टवेयर अपडेट होने की क्षमता है।