ऐप्पल के लिए काम करने वाले शोधकर्ताओं और कोलंबिया विश्वविद्यालय के शोधकर्ताओं ने अक्टूबर में चुपचाप ओपन सोर्स मल्टीमॉडल एलएलएम लॉन्च किया, एक शोध संस्करण जिसे "फेरेट" कहा जाता है, जिसे छवि क्षेत्रों का उपयोग करके पूछताछ की जा सकती है। फ़ेरेट को अक्टूबर में Github पर बिना किसी ध्यान के और बिना किसी सार्वजनिक रिलीज़ या प्रचारात्मक कार्रवाई के रिलीज़ किया गया था। फ़ेरेट का कोड 30 अक्टूबर को फ़ेरेट-बेंच के साथ जारी किया गया था, और एक चेकपॉइंट संस्करण 14 दिसंबर को लॉन्च किया गया था।
वेंचरबीट की रिपोर्ट के अनुसार, हालांकि शुरुआत में इस पर ज्यादा ध्यान नहीं दिया गया, लेकिन शनिवार की रिलीज कृत्रिम बुद्धिमत्ता शोधकर्ताओं के लिए एक बड़ी उपलब्धि बन गई। एआई-आधारित दवा गैर-लाभकारी संस्था चलाने वाले बार्ट डेविट ने एक्स पर "छूटे हुए" संस्करण के बारे में पोस्ट किया, इसे "प्रभावशाली एआई अनुसंधान के लिए ऐप्पल की प्रतिबद्धता का प्रमाण" कहा।
फेर्रेट का ओपन सोर्स रिलीज़ एक गैर-व्यावसायिक लाइसेंस के तहत है, इसलिए इसकी वर्तमान स्थिति में इसका व्यावसायीकरण नहीं किया जा सकता है। हालाँकि, इस बात की हमेशा संभावना रहती है कि इसका उपयोग भविष्य के Apple उत्पाद या सेवा में किसी तरह से किया जा सके।
ऐप्पल एआई/एमएल अनुसंधान वैज्ञानिक गण झे ने अक्टूबर के एक ट्वीट में फेर्रेट के उद्देश्य को एक ऐसी प्रणाली के रूप में समझाया जो एक छवि में "किसी भी चीज़ को, कहीं भी, किसी भी ग्रैन्युलैरिटी पर संदर्भित और स्थिति में ला सकती है"। यह छवि में किसी भी आकार वाले क्षेत्र का उपयोग करके भी ऐसा कर सकता है।
सीधे शब्दों में कहें तो, मॉडल छवि पर खींचे गए क्षेत्र का विश्लेषण करता है, उसके भीतर उन तत्वों को निर्धारित करता है जो उपयोगकर्ता की क्वेरी के लिए उपयोगी होते हैं, और उनकी पहचान करते हैं, पहचाने गए तत्वों के चारों ओर एक बाउंडिंग बॉक्स बनाते हैं। इसके बाद यह पहचाने गए तत्वों को क्वेरी के हिस्से के रूप में उपयोग कर सकता है और विशिष्ट तरीके से प्रतिक्रिया दे सकता है।
उदाहरण के लिए, किसी छवि में किसी जानवर को हाइलाइट करके और एलएलएम से यह पूछकर कि यह कौन सा जानवर है, एलएलएम जानवर की प्रजाति निर्धारित कर सकता है और यह निर्धारित कर सकता है कि उपयोगकर्ता समूह में किसी जानवर का जिक्र कर रहा है या नहीं। इसके बाद यह छवि में पाई गई अन्य वस्तुओं के संदर्भ का उपयोग करके आगे की प्रतिक्रियाएँ प्रदान कर सकता है।
यह घोषणा शोधकर्ताओं के लिए महत्वपूर्ण है क्योंकि यह संकेत देती है कि ऐप्पल अतीत में अपनाए गए रहस्यमय रुख को अपनाने के बजाय अपने कृत्रिम बुद्धिमत्ता प्रयासों के बारे में अधिक खुला होना चाहता है।
ऐप्पल के लिए इन्फ्रास्ट्रक्चर भी एक मुद्दा है, क्योंकि वह अपने एआई सर्वरों की संख्या बढ़ाने के लिए काम कर रहा है, लेकिन चैटजीपीटी जैसे सर्वरों के साथ प्रतिस्पर्धा करने के लिए उसके पास अभी तक पर्याप्त पैमाने नहीं हो सकते हैं। जबकि Apple अपनी क्षमताओं का विस्तार करने के लिए अन्य कंपनियों के साथ साझेदारी कर सकता है, दूसरा रास्ता वह करना है जो उसने अभी किया है और एक ओपन सोर्स मॉडल जारी करना है।
Github पर पोस्ट की गई जानकारी में एक दिलचस्प अवलोकन पाया जा सकता है। Reddit के r/Apple ने पाया कि फ़ेर्रेट को "8 A100 GPU और 80GB मेमोरी पर प्रशिक्षित किया गया था।" Apple के NVIDIA GPU को समर्थन देने के इतिहास को देखते हुए, इसे GPU निर्माता के लिए एक दुर्लभ समर्थन माना जाता है।