OpenAI ने मंगलवार को अपने दो सबसे शक्तिशाली छोटे मॉडल, GPT-5.4 मिनी और GPT-5.4 नैनो लॉन्च किए, जिससे कम विलंबता और कम लागत वाले प्रमुख मॉडलों के साथ प्रदर्शन अंतर काफी कम हो गया।GPT-5.4 मिनी प्रोग्रामिंग, रीजनिंग, मल्टी-मोडल समझ और टूल इनवोकेशन जैसे मुख्य आयामों में पिछली पीढ़ी के GPT-5 मिनी से आगे निकल जाता है। चलने की गति 2 गुना से अधिक बढ़ गई है, और SWE-बेंच प्रो जैसे बेंचमार्क परीक्षणों में बड़े GPT-5.4 के करीब है।
GPT-5.4 नैनो को सबसे कम लागत और सबसे कम विलंबता के साथ हल्के विकल्प के रूप में तैनात किया गया है। यह केवल एपीआई के माध्यम से डेवलपर्स के लिए खुला है और डेटा वर्गीकरण, निष्कर्षण और सरल प्रोग्रामिंग उपकार्यों के लिए डिज़ाइन किया गया है।

दो मॉडलों के लॉन्च का उद्देश्य उस अंतर को भरना है जहां बड़े मॉडलों को उच्च देरी के कारण वास्तविक समय के इंटरैक्शन परिदृश्यों में लागू करना मुश्किल होता है, जो प्रोग्रामिंग सहायकों, एआई एजेंट सिस्टम और मल्टी-मोडल अनुप्रयोगों को कवर करने वाले तेजी से बढ़ते वाणिज्यिक बाजार को सीधे प्रभावित करता है।
मिनी उपभोक्ता पक्ष के लिए है, और नैनो की विशिष्ट एपीआई है
GPT-5.4 मिनी को आज से ओपनएआई एपीआई, कोडेक्स प्लेटफॉर्म और चैटजीपीटी के तीन प्रमुख चैनलों पर एक साथ लॉन्च किया जाएगा।
GPT-5.4 मिनी का API मूल्य निर्धारण US$0.75 प्रति मिलियन इनपुट टोकन और US$4.50 प्रति मिलियन आउटपुट टोकन है।, टेक्स्ट और छवि इनपुट, टूल कॉलिंग, फ़ंक्शन कॉलिंग, वेब खोज, फ़ाइल पुनर्प्राप्ति, कंप्यूटर नियंत्रण और कौशल विस्तार का समर्थन करता है, और संदर्भ विंडो 400,000 टोकन तक पहुंचती है।
कोडेक्स प्लेटफ़ॉर्म पर, GPT-5.4 मिनी GPT-5.4 कोटा का केवल 30% उपभोग करता है, और डेवलपर्स के लिए सरल प्रोग्रामिंग कार्यों को संभालने की लागत फ्लैगशिप मॉडल की तुलना में लगभग एक तिहाई कम हो जाती है।कोडेक्स GPT-5.4 मिनी में चलने वाले उप-एजेंटों को कार्यभार सौंपने का भी समर्थन करता है, जिससे कम अनुमान-गहन कार्य स्वचालित रूप से सस्ते मॉडल में आ जाते हैं।
चैटजीपीटी पक्ष पर, फ्री और गो उपयोगकर्ता जीपीटी-5.4 मिनी का उपयोग करने के लिए "+" मेनू के माध्यम से "थिंकिंग" फ़ंक्शन का चयन कर सकते हैं; अन्य भुगतान करने वाले उपयोगकर्ताओं के लिए, GPT-5.4 थिंकिंग दर सीमा तक पहुंचने के बाद, यह मॉडल स्वचालित डाउनग्रेड विकल्प के रूप में सक्षम किया जाएगा।
GPT-5.4 नैनो वर्तमान में केवल API के माध्यम से डेवलपर्स के लिए उपलब्ध है, और इसकी कीमत US$0.20 प्रति मिलियन इनपुट टोकन और US$1.25 प्रति मिलियन आउटपुट टोकन है, जो इसे दो नए मॉडलों की सबसे कम कीमत बनाती है। ओपनएआई ने कहा कि नैनो उप-एजेंट परिदृश्यों के लिए उपयुक्त है जो उच्च-क्रम मॉडल द्वारा समन्वित और निर्धारित हैं और माध्यमिक समर्थन कार्यों के प्रसंस्करण के लिए जिम्मेदार हैं।

मिनी फ्लैगशिप के करीब पहुंच रही है, नैनो पिछली पीढ़ी से आगे निकल गई है
OpenAI द्वारा जारी मूल्यांकन डेटा से देखते हुए, GPT-5.4 मिनी प्रोग्रामिंग और मल्टी-मोडल कार्यों में विशेष रूप से अच्छा प्रदर्शन करता है।
प्रोग्रामिंग बेंचमार्क एसडब्ल्यूई-बेंच प्रो पर, मिनी ने 54.4% स्कोर किया, और जीपीटी-5.4 के 57.7% के साथ अंतर कम होकर 3.3 प्रतिशत अंक हो गया, जो जीपीटी-5 मिनी के 45.7% से काफी अधिक है।

कंप्यूटर नियंत्रित बेंचमार्कओएसवर्ल्ड-सत्यापित पर, मिनी 72.1% के साथ जीपीटी-5.4 के 75.0% के करीब पहुंच रहा है, और जीपीटी-5 मिनी के 42.0% से काफी आगे है।

टूल कॉलिंग क्षमता, GPT-5.4 मिनी ने τ2-बेंच दूरसंचार परीक्षण में 93.4% स्कोर किया, जो GPT-5 मिनी के 74.1% से एक महत्वपूर्ण सुधार है। सामान्य बुद्धि परीक्षण जीपीक्यूए डायमंड में, मिनी ने 88.0% स्कोर किया, और नैनो भी 82.8% तक पहुंच गया, दोनों जीपीटी-5 मिनी के 81.6% से अधिक थे।

यह ध्यान देने योग्य है कि GPT-5.4 नैनो कुछ दृश्य कार्यों में GPT-5 मिनी से पीछे है, जिसका OSWorld-सत्यापित स्कोर बाद के 42.0% से 39.0% कम है। हालाँकि, प्रोग्रामिंग और टूल कॉलिंग कार्यों के मामले में, पिछली पीढ़ी की तुलना में नैनो में अभी भी काफी सुधार हुआ है।

ओपनएआई ने कहा कि नैनो की डिज़ाइन प्राथमिकता व्यापक प्रदर्शन के बजाय कम विलंबता और कम लागत है। डेवलपर्स को चयन करते समय विशिष्ट कार्यों के आधार पर ट्रेड-ऑफ़ करने की आवश्यकता होती है।
उप-एजेंट आर्किटेक्चर, मल्टी-मॉडल सहयोग उत्पाद डिजाइन का एक नया प्रतिमान बन जाता है
अपनी रिलीज़ सामग्री में, OpenAI ने मल्टी-मॉडल पदानुक्रमित प्रणाली में दो नए मॉडलों की स्थिति पर जोर दिया।
अपने स्व-विकसित प्रोग्रामिंग सहायक कोडेक्स को एक उदाहरण के रूप में लेते हुए, GPT-5.4 योजना, समन्वय और अंतिम निर्णय के लिए जिम्मेदार है, जबकि GPT-5.4 मिनी उप-एजेंट कोड आधार पुनर्प्राप्ति, बड़ी फ़ाइल समीक्षा और समानांतर में सहायक दस्तावेज़ प्रसंस्करण जैसे बारीक उप-कार्यों को संभालता है।
ओपनएआई ने कहा कि जैसे-जैसे छोटे मॉडल तेज और अधिक शक्तिशाली होते जाते हैं, डेवलपर्स को अब सभी कार्यों को संभालने के लिए एक मॉडल का उपयोग करने की आवश्यकता नहीं होती है, लेकिन वे सिस्टम बना सकते हैं जहां बड़े मॉडल निर्णय लेने के लिए जिम्मेदार होते हैं और छोटे मॉडल तेजी से और बड़े पैमाने पर कार्य करते हैं।ओपनएआई ने कहा:
GPT-5.4 मिनी इस वर्कफ़्लो के लिए हमारा अब तक का सबसे शक्तिशाली छोटा मॉडल है।
यह आर्किटेक्चर उच्च-समवर्ती कार्य के लिए विशेष रूप से महत्वपूर्ण है। प्रोग्रामिंग असिस्टेंट, स्क्रीनशॉट विश्लेषण और वास्तविक समय छवि समझ जैसे परिदृश्यों में, प्रतिक्रिया में देरी सीधे उत्पाद अनुभव को प्रभावित करती है। इष्टतम विकल्प अक्सर सबसे मजबूत क्षमताओं वाला मॉडल नहीं होता है, बल्कि वह मॉडल होता है जो गति, उपकरण विश्वसनीयता और कार्य प्रदर्शन के बीच सर्वोत्तम संतुलन प्राप्त कर सकता है।
डेवलपर्स के लिए, GPT-5.4 मिनी और नैनो की रिलीज़ का मतलब है कि सिस्टम की समग्र बुद्धिमत्ता का त्याग किए बिना अनुमान लागत को महत्वपूर्ण रूप से कम करने का रास्ता और स्पष्ट है।