आज, OpenAI ने अपना नया गैर-अनुमानित मॉडल, GPT-4.5 जारी किया, जो अब तक का सबसे बड़ा और सबसे ज्ञानवर्धक मॉडल है। जैसा कि नाम से पता चलता है, GPT-4.5 GPT-4o पर आधारित है और पूर्व-प्रशिक्षण प्रक्रिया के दौरान इसे और विस्तारित किया गया है। OpenAI ने पुष्टि की है कि GPT-4.5 एक अत्याधुनिक मॉडल नहीं है, लेकिन यह उनका सबसे बड़ा LLM है और इसमें GPT-4o की तुलना में अधिक विश्व ज्ञान, बेहतर लेखन कौशल और अधिक परिष्कृत व्यक्तित्व है।
बेंचमार्क परीक्षण डेटा से पता चलता है कि GPT-4.5, GPT-4o की तुलना में कोई महत्वपूर्ण अपग्रेड नहीं है। SWE-बेंच सत्यापित बेंचमार्क परीक्षण में, GPT-4.5 38% तक पहुंच गया, जो GPT-4o से 2-7% अधिक है और OpenAI के O3-आधारित गहन अनुसंधान मॉडल से 30% कम है। इसकी तुलना में, एंथ्रोपिक के क्लाउड3.7सॉनेट ने SWE-बेंचवेरिफाइड पर 62.3% के बराबर प्रदर्शन हासिल किया।
हाल ही में, OpenAI की तैयारी टीम ने व्यावहारिक सॉफ्टवेयर इंजीनियरिंग कार्यों में LLM के प्रदर्शन का मूल्यांकन करने के लिए SWE-Lancer नामक एक नया बेंचमार्क विकसित किया, जिसमें फीचर डेवलपमेंट, डिज़ाइन, बग फिक्सिंग आदि शामिल हैं। इस नए बेंचमार्क में, GPT-4.5 मॉडल 20% ICSWE कार्यों और 44% SWEManager कार्यों को हल करने में सक्षम था, जो OpenAI के o1 मॉडल पर थोड़ा सुधार है।
आप नए मॉडल का विवरण यहां पढ़ सकते हैं:
https://openai.com/index/introduction-gpt-4-5/
सुरक्षा के मोर्चे पर, OpenAI के सुरक्षा सलाहकार समूह ने तत्परता मूल्यांकन के परिणामों के आधार पर नए GPT-4.5 मॉडल को समग्र मध्यम जोखिम के रूप में वर्गीकृत किया। इसने साइबर सुरक्षा और मॉडल स्वायत्तता पर भी कम स्कोर किया।
नया GPT-4.5 मॉडल अनुसंधान पूर्वावलोकन अब ChatGPTPro उपयोगकर्ताओं और एपीआई के माध्यम से सभी भुगतान योजनाओं पर डेवलपर्स के लिए उपलब्ध है। अगले हफ्ते ChatGPTPlus यूजर्स को भी यह फीचर मिलेगा।