JetBrains ने हाल ही में घोषणा की है कि सॉफ्टवेयर इंजीनियरिंग सिस्टम के लिए इसका अगली पीढ़ी का मशीन लर्निंग मॉडल Mellum2 आधिकारिक तौर पर ओपन सोर्स हो गया है। यह कंपनी द्वारा 2025 में अपना पहला मेलम मॉडल खोलने के ठीक एक साल बाद है। उस समय, मेलम एक छोटा मॉडल था जो कोड पूरा करने पर केंद्रित था, जिसका पैरामीटर आकार लगभग 4 बिलियन था। इसकी तुलना में, Mellum2 के मापदंडों की कुल संख्या 12 बिलियन तक विस्तारित हो गई है।हालाँकि, JetBrains इस बात पर जोर देता है कि विरल मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) आर्किटेक्चर को अपनाकर, प्रत्येक टोकन वास्तव में केवल लगभग 2.5 बिलियन सक्रिय मापदंडों की गणना में भाग लेता है, ताकि यह अभी भी मानक हार्डवेयर पर तेज अनुमान गति बनाए रख सके।

"केंद्रित" मेल्लम के विपरीत, जो केवल संपादक में कोड पूरा करने का कार्य करता है, मेल्लम2 को एक पूर्ण बुद्धिमान कोडिंग सहायक के रूप में तैनात किया गया है। यह कोड उत्पन्न और संपादित कर सकता है, बाहरी टूल को कॉल कर सकता है, मल्टी-स्टेप "एजेंटिक" वर्कफ़्लो निष्पादित कर सकता है, लंबी बातचीत का समर्थन कर सकता है और इसमें स्पष्ट तर्क क्षमताएं हो सकती हैं। उत्पाद या आंतरिक उपकरण बनाते समय अपने डेटा पर पूर्ण नियंत्रण बनाए रखने के लिए डेवलपर्स अपाचे 2.0 लाइसेंस के तहत इसके आधार, निर्देश-ट्यून और "थिंक एडिशन" मॉडल का उपयोग कर सकते हैं।
विशिष्टताओं के संदर्भ में, Mellum2 में पहली पीढ़ी के Mellum की तुलना में कई प्रमुख संकेतकों में महत्वपूर्ण बदलाव हैं: मूल Mellum ने एक सघन पैरामीटर डिज़ाइन का उपयोग किया था, जबकि Mellum2 ने MoE आर्किटेक्चर पर स्विच किया था; पैरामीटरों की कुल संख्या 4 बिलियन से बढ़कर 12 बिलियन हो गई, लेकिन सक्रिय पैरामीटर 4 बिलियन से गिरकर 2.5 बिलियन हो गए; संदर्भ विंडो 8192 टोकन से बढ़कर 131072 टोकन हो गई, जिससे यह लंबे दस्तावेज़ों और जटिल इंजीनियरिंग परिदृश्यों को संसाधित करने के लिए अधिक उपयुक्त हो गई; दोनों पीढ़ियों के मॉडल Apache 2.0 ओपन सोर्स लाइसेंस का उपयोग करते हैं।
JetBrains ने कहा कि Mellum2 विशेष रूप से जटिल AI वर्कलोड को रूट करने और व्यवस्थित करने, कम-विलंबता पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG) पाइपलाइनों के निर्माण, बड़े सिस्टम में उप-एजेंटों के लिए तेज़ अनुमान समर्थन प्रदान करने और स्थानीय या निजी वातावरण में AI को तैनात करने के लिए उपयुक्त है। कोड और गणित जैसे पेशेवर क्षेत्रों में मॉडल के प्रदर्शन को और बेहतर बनाने के लिए, टीम ने पूर्व-प्रशिक्षण चरण में तीन-चरण डेटा "पाठ्यक्रम" अपनाया, धीरे-धीरे विविध वेब डेटा से अधिक सावधानीपूर्वक जांचे गए कोड और गणित सामग्री की ओर स्थानांतरित किया गया।
Mellum2 के अलावा, JetBrains ने एक उत्पाद लाइन समायोजन की भी घोषणा की: कंपनी Python डेवलपर्स के लिए डेटास्पेल, अपने डेटा विज्ञान IDE को बनाए रखना बंद कर देगी। आधिकारिक जानकारी के अनुसार, डेटास्पेल को 28 मई को आधिकारिक तौर पर "सेवानिवृत्त" कर दिया गया है, और संबंधित डेटा विज्ञान कार्यों को PyCharm पेशेवर संस्करण में एकीकृत किया जाएगा। मौजूदा सक्रिय डेटास्पेल सदस्यताएं 1 सितंबर, 2026 को स्वचालित रूप से PyCharm Pro में परिवर्तित हो जाएंगी।