2026 बिल्ड डेवलपर कॉन्फ्रेंस में, माइक्रोसॉफ्ट ने माइक्रोसॉफ्ट एआई सुपरइंटेलिजेंस टीम द्वारा बनाए गए अपने स्व-विकसित एमएआई मॉडल परिवार के एक महत्वपूर्ण विस्तार की घोषणा की, पहला सामान्य-उद्देश्य अनुमान मॉडल एमएआई-थिंकिंग -1, गिटहब कोपायलट के लिए एक कोड मॉडल एमएआई-कोड -1, और अपने एंड-टू-एंड एआई प्रौद्योगिकी परिदृश्य को और बेहतर बनाने के लिए भाषण, ट्रांसक्रिप्शन और छवि पीढ़ी मॉडल के कई अद्यतन संस्करण लॉन्च किए। यह भाषण और छवियों से लेकर जटिल तर्क और डेवलपर उत्पादकता परिदृश्यों तक बुनियादी मॉडल के क्षेत्र में माइक्रोसॉफ्ट के त्वरित विस्तार का प्रतीक है।

माइक्रोसॉफ्ट ने कहा कि पिछले साल एमएआई मॉडल परिवार का विस्तार जारी रहा है, और इस साल की शुरुआत में एमएआई-वॉयस-1, एमएआई-1-पूर्वावलोकन, और एमएआई-ट्रांसक्राइब-1 और एमएआई-इमेज-2 जारी किया है, और फिर एमएआई-इमेज-2.5 लॉन्च किया है, जिसने टेक्स्ट रेंडरिंग, शैलीबद्ध चित्रण और वाणिज्यिक छवियों की गुणवत्ता में सुधार किया है। इस बार, इस आधार पर, नए तर्क और कोडिंग मॉडल जोड़े गए हैं, और अधिक संपूर्ण उत्पाद पोर्टफोलियो बनाने के लिए आवाज, ट्रांसक्रिप्शन और छवि उत्पाद लाइनों को एक साथ अपग्रेड किया गया है।
एमएआई-थिंकिंग-1 माइक्रोसॉफ्ट द्वारा आधिकारिक तौर पर घोषित पहला अनुमान मॉडल है। इसे माइक्रोसॉफ्ट एआई टीम द्वारा शुरू से ही प्रशिक्षित किया गया था और इसे अन्य मॉडलों से डिस्टिल्ड नहीं किया गया था। माइक्रोसॉफ्ट ने इस बात पर जोर दिया कि मॉडल को स्वच्छ, व्यावसायिक रूप से लाइसेंस प्राप्त एंटरप्राइज़-स्तरीय डेटा का उपयोग करके प्रशिक्षित किया गया है और इसे डेटा अनुपालन और व्यावसायीकरण के लिए एंटरप्राइज़ उपयोगकर्ताओं की आवश्यकताओं को पूरा करने के लिए डिज़ाइन किया गया है। एमएआई-थिंकिंग-1 35 बिलियन सक्रियण मापदंडों वाला एक मध्यम-स्तरीय मॉडल है और 128K संदर्भ विंडो का समर्थन करता है। यह मुख्य रूप से जटिल बहु-चरण निर्देश निष्पादन, लंबे संदर्भ तर्क और कोड पीढ़ी जैसे परिदृश्यों पर लक्षित है।
हालाँकि Microsoft ने घोषणा में विस्तृत बेंचमार्क डेटा का खुलासा नहीं किया, लेकिन उसने अपने ब्लॉग में स्वतंत्र समीक्षा परिणामों का हवाला दिया और कहा कि ब्लाइंड टेस्ट में, समीक्षकों की समग्र प्राथमिकता एंथ्रोपिक के क्लाउड सॉनेट 4.6 की तुलना में MAI-थिंकिंग -1 के प्रति अधिक थी। इसके अलावा, माइक्रोसॉफ्ट ने यह भी कहा कि एसडब्ल्यूई-बेंच प्रो कोड टास्क टेस्ट में, एमएआई-थिंकिंग-1 कोडिंग प्रदर्शन में क्लाउड ओपस 4.6 के बराबर था, जो डेवलपर्स और जटिल इंजीनियरिंग कार्यों के लिए इस मॉडल की क्षमता को दर्शाता है। एमएआई-थिंकिंग-1 वर्तमान में माइक्रोसॉफ्ट फाउंड्री के माध्यम से चुनिंदा ग्राहकों के लिए निजी पूर्वावलोकन में है।
छवि निर्माण के संदर्भ में, Microsoft के पहले जारी MAI-Image-2.5 और इसके "फ़्लैश संस्करण" को Microsoft फाउंड्री के माध्यम से डेवलपर्स के लिए खोल दिया गया है। माइक्रोसॉफ्ट द्वारा उद्धृत एरिना के नवीनतम लेख सूची डेटा के अनुसार, MAI-Image-2.5 ने टेक्स्ट इमेज बनाने के कार्य में Google के नैनो बनाना प्रो को पीछे छोड़ दिया है और सूची में शीर्ष तीन में प्रवेश किया है। इस मॉडल को PowerPoint में एकीकृत किया गया है और इसे धीरे-धीरे OneDrive पर लाया जा रहा है, जो Office पारिस्थितिकी तंत्र के लिए उच्च गुणवत्ता वाली छवि निर्माण क्षमताएं प्रदान करता है।
वाक् प्रतिलेखन के संदर्भ में, Microsoft ने इस वर्ष अप्रैल में MAI-Transcribe-1 जारी किया, जो अपने स्वयं के उत्पाद उपयोग डेटा के आधार पर 25 सबसे अधिक उपयोग की जाने वाली भाषाओं में वाक्-से-पाठ प्रतिलेखन का समर्थन करता है। इस बार Microsoft ने उन्नत संस्करण MAI-Transcribe-1.5 लॉन्च किया, जो वाक् पहचान सटीकता में उद्योग के अग्रणी स्तर पर पहुंच गया है और कवर की गई भाषाओं की संख्या को 43 तक बढ़ा दिया है। यह वास्तविक समय के परिदृश्यों की जरूरतों को पूरा करने के लिए जल्द ही मॉडल में स्ट्रीमिंग ट्रांसक्रिप्शन क्षमताओं को जोड़ने की योजना बना रहा है।
वाक् संश्लेषण की दिशा में, इस वर्ष अप्रैल में यह घोषणा करने के बाद कि MAI-Voice-1 आम तौर पर उपलब्ध है, Microsoft ने इस बार MAI-Voice-2 और इसका लाइटनिंग संस्करण जारी किया। नई पीढ़ी का भाषण पीढ़ी मॉडल 15 से अधिक अतिरिक्त भाषाओं का समर्थन करता है और बहुभाषी ग्राहक सेवा, सामग्री डबिंग और स्मार्ट सहायक जैसे समृद्ध एप्लिकेशन परिदृश्यों के अनुकूल होने के लिए अधिक आवाज शैली विकल्प प्रदान करता है।
डेवलपर्स के कोडिंग परिदृश्यों के लिए, Microsoft ने एक साथ MAI-Code-1 लॉन्च किया, जो GitHub वर्कलोड के लिए अनुकूलित एक कुशल अनुमान कोड मॉडल है। यह मॉडल GitHub Copilot और Visual Studio Code में लॉन्च किया गया है, जो दैनिक कोडिंग, रीफैक्टरिंग, कोड पूर्णता और अन्य परिदृश्यों के लिए समर्थन प्रदान करता है। हालाँकि Microsoft ने MAI-Code-1 के विशिष्ट बेंचमार्क परिणामों का खुलासा नहीं किया है, लेकिन इस रिलीज़ को एक महत्वपूर्ण संकेत माना जाता है - Microsoft अब GitHub Copilot के अंतर्निहित मॉडल के लिए OpenAI और Anthropic पर पूरी तरह से निर्भर नहीं है, बल्कि धीरे-धीरे स्व-विकसित मॉडल पेश करता है।
वितरण चैनलों के संदर्भ में, माइक्रोसॉफ्ट फाउंड्री के माध्यम से उद्यमों और डेवलपर्स को सेवाएं प्रदान करने के अलावा, माइक्रोसॉफ्ट ने यह भी घोषणा की कि उसके एमएआई श्रृंखला मॉडल फायरवर्क्स एआई, बेसटेन और ओपनराउटर जैसे तीसरे पक्ष के प्लेटफार्मों पर लॉन्च किए जाएंगे। साथ ही, फायरवर्क्स एआई को आम तौर पर माइक्रोसॉफ्ट फाउंड्री के भीतर भी उपलब्ध कराया गया है, जो एंटरप्राइज़ ग्राहकों को अधिक आर्किटेक्चर और तैनाती विकल्प प्रदान करता है। कई प्लेटफार्मों के साथ सहयोग करके, माइक्रोसॉफ्ट को एक्सेस सीमा को और कम करने और विभिन्न क्लाउड और टूल इकोसिस्टम में एमएआई मॉडल के कार्यान्वयन में तेजी लाने की उम्मीद है।
समग्र लेआउट से, Microsoft MAI तर्क, कोडिंग, भाषण, प्रतिलेखन और छवियों जैसे कई प्रकार के मॉडल का उपयोग करके एक संपूर्ण एंटरप्राइज़-स्तरीय AI क्षमता मैट्रिक्स का निर्माण कर रहा है। एमएआई-थिंकिंग-1 और एमएआई-कोड-1 के जुड़ने से, जटिल तर्क और डेवलपर उत्पादकता के क्षेत्र में माइक्रोसॉफ्ट की आवाज में काफी वृद्धि हुई है, और इसने गिटहब कोपायलट, ऑफिस श्रृंखला और सहयोग प्लेटफार्मों के लिए अधिक प्रतिस्पर्धी तकनीकी आधार भी प्रदान किया है।