मानुस ने हाल ही में चीनी बाज़ार से अपना नाम वापस ले लिया है, अपनी घरेलू सामाजिक खाता सामग्री को साफ़ कर दिया है, और अपनी पूरी ताकत के साथ विदेशी बाज़ारों में चला गया है। आधिकारिक स्पष्टीकरण यह था कि इसका कारण मुख्य रूप से परिचालन दक्षता और अंतर्राष्ट्रीय लेआउट के समायोजन पर आधारित था। 19 जुलाई को, बीजिंग समय, मानुस के सह-संस्थापक जी यिचाओ ने एक तकनीकी ब्लॉग प्रकाशित किया, जिसमें पहली बार तकनीकी दृष्टिकोण से प्रतिक्रिया दी गई, जिसमें कंपनी की स्थापना के बाद से एजेंट आर एंड डी और प्रशिक्षण में सीखे गए अनुभवों और पाठों का सारांश दिया गया।


तकनीकी दृष्टिकोण से, जी यिचाओ ने कहा कि मानुस संदर्भ इंजीनियरिंग पर ध्यान केंद्रित करेगा और संरचनात्मक "मेमोरी" और प्रक्रियाओं की मदद से तेजी से उत्पाद पुनरावृत्ति हासिल करेगा। इसमें मुख्य रूप से संदर्भ पर दांव लगाना, अब प्रशिक्षण मॉडल नहीं, केवी-कैश (की-वैल्यू कैश, एक कैशिंग तंत्र) हिट दर के महत्व पर जोर देना, गतिशील रूप से उपकरण नहीं जोड़ना और लगातार संदर्भ को होस्ट करने के लिए फ़ाइल सिस्टम का उपयोग करना शामिल है। मुख्य उद्देश्य अंतर्निहित मॉडल की प्रशिक्षण लागत को बचाना और प्रशिक्षण दक्षता में सुधार पर ध्यान केंद्रित करना है।

बड़े मॉडलों में, संदर्भ आमतौर पर जानकारी के संग्रह को संदर्भित करता है जिसे मॉडल कार्यों को संसाधित करते समय या आउटपुट सामग्री उत्पन्न करते समय संदर्भित करता है। यह मॉडल को अपनी समझ बढ़ाने, कार्य प्रदर्शन में सुधार करने और आउटपुट सुसंगतता बढ़ाने में मदद कर सकता है। इससे पहले, डार्क साइड ऑफ द मून किमी के संस्थापक यांग ज़ीलिन ने एक साक्षात्कार में संदर्भ के महत्व पर जोर दिया था। उन्होंने कहा कि एआई-नेटिव (एआई द्वारा परिभाषित उत्पाद रूप) उत्पादों का अंतिम मूल्य व्यक्तिगत इंटरैक्शन प्रदान करना है, और दोषरहित लंबा संदर्भ (लॉसलेसलॉन्गकॉन्टेक्स्ट) इस लक्ष्य को प्राप्त करने की कुंजी है। उन्होंने निर्णय दिया कि मॉडल की फाइन-ट्यूनिंग लंबे समय तक मौजूद नहीं रहनी चाहिए। उपयोगकर्ता और मॉडल के बीच इंटरैक्शन इतिहास सबसे अच्छी वैयक्तिकरण प्रक्रिया है, और लंबी संदर्भ तकनीक इन इंटरैक्शन इतिहास को बेहतर ढंग से रिकॉर्ड और उपयोग कर सकती है।

इसके अलावा, केवी-कैश हिट दर महत्वपूर्ण है, मुख्यतः क्योंकि उच्च हिट दर अनुमान दक्षता में सुधार कर सकती है, संसाधन उपयोग को अनुकूलित कर सकती है और कंप्यूटिंग लागत को कम कर सकती है। इसके आधार पर, केवी-कैश को अक्सर ट्रांसफार्मर मॉडल अनुमान चरण का दक्षता कोर कहा जाता है।

अंतर्निहित मॉडल से शुरू करने के बजाय उपरोक्त पहलुओं से प्रशिक्षण दक्षता में सुधार करना एक सबक है जो जी यिगुओ ने वर्षों से सीखा है। उन्होंने कहा कि जब उन्होंने अपनी आखिरी कंपनी (पीक लैब्स) शुरू की, तो टीम ने स्क्रैच से खुली सूचना निष्कर्षण और सिमेंटिक खोज के लिए मॉडल को प्रशिक्षित करने का फैसला किया, लेकिन इसके तुरंत बाद, ओपनएआई के जीपीटी -3 और Google के फ़्लान-टी 5 मॉडल सामने आए, और टीम द्वारा स्क्रैच से विकसित किए गए आंतरिक मॉडल रातोंरात अप्रासंगिक हो गए। "विडंबना यह है कि ये मॉडल प्रासंगिक शिक्षा की शुरुआत और आगे बढ़ने का एक नया रास्ता दर्शाते हैं।" जी यिचाओ ने कहा।

पिछले पाठों के आधार पर, मानुस शुरू करने के बाद, टीम ने अब बेस मॉडल अनुसंधान और विकास में निवेश नहीं किया, बल्कि एंड-टू-एंड एजेंटों को प्रशिक्षित करने के लिए ओपन सोर्स बेसिक मॉडल का उपयोग करने और अत्याधुनिक मॉडल की संदर्भ सीखने की क्षमताओं के आधार पर एजेंटों का निर्माण करने के बीच चयन किया। हालाँकि पीक लैब्स से सीखे गए सबक ने मानुस टीम को संदर्भ के महत्व का एहसास कराया, लेकिन यह आसान नहीं था। स्थानीय इष्टतम समाधान प्राप्त करने के लिए चार एजेंट फ्रेमवर्क समायोजन की आवश्यकता पड़ी।

हालाँकि, यह ध्यान दिया जाना चाहिए कि इस रणनीति की अभी भी सीमाएँ हैं, खासकर जब OpenAI द्वारा हाल ही में जारी ChatGPT एजेंट का सामना करना पड़ता है। मुख्य कारण यह है कि ChatGPT एजेंट OpenAI के समर्पित मॉडल पर निर्भर करता है और एंड-टू-एंड प्रशिक्षण को अपनाता है, जो जटिल कार्यों को बेहतर ढंग से संभाल सकता है। यद्यपि मानुस दक्षता में सुधार कर सकता है, फिर भी यह बाहरी मल्टी-मॉडल संयोजन और इंजीनियरिंग अनुकूलन पर निर्भर करता है, और कार्य निष्पादन स्थिरता और सटीकता में थोड़ा कम है।

इसके अलावा, जब मानुस ने अंतरराष्ट्रीय बाजार में प्रवेश किया, तो ओपनएआई ने अपने अंतर्निहित मॉडल लाभों के साथ एजेंट उद्योग को एक महत्वपूर्ण मोड़ पर ला दिया, जिससे प्रमुख निर्माताओं के प्लेटफार्मों पर अधिक डेवलपर्स और उपयोगकर्ताओं को आकर्षित किया गया। हालाँकि स्टार्टअप के पास ऊर्ध्वाधर क्षेत्रों में जीवित रहने की गुंजाइश है, फिर भी उन्हें अनिवार्य रूप से बाजार हिस्सेदारी के लिए प्रतिस्पर्धा की चुनौती का सामना करना पड़ता है। विशेष रूप से जब एजेंट उत्पाद वर्तमान में गंभीर एकरूपता, अस्पष्ट व्यापार मॉडल और उच्च लागत जैसी कठिनाइयों का सामना करते हैं, तो प्रासंगिक इंजीनियरिंग और अन्य पहलुओं में हाइलाइट्स स्टार्टअप के लिए पर्याप्त नहीं हैं। टीम को अभी भी तकनीकी रणनीतियों का अनुकूलन जारी रखने और विभेदित विकास पथ तलाशने की जरूरत है।