पिछले सप्ताह में घरेलू बड़े मॉडलों को बार-बार अपग्रेड किया गया है। GLM-5.1 और MiniMax 2.7 के खुले स्रोत के बाद, डार्क साइड ऑफ़ द मून का किमी K2.6-कोड-पूर्वावलोकन भी उपलब्ध है। यह एआई प्रोग्रामिंग के लिए विशेष रूप से अनुकूलित खरबों मापदंडों वाला एक बड़ा मॉडल है। आधिकारिक वेबसाइट बताती है कि यह पहले से ही ऑनलाइन है।हालाँकि, इस बड़े मॉडल का अनुभव करने के लिए, आपको किमी की सदस्यता योजना की आवश्यकता है, जो प्रति माह 39 युआन से शुरू होती है और इसका उपयोग किमी कोड में किया जा सकता है।

हालाँकि, K2.6-कोड-पूर्वावलोकन बड़ा मॉडल अपेक्षाकृत कम महत्वपूर्ण है। पिछले आंतरिक बीटा के लिए ज़्यादा प्रचार नहीं किया गया था। पिछले दो दिनों में जब इसे जारी किया गया तो ही मैंने किसी को इसका उल्लेख करते देखा। किमी अधिकारियों ने इसका प्रचार-प्रसार ज्यादा धूमधाम से नहीं किया। यहां तक ​​कि आधिकारिक वेबसाइट पर भी इस बड़े मॉडल के लिए अभी तक कोई विशेष अपग्रेड नहीं देखा गया है।

आंतरिक बीटा फीडबैक और परिचय से देखते हुए, जिसमें लोगों ने इंटरनेट पर भाग लिया है, K2.6-कोड-पूर्वावलोकन को K 2.5 के आधार पर बेहतर बनाया गया है, जो खरबों मापदंडों वाला एक बड़ा मॉडल है। मुख्य अनुकूलन अभी भी एआई प्रोग्रामिंग है। K 2.5 का SWE-बेंच सत्यापित सूची स्कोर 76.8% है, और LiveCodeBench 85% है।

K2.6-कोड-पूर्वावलोकन की सुधार दिशा मुख्य रूप से तर्क की गहराई, एजेंट योजना की गुणवत्ता और मल्टी-स्टेप टूल कॉल की विश्वसनीयता है।कुछ आंतरिक परीक्षकों ने कहा कि सोच श्रृंखला में ओपस की शैली है (यह बहुत गहरा है)।

जहां तक ​​विशिष्ट स्तर की बात है, वर्सन एक बड़ा आदमी है जिसने अपनी प्रोग्रामिंग क्षमता का मूल्यांकन स्वयं किया है।K2.6-कोड-पूर्वावलोकन का स्कोर 89 है, जो K 2.5 के स्कोर 83 से 6 अंक अधिक है।हालाँकि, पिछले शीर्ष खिलाड़ियों के बीच अभी भी अंतर है।

अन्य निर्माताओं की तुलना में जो हमेशा कहते हैं कि वे अपनी प्रचार सामग्री में ओपस 4.6 को पकड़ लेंगे या उससे आगे निकल जाएंगे, K2.6-कोड-पूर्वावलोकन में कुछ नेटिज़न्स वर्तमान में इसे सॉनेट 4.6 स्तर के रूप में मूल्यांकन करते हैं, जो बहुत मजबूत भी है।

इसका उपयोग करने वाले नेटिज़न्स द्वारा दी गई समीक्षाएँ अभी भी अच्छी हैं। निर्देशों का पालन करने की क्षमता बुरी नहीं है और क्षमता भी अच्छी है. अब किमी के कोडिंग प्लान पैकेज के साथ मिलकर, यह कम से कम एआई प्रोग्रामिंग के लिए एक शक्तिशाली और लागत प्रभावी विकल्प प्रदान करता है।