एंथ्रोपिक ने आधिकारिक तौर पर क्लाउड फैबल 5 और क्लाउड मिथोस 5 को रिलीज़ किया है। पहला आम उपयोगकर्ताओं के लिए खुला है, जबकि बाद वाला "विश्वसनीय सुरक्षा भागीदारों" तक ही सीमित है। नए मॉडल का नामकरण क्लाउड की सुसंगत शैली के अनुरूप कहा जा सकता है।

हाइकु (हाइकू) से लेकर सॉनेट (सॉनेट) से लेकर ओपस (कलात्मक कृति) तक, एंथ्रोपिक साहित्यिक और कलात्मक अवधारणाओं के साथ मॉडल पेश कर रहा है। मिथोस द्वारा, नाम का विस्तार साहित्यिक कार्यों से "पौराणिक कथाओं" तक हो गया है।
कल्पित कहानी लैटिन फैबुला से आई है, जिसका अर्थ है "कुछ जो बताया गया है", और इसका मूल ग्रीक मिथोस के समान है। जब इसका शाब्दिक अनुवाद किया जाता है, तो इसे आम तौर पर "कल्पित कहानी" कहा जाता है। नाम बिल्कुल नए मॉडल की स्थिति की तरह है, एक "माइथोस-स्तर" मॉडल, एक "खुला मिथक"।
एंथ्रोपिक के विवरण के अनुसार, फैबल 5 और मिथोस 5 एक ही अंतर्निहित मॉडल को साझा करते हैं, लेकिन सार्वजनिक वितरण के लिए अधिक उपयुक्त एक सुरक्षित शेल में पैक किए गए हैं। आधिकारिक मॉडल क्षमताओं के संदर्भ में, इन दोनों को एक ही स्थिति में रखा गया है।

लेकिन स्कोर तो स्कोर होते हैं, और यदि फैबल और मिथोस ने बिल्कुल वैसा ही प्रदर्शन किया, तो मुझे लगता है कि उन्हें दो नामों में अलग करने की कोई आवश्यकता नहीं होगी।
पुनः लिखा गया "मिथक"
मिथकों को फिर से लिखा गया, संपीड़ित किया गया और चेतावनी दी गई और वे दंतकथाएँ बन गईं।
आधिकारिक दस्तावेज़ीकरण के अनुसार, फ़ेबल 5 एक सार्वजनिक संस्करण है। यह सामान्य उपयोगकर्ताओं और डेवलपर्स के लिए खुला है, लेकिन नेटवर्क सुरक्षा, जीव विज्ञान, रसायन विज्ञान और मॉडल आसवन जैसे उच्च जोखिम वाले क्षेत्रों में, अतिरिक्त सुरक्षा क्लासिफायर शामिल होंगे। एक बार जब सिस्टम यह निर्धारित कर लेता है कि अनुरोध में ये संवेदनशील निर्देश शामिल हो सकते हैं, तो उत्तर कल्पित 5 द्वारा जारी नहीं रखा जाएगा, बल्कि स्वचालित रूप से क्लाउड ओपस 4.8 पर वापस आ जाएगा।
मिथोस 5 उसी अंतर्निहित मॉडल पर आधारित है, लेकिन कुछ क्षेत्रों में फैबल 5 की रेलिंग को हटा देता है। एंथ्रोपिक ने कहा कि प्रोजेक्ट ग्लासविंग में नेटवर्क सुरक्षा भागीदार मिथोस 5 के "पूर्ण संस्करण" का उपयोग कर सकते हैं; भविष्य में, कुछ जीवन विज्ञान शोधकर्ता ऐसे संस्करणों का भी उपयोग कर सकते हैं जो ट्रस्टेड एक्सेस प्रोग्राम के माध्यम से जैविक और रासायनिक प्रतिबंधों को हटाते हैं।
हम अभी अप्रयुक्त मिथोस का उल्लेख नहीं करेंगे, आइए पहले कुछ व्यावहारिक चीजों पर नजर डालें।
पहला है मूल्य निर्धारण. एक शब्द में कहें तो महँगा।
फ़ेबल 5 की कीमत इनपुट के लिए $10/मिलियन टोकन और आउटपुट के लिए $50/मिलियन टोकन है। डेवलपर्स अब क्लाउड एपीआई के माध्यम से क्लाउड-फेबल-5 (मॉडल नाम) को कॉल कर सकते हैं।
यह कीमत ओपस 4.8 से बिल्कुल दोगुनी है और यह ओपस 4.8 के फास्ट मोड के समान है। एंथ्रोपिक ने स्पष्ट रूप से इसे ओपस की तुलना में अधिक कीमत स्तर पर रखा है।
हालाँकि, एंथ्रोपिक ने कहा कि यह कीमत पिछले क्लाउड माइथोस प्रीव्यू के आधे से भी कम है - लेकिन चूंकि माइथोस प्रीव्यू एक सार्वजनिक एपीआई मॉडल नहीं है, इसलिए अधिकारी ने जनता के लिए कोई मानक कीमत नहीं दी है, और इस वाक्य को सत्यापित नहीं किया जा सकता है।
सब्सक्राइबर्स को यह भी ध्यान रखना होगा कि फैबल 5 को लंबे समय तक सीधे बेसिक सब्सक्रिप्शन पैकेज में शामिल नहीं किया जा सकता है।
एंथ्रोपिक ने अपने आधिकारिक विवरण में उल्लेख किया है कि 23 जून के बाद, भले ही उपयोगकर्ताओं ने क्लाउड की सदस्यता ली हो, फ़ेबल 5 को कंप्यूटिंग शक्ति के आधार पर वॉल्यूम के आधार पर प्रदान किया जा सकता है और इसे सीधे मूल सदस्यता सेवा में शामिल नहीं किया जा सकता है।
यह कंपनी अधिक से अधिक कंजूस होती जा रही है, लेकिन कम से कम उनके पास अभी भी आधे महीने की परीक्षण अवधि है। अधिकारी ने कुछ छूट भी छोड़ी: यदि 23 जून के बाद कंप्यूटिंग पावर संसाधन पर्याप्त हैं, तो एंथ्रोपिक प्रो, मैक्स और अन्य सदस्यता सेवाओं में फैबल 5 को शामिल करना जारी रखने का प्रयास करेगा।

ऊंची कीमत को अपने आप में समझना मुश्किल नहीं है, लेकिन यह सुनिश्चित करना सबसे अच्छा है कि इसकी क्षमताएं इसकी कीमत के लायक हैं।
चल रहे स्कोरों को देखते हुए, फैबल 5/माइथोस 5 मूल रूप से एंथ्रोपिक का वर्तमान में सबसे मजबूत है।
हालाँकि, आधिकारिक तालिका में एक नोट है कि क्लाउड फैबल 5 और क्लाउड मिथोस 5 के स्कोर में आम तौर पर केवल 1-3 प्रतिशत अंक का अंतर होता है (नेटवर्क सुरक्षा और तारांकन के साथ जैव-संबंधित परीक्षणों को छोड़कर), इसलिए तालिका दोनों के उच्च स्कोर को दर्शाती है। इस बारे में शिकायत न करना कठिन है।

एंथ्रोपिक फ़ेबल 5 को कई दिशाओं पर केंद्रित करता है: सॉफ़्टवेयर इंजीनियरिंग, ज्ञान कार्य, दृष्टि, दीर्घकालिक संदर्भ स्मृति और जीवन विज्ञान अनुसंधान।
सॉफ्टवेयर इंजीनियरिंग सबसे प्रमुख परिदृश्यों में से एक है। तालिका के अनुसार, Fable/Mythos 5 SWE-बेंच प्रो पर 80.3% तक पहुंच गया, जो कि ओपस 4.8 के 69.2% से काफी अधिक है; अधिक कठिन फ्रंटियरकोड डायमंड पर, इसे 29.3% मिला, जबकि ओपस 4.8 को केवल 13.4%, और जीपीटी-5.5 को केवल 5.7% मिला।


ज्ञान कार्य एवं दृश्य कार्यों के लिए एन्थ्रोपिक दो प्रकार के प्रमाण देता है।
एक प्रकार मानकीकृत बेंचमार्क है। आधिकारिक तालिका से पता चलता है कि Fable/Mythos 5 ने GDPval-AA पर 1932 स्कोर किया, जो Opus 4.8, GPT-5.5 और जेमिनी 3.1 प्रो से अधिक है; दृश्य समझ के साथ जीडीपी.पीडीएफ दस्तावेज़ कार्य पर, यह 29.8% तक पहुंच गया, जो अन्य प्रमुख मॉडलों से भी आगे निकल गया।
एक अन्य श्रेणी प्रारंभिक ग्राहक परीक्षण है। एंथ्रोपिक ने कहा कि फैबल 5 ने हेब्बिया के उन्नत वित्तीय तर्क बेंचमार्क पर उच्चतम स्कोर हासिल किया, इसके फायदे दस्तावेज़ तर्क, चार्ट और तालिका समझ और समस्या समाधान पर ध्यान केंद्रित करते हैं; आईएमसी ने यह भी बताया कि उसने लेनदेन विश्लेषण मूल्यांकन को लगभग पूरी तरह से पास कर लिया है।
फ़ेबल 5 की दृश्य क्षमताओं को प्रदर्शित करने के लिए, एंथ्रोपिक ने एक उदाहरण दिया: पहले, क्लाउड मॉडल को "पोकेमॉन: फायर रेड" खेलने के लिए जटिल सहायक उपकरणों की आवश्यकता होती थी, लेकिन फ़ेबल 5 केवल दृश्य इनपुट के साथ स्तर को पूरा कर सकता है।

दीर्घकालिक कार्यों और स्मृति क्षमताओं के संदर्भ में, एंथ्रोपिक ने कहा कि फैबल 5 लाखों टोकन के साथ दीर्घकालिक कार्यों पर केंद्रित रह सकता है और आउटपुट में सुधार के लिए अपने स्वयं के नोट्स का उपयोग कर सकता है।
"स्ले द स्पायर" जैसे खेलों में, जिनमें निरंतर निर्णय लेने और दीर्घकालिक रणनीति की आवश्यकता होती है, यदि फ़ेबल 5 को लगातार फ़ाइल मेमोरी से जोड़ा जाता है ताकि यह पिछले विकल्पों और अनुभवों को रिकॉर्ड कर सके, तो इसके प्रदर्शन में काफी सुधार होगा। सुधार ओपस 4.8 की तुलना में तीन गुना है, और आप जितनी बार अंतिम स्तर तक पहुंच सकते हैं उसकी संख्या भी तीन गुना बढ़ गई है।
वैसे, फ़ेबल एक क्लासिक आरपीजी गेम का नाम भी है, जिसका चीनी भाषा में अनुवाद "फ़ेबल" है - शायद एक दिन हम फ़ेबल को "फ़ेबल" खेलते हुए देख सकें।
इसके अलावा, नेटवर्क सुरक्षा क्षमताओं के संदर्भ में, फ़ेबल/माइथोस 5 एक्सप्लॉइटबेंच कैप% में 78.0% तक पहुंच गया, जो क्लाउड माइथोस प्रीव्यू के 69.0% से अधिक और ओपस 4.8 से लगभग दोगुना है।
मिथोस 5 के स्कोर का उपयोग यहां किया जाना चाहिए, क्योंकि उच्च जोखिम वाले अनुरोधों पर फैबल 5 ओपस 4.8 पर वापस आ जाएगा।
मजबूत मॉडलों को स्तरित किया जाना चाहिए
इस बार, एंथ्रोपिक ने मॉडल की क्षमताओं के दृश्य प्रदर्शन को "पोर्टफोलियो" के समान एक स्लाइडिंग पृष्ठ में रखा, और प्रत्येक डेमो के लिए केवल टिप्पणियों का एक छोटा पैराग्राफ दिया।

उदाहरण के लिए, कल्पित 5 ने एक सौर मंडल सिमुलेशन लिखा था जिसने भौतिकी के पहले सिद्धांतों से ग्रहों की कक्षीय गति का अनुमान लगाया और इसका उपयोग सौर ग्रहणों की भविष्यवाणी करने के लिए किया।

दूसरे उदाहरण के लिए, यह स्वतंत्र रूप से "फ़ैक्टरी" खेल सकता है। यह एक फ़ैक्टरी ऑटोमेशन गेम है जिसे इंजीनियर पसंद करते हैं। खिलाड़ियों को संसाधन इकट्ठा करने, उत्पादन लाइनों की योजना बनाने और रसद और ऊर्जा प्रणालियों का निर्माण करना होगा।
एन्थ्रोपिक ने इस उदाहरण का उपयोग यह दर्शाने के लिए किया कि कल्पित 5 एक खुले वातावरण में रणनीतियाँ बना सकता है और एक जटिल प्रणाली के निर्माण को बढ़ावा देना जारी रख सकता है।

एक अन्य डेमो में, फ़ेबल 5 ने पहले एक ब्राउज़र-आधारित सीएडी संपादक बनाया, और फिर एक संपूर्ण मॉडल डिज़ाइन करने के लिए इस स्व-विकसित सीएडी टूल का उपयोग किया जिसे 3डी प्रिंट किया जा सकता है। इस संपादक में मॉडलिंग में सहायता के लिए अंतर्निहित एआई कोपायलट भी है।
इस डेमो का फोकस यह है कि फ़ेबल 5 एक बंद लूप को पूरा करता है: पहले टूल बनाएं, फिर टूल का उपयोग करें, और अंत में एक भौतिक डिज़ाइन कार्य पूरा करें।

अंतिम डेमो, एंथ्रोपिक ने फैबल 5 द्वारा लिखित एक तरल सिमुलेशन दिखाया, जिसमें शास्त्रीय संगीत ईडीएम रीमिक्स के साथ गति लय को सिंक्रनाइज़ किया गया था। अधिकारी ने यह भी विशेष रूप से उल्लेख किया कि संगीत भी कोड का उपयोग करके Fable 5 द्वारा उत्पन्न किया गया है।

ये उदाहरण आकर्षक लगते हैं, लेकिन विचार एक ही है: कल्पित 5 कोड, दृष्टि, भौतिकी, डिज़ाइन और दीर्घकालिक योजना को कार्यों में मिलाने में बहुत अच्छा है।
यदि यह भाग दिखाता है कि फ़ेबल 5 डेवलपर्स के हाथों में क्या कर सकता है, तो निम्नलिखित भाग इस बारे में बात करता है कि मिथोस 5 शोधकर्ताओं के हाथों में क्या कर सकता है - और एंथ्रोपिक फ़ेबल और मिथोस को अलग क्यों करना चाहता है।
एंथ्रोपिक ने कहा कि आंतरिक प्रोटीन डिजाइन विशेषज्ञों द्वारा मूल्यांकन में, मिथोस 5 ने दवा डिजाइन प्रक्रिया के कुछ पहलुओं को लगभग 10 गुना तेज कर दिया। एक मामले में, मिथोस 5 ने कुशल मानव ऑपरेटरों की बराबरी करने या यहां तक कि उनसे आगे निकलने के लिए, मानव सहायता के बिना, प्रोटीन डिजाइन और जैव सूचना विज्ञान उपकरणों में प्लग इन किया।
इस कार्य में, मिथोस 5 केवल प्रश्नों का उत्तर नहीं देता है, बल्कि वैज्ञानिक वर्कफ़्लो का एक पूरा सेट पूरा करता है: बाइंडिंग साइटों का चयन करना, प्रोटीन डिज़ाइन टूल का चयन करना और चलाना, और विफलता के बाद खुद को पुनर्प्राप्त करना। अधिकारियों ने कहा कि इस अध्ययन में 14 प्रोटीन लक्ष्यों में से 9 ने मजबूत उम्मीदवार अणुओं का उत्पादन किया और वर्तमान में आगे के शोध से गुजर रहे हैं।

एंथ्रोपिक ने यह भी उल्लेख किया कि मिथोस 5 लगातार उपन्यास और आकर्षक आणविक जीव विज्ञान परिकल्पनाओं का प्रस्ताव कर सकता है। ओपस-स्तरीय मॉडलों के साथ एक अंध परीक्षण तुलना में, इन-हाउस वैज्ञानिकों ने लगभग 80% समय मिथोस द्वारा प्रस्तावित परिकल्पनाओं को प्राथमिकता दी, जिनमें से कुछ का प्रयोगात्मक रूप से मूल्यांकन किया गया है।
इस बीच, ई. कोली प्रोटीन के लिए एक नए तंत्र के बारे में मिथोस 5 की एक परिकल्पना की पुष्टि उसी समस्या का स्वतंत्र रूप से अध्ययन करने वाली एक अन्य प्रयोगशाला द्वारा किए गए अध्ययन में की गई।
इसने एक जीनोमिक्स अध्ययन भी किया।
एंथ्रोपिक ने कहा कि मिथोस 5 ने एक नया जीनोमिक्स अध्ययन लगभग स्वायत्त रूप से केवल एक सप्ताह में पूरा कर लिया। इसने 138 पशु प्रजातियों में लाखों कोशिकाओं से एकल-कोशिका डेटा को व्यवस्थित किया और विभिन्न प्रजातियों में समान भूमिका निभाने वाली कोशिकाओं की पहचान करने के लिए एक कस्टम मशीन लर्निंग मॉडल को डिजाइन और प्रशिक्षित किया।
इससे भी अधिक अतिरंजित बात यह है कि एंथ्रोपिक का दावा है कि मिथोस 5 द्वारा प्रशिक्षित मॉडल का प्रदर्शन हाल ही में साइंस में प्रकाशित मॉडल से अधिक है, हालांकि इसका पैमाना बाद वाले मॉडल का केवल एक प्रतिशत है। एंथ्रोपिक ने कहा कि वह आने वाले महीनों में इन परिणामों को प्रकाशित करने की योजना बना रहा है।
बेशक, इस हिस्से को अभी भी पेपर और बाहरी समीक्षा की प्रतीक्षा करनी होगी। लेकिन यदि आप केवल एंथ्रोपिक द्वारा प्रदान की गई आधिकारिक जानकारी को देखें, तो जीवन विज्ञान में मिथोस 5 की क्षमताएं एक वैज्ञानिक अनुसंधान एजेंट के करीब हैं: यह प्रश्नों को पढ़ सकता है, उपकरण का उपयोग कर सकता है, डेटा को संसाधित कर सकता है, मॉडल को प्रशिक्षित कर सकता है, परिकल्पनाओं का प्रस्ताव कर सकता है और एक शोध को उस बिंदु तक आगे बढ़ा सकता है जहां इसे प्रकाशित किया जा सकता है।
एक बार जब कोई मॉडल वास्तव में दवा डिजाइन, वायरल वैक्टर, प्रोटीन डिजाइन और जीनोमिक्स अनुसंधान में कार्यों को आगे बढ़ा सकता है, तो स्वाभाविक रूप से इसके दोहरे उपयोग होंगे।
यह माना जा सकता है कि जीवन विज्ञान भाग कल्पित 5 का सामान्य कार्यात्मक प्रदर्शन नहीं है, बल्कि मिथोस 5 की क्षमताओं की ऊपरी सीमा का प्रदर्शन है।
लेकिन यह स्पष्ट करने के लिए दिखाया गया है कि एंथ्रोपिक के हाथों में अंतर्निहित मॉडल इतना शक्तिशाली है कि इसे विश्वसनीय पहुंच के माध्यम से वितरित किया जाना चाहिए।
दिलचस्प बात यह है कि अतीत में मॉडल रिलीज़ एक तकनीकी उत्पाद की तरह था: पैरामीटर, रनिंग स्कोर, कीमत, संदर्भ लंबाई, एपीआई नाम। मजबूत मजबूत है, रिलीज रिलीज है।
लेकिन यहां मिथोस में चीजें जटिल होने लगती हैं। एक ही अंतर्निहित मॉडल को दो संस्करणों में विभाजित किया गया है। सामान्य उपयोगकर्ताओं को फ़ेबल 5 मिलता है, जबकि सुरक्षा शोधकर्ताओं और कुछ जीवन विज्ञान शोधकर्ताओं को मिथोस 5 मिलता है; पहले को सख्त रेलिंगों में स्थापित किया गया है, और बाद वाले को विश्वसनीय पहुंच की आवश्यकता है।
मॉडल क्षमताओं को अब न केवल उच्च और निम्न द्वारा, बल्कि अधिकार, परिदृश्यों और जिम्मेदारियों द्वारा भी विभेदित किया जाता है।
एक तरह से, इसे एक संकेत के रूप में देखा जा सकता है कि अत्याधुनिक मॉडलों का व्यावसायीकरण एक नए चरण में प्रवेश कर गया है - मॉडल जितना मजबूत होगा, इसे सभी के लिए सीधे फेंकने की संभावना उतनी ही कम होगी। उन्हें विभिन्न संस्करणों में विभाजित किया जाएगा, विभिन्न सुरक्षा सीमाओं में रखा जाएगा, और फिर विभिन्न प्रकार के उपयोगकर्ताओं को दिया जाएगा।
एंथ्रोपिक ने ऐसा पहले इसलिए किया क्योंकि उनका मॉडल "पूरी तरह से खुलासा करने के लिए बहुत मजबूत था।" भविष्य में, अन्य कंपनियाँ जो कहानियाँ बताना चाहती हैं और यह साबित करना चाहती हैं कि उनके मॉडल मजबूत हैं, वे भी इस दृष्टिकोण का पालन कर सकती हैं।