2024 जेनरेटिव एआई/बड़े बेस मॉडल और रोबोटिक्स के मिलन में एक बड़ा वर्ष होगा। सीखने से लेकर उत्पाद डिजाइन तक, अनुप्रयोगों की संभावनाएं रोमांचक हैं। Google के डीपमाइंड रोबोटिक्स शोधकर्ता इस क्षेत्र की क्षमता तलाशने वाली कई टीमों में से एक हैं। आज एक ब्लॉग पोस्ट में, टीम ने चल रहे शोध पर प्रकाश डाला है जिसका उद्देश्य रोबोटों को इस बात की बेहतर समझ देना है कि हम इंसान उनसे क्या कराना चाहते हैं।
परंपरागत रूप से, एक रोबोट का जीवन एक ही कार्य को बार-बार करने पर केंद्रित होता है। एकल-उद्देश्यीय बॉट इस एक चीज़ में बहुत अच्छे होते हैं, लेकिन फिर भी अनजाने परिवर्तन या त्रुटियाँ उत्पन्न होने पर वे संघर्ष कर सकते हैं।
नव जारी ऑटोआरटी को विभिन्न प्रयोजनों के लिए बड़े आधार मॉडल का उपयोग करने के लिए डिज़ाइन किया गया है। डीपमाइंड टीम द्वारा दिए गए एक मानक उदाहरण में, सिस्टम पहले स्थितिजन्य जागरूकता में सुधार के लिए एक दृश्य भाषा मॉडल (वीएलएम) का उपयोग करता है। ऑटोआरटी एक साथ काम करने वाले रोबोटों के एक बेड़े का प्रबंधन करता है और पर्यावरण के लेआउट और उसके भीतर की वस्तुओं को पकड़ने के लिए कैमरों से लैस होता है।
साथ ही, बड़े भाषा मॉडल ऐसे कार्यों का भी प्रस्ताव कर सकते हैं जिन्हें हार्डवेयर, टर्मिनल निष्पादकों सहित, निष्पादित कर सकता है। कई लोगों का मानना है कि भाषा मॉडल रोबोटिक्स को अनलॉक करने की कुंजी है, जो उन्हें अधिक प्राकृतिक भाषा निर्देशों को प्रभावी ढंग से समझने और हार्ड-कोडेड कौशल की आवश्यकता को कम करने की अनुमति देता है।
पिछले सात से अधिक महीनों में इस प्रणाली का व्यापक परीक्षण किया गया है। AutoRT एक साथ 20 रोबोट और 52 विभिन्न उपकरणों को समन्वयित करने में सक्षम है। कुल मिलाकर, डीपमाइंड ने लगभग 77,000 परीक्षण एकत्र किए हैं, जिनमें 6,000 से अधिक कार्य शामिल हैं।
टीम में नया आरटी-ट्रैजेक्टरी भी है, जो रोबोट सीखने के लिए वीडियो इनपुट का उपयोग करता है। कई टीमें बड़े पैमाने पर रोबोटों को प्रशिक्षित करने के तरीके के रूप में यूट्यूब वीडियो का उपयोग करने की खोज कर रही हैं, लेकिन आरटी-ट्रैजेक्टरी वीडियो के शीर्ष पर हाथ आंदोलनों के 2 डी स्केच को सुपरइम्पोज़ करके एक दिलचस्प परत जोड़ता है।
टीम ने कहा, "आरजीबी छवियों के रूप में ये प्रक्षेप पथ, मॉडल को निम्न-स्तरीय व्यावहारिक दृश्य संकेत प्रदान करते हैं क्योंकि यह रोबोट नियंत्रण रणनीतियों को सीखता है।"
डीपमाइंड ने कहा कि जब 41 कार्यों पर परीक्षण किया गया, तो इस प्रशिक्षण की सफलता दर आरटी-2 प्रशिक्षण की तुलना में दोगुनी, क्रमशः 63% और 29% थी।
टीम ने कहा, "आरटी-ट्रैजेक्टरी रोबोट गति की जानकारी की समृद्ध संपदा का उपयोग करती है जो सभी रोबोट डेटासेट में मौजूद है लेकिन वर्तमान में इसका कम उपयोग किया जाता है।" "आरटी-प्रक्षेपवक्र न केवल ऐसे रोबोट बनाने की दिशा में एक और कदम का प्रतिनिधित्व करता है जो नई स्थितियों में कुशलतापूर्वक और सटीक रूप से आगे बढ़ सकते हैं, बल्कि मौजूदा डेटा सेट से ज्ञान को भी अनलॉक कर सकते हैं।"