कृत्रिम बुद्धिमत्ता (एआई) आपके फंड मैनेजर को बदलने के लिए तैयार नहीं है, और सार्वजनिक परीक्षणों की एक श्रृंखला बताती है कि क्यों। दुनिया के अग्रणी एआई मॉडलों से जुड़ी व्यापारिक प्रतियोगिताओं की एक नई श्रृंखला में, एआई का प्रदर्शन अब तक बहुत अच्छा नहीं रहा है। अधिकांश प्रणालियों को नुकसान हुआ। वे बहुत बार व्यापार करते हैं और बिल्कुल समान निर्देश प्राप्त होने पर पूरी तरह से अलग निर्णय लेते हैं । और अभी तक कोई नहीं जानता कि क्या ये खामियां गायब हो जाएंगी क्योंकि मॉडल को पुनरावर्ती रूप से उन्नत किया जाता है, या क्या वे बड़े भाषा मॉडल और बाजार वास्तव में कैसे काम करते हैं, के बीच एक बुनियादी अंतर प्रकट करते हैं।
उदाहरण के तौर पर प्रौद्योगिकी स्टार्टअप Nof1 द्वारा संचालित अल्फा एरिना को लें। प्लेटफ़ॉर्म चार प्रतियोगिताओं में आठ प्रमुख अत्याधुनिक एआई सिस्टम को एक-दूसरे के खिलाफ खड़ा करता है, जिसमें एंथ्रोपिक का क्लाउड, गूगल का जेमिनी, ओपनएआई का चैटजीपीटी और एलोन मस्क का ग्रोक शामिल हैं। प्रत्येक सिस्टम को प्रत्येक खेल से पहले $10,000 से वित्त पोषित किया गया था और फिर दो सप्ताह के लिए स्वतंत्र रूप से अमेरिकी प्रौद्योगिकी शेयरों का कारोबार किया गया था। चुनौतियों में कई संकेतों पर व्यापार करना, रक्षात्मक रणनीतियाँ अपनाना, प्रतिस्पर्धी प्रदर्शन पर प्रतिक्रिया करना और उच्च उत्तोलन के साथ संचालन करना शामिल है।
कुल पोर्टफोलियो को अपनी पूंजी का लगभग एक-तिहाई हिस्सा खोना पड़ा। परिणामों के सभी 32 सेटों में से, मॉडल ने केवल 6 बार लाभप्रदता हासिल की। ग्रोक 4.20 एक चुनौती में सर्वोत्तम परिणाम प्राप्त करता है जो प्रतिस्पर्धियों के प्रदर्शन में अंतर्दृष्टि प्रदान करता है। इसने केवल 158 लेन-देन किए; अलीबाबा के कियानवेन ने उसी संकेत के तहत 1,418 लेनदेन किए।
अल्फ़ा एरिना संबंधित प्रयोगों की बढ़ती संख्या में से एक है। ये प्रयोग परीक्षण कर रहे हैं कि क्या बड़े भाषा मॉडल वित्त में सबसे कठिन काम कर सकते हैं: बाजार को मात देना। हालाँकि प्रतियोगिताएँ अकादमिक रूप से कठोर नहीं हैं, फिर भी ये सबसे सार्वजनिक प्रदर्शन हैं कि क्या होता है जब ये प्रणालियाँ वॉल स्ट्रीट की कुछ सबसे आकर्षक और जोखिम भरी नौकरियों को लेने की कोशिश करती हैं।
ये प्रारंभिक परिणाम महत्वपूर्ण हैं क्योंकि व्यापार वित्तीय उद्योग में कुछ नौकरियों में से एक है जो अभी भी पूरी तरह से एआई को सौंपने के बारे में सतर्क है। पिछले कुछ वर्षों में, जेपी मॉर्गन चेज़ से लेकर बाल्यास्नी एसेट मैनेजमेंट तक उद्योग के दिग्गजों ने लगभग हर दूसरे पहलू में इस तकनीक का उपयोग किया है। आज, बड़े भाषा मॉडल का उपयोग क्वांट संस्थानों में समाचारों को पार्स करने के लिए, हेज फंड में मेमो का मसौदा तैयार करने के लिए, बड़े बैंकों में धोखाधड़ी की पहचान करने के लिए और बहुत कुछ के लिए किया जाता है। लेकिन जब वास्तविक सोने और चांदी के लेनदेन की बात आती है, तो "मानव भागीदारी" अभी भी उद्योग का सिद्धांत है, और यह समझ में आता है।

Nof1 के संस्थापक जय अज़हांग
Nof1 के संस्थापक जय अज़हांग ने कहा: "बड़े भाषा मॉडल अपने आप में वास्तव में पैसा नहीं कमा सकते हैं। उन्हें खेलने का मौका देने के लिए आपको मूल रूप से बाधा ढांचे, समर्थन प्रणालियों और डेटा प्लेटफार्मों के एक बहुत ही जटिल सेट की आवश्यकता होती है।"
उन्होंने कहा कि बड़े भाषा मॉडल अनुसंधान करने में अच्छे हैं, और कुछ कार्यों के लिए उपयुक्त उपकरण ढूंढने और कॉल करने में भी अच्छे हैं। लेकिन वे अभी भी नहीं जानते हैं कि विश्लेषक रेटिंग, अंदरूनी व्यापार और बाजार की धारणा में बदलाव सहित स्टॉक मूल्य आंदोलनों को प्रभावित करने वाले कई चर कितने महत्वपूर्ण हैं। वे गलत समय पर व्यापार करते हैं, गलत तरीके से पोजीशन का आकार तय करते हैं और बार-बार खरीदारी और बिक्री करते हैं।
AI ब्लॉग फ्लैट सर्कल ने 11 बाजार-संबंधित प्रतिस्पर्धी प्लेटफार्मों को ट्रैक किया, जिनमें से सभी में कम से कम एक मॉडल है जिसने लाभप्रदता हासिल की है। लेकिन इन 11 प्लेटफार्मों में से, केवल दो प्लेटफार्मों के मध्य मॉडल ने लाभप्रदता हासिल की, यह दर्शाता है कि अधिकांश मॉडल बाजार को मात देने के लिए संघर्ष करते हैं।
यह परिणाम मानवीय प्रदर्शन को दर्शाता है, क्योंकि अधिकांश सक्रिय रूप से प्रबंधित फंड बाजार में भी कमजोर प्रदर्शन के लिए जाने जाते हैं। और इंसानों की तरह ही, ये मॉडल भी महत्वपूर्ण पूर्वाग्रहों से ग्रस्त हैं। कई प्रतियोगिताओं से पता चला है कि समान निर्देश दिए जाने पर एआई सिस्टम बहुत अलग निर्णय लेते हैं, जिसका उन संस्थानों पर महत्वपूर्ण प्रभाव पड़ता है जो उन्हें तैनात करते हैं। अज़हांग ने एक उदाहरण दिया. अल्फा एरिना में प्रतियोगिता के नवीनतम दौर में, क्लाउड ज्यादातर लंबे समय तक टिके रहे, जेमिनी को कम बिक्री से कोई गुरेज नहीं था, और कियानवेन उच्च उत्तोलन की मदद से जोखिम लेने के लिए अधिक इच्छुक थे।
डौग क्लिंटन, जो इंटेलिजेंट अल्फा चलाते हैं, ने कहा: "उनका अपना 'व्यक्तित्व' है, और आपको उन्हें उसी तरह प्रबंधित करना होगा जैसे आप एक मानव विश्लेषक करेंगे।" उन्होंने कहा कि यदि मॉडल को इस बात से अवगत कराया जाए कि यह किसी प्रकार का पूर्वाग्रह प्रदर्शित करता है तो परिणामों में सुधार किया जा सकता है। इंटेलिजेंट अल्फा के पास बड़े भाषा मॉडल द्वारा संचालित एक फंड है जो एआई कॉर्पोरेट आय की कितनी अच्छी भविष्यवाणी करता है, इस पर अपना स्वयं का बेंचमार्क प्रकाशित करता है।
इंटेलिजेंट अल्फा का बेंचमार्क वित्तीय फाइलिंग, विश्लेषक पूर्वानुमान, कमाई कॉल मिनट, व्यापक आर्थिक डेटा और 10 एआई मॉडल के लिए 10 वेब खोजों तक पहुंच प्रदान करता है। बड़े भाषा मॉडल अपने संकीर्ण फोकस के कारण इस परीक्षण में अधिक आक्रामक प्रदर्शन करते हैं। 2025 की चौथी तिमाही में, अपेक्षित आय परिवर्तनों की दिशा को पहचानने में ओपनएआई के चैटजीपीटी की सटीकता 68% तक पहुंच गई, जो अब तक का सबसे अच्छा परिणाम है। क्लिंटन ने कहा, ये मॉडल आमतौर पर प्रत्येक नई रिलीज के साथ बेहतर होते रहते हैं।