18 मई को फाइनेंशियल टाइम्स ने बताया कि चीनी एआई कंपनियों ने वीडियो निर्माण के क्षेत्र में अमेरिकी प्रतिस्पर्धियों का नेतृत्व किया है। जेनरेटिव एआई के लिए एक प्रमुख युद्धक्षेत्र के रूप में,विज्ञापन, ई-कॉमर्स और मनोरंजन के क्षेत्र में वीडियो जेनरेशन तकनीक तेजी से लोकप्रियता हासिल कर रही है।वर्तमान में, बाइटडांस और कुआइशौ जैसी कंपनियां लघु वीडियो की विशाल लाइब्रेरी का उपयोग करके अपने सिस्टम को प्रशिक्षित कर रही हैं, जिससे उन्हें अपने अमेरिकी समकक्षों पर बढ़त मिल रही है।

एआई वीडियो जेनरेशन टूल का व्यापक रूप से उपयोग किया जाता है
यह परिवर्तन एआई दौड़ में एक विचलन का प्रतीक है: हालांकि ओपनएआई, गूगल और एंथ्रोपिक अभी भी बड़े भाषा मॉडल और प्रोग्रामिंग जैसे क्षेत्रों में हावी हैं, डेवलपर फीडबैक और कई मूल्यांकन रैंकिंग के अनुसार, उनके वीडियो पीढ़ी उपकरण गुणवत्ता और उपयोग में आसानी के मामले में चीनी कंपनियों के उत्पादों से पीछे रह गए हैं।
चीनी कंपनियों के फायदे
एआई स्टार्टअप निदेशक एआई के संस्थापक बेन चियांग ने कहा, "हमने जिन अमेरिकी मॉडलों को आजमाया उनमें से अधिकांश वीडियो निर्माण में बहुत अच्छे नहीं थे।" कंपनी एनिमेशन और लघु नाटक जैसी एआई-जनित सामग्री तैयार करती है। उनका मानना है कि अधिक जटिल और लंबी सामग्री मॉडरेशन ने अमेरिकी उपकरणों के विकास को सीमित कर दिया है, और उत्पन्न प्रभाव अक्सर पर्याप्त यथार्थवादी नहीं होते हैं।
निदेशक एआई मुख्य रूप से कुआइशौ द्वारा विकसित "केलिंग" वीडियो जेनरेशन टूल का उपयोग करता है। यह विशिष्ट कार्यों और लागत आवश्यकताओं के आधार पर बाइटडांस के सीडांस 2.0 और स्टार्टअप मिनीमैक्स के "कॉन्च" टूल के बीच भी स्विच करेगा।
"अंतिम विश्लेषण में, यह अभी भी पीढ़ी की गुणवत्ता और त्वरित शब्दों को समझने और निष्पादित करने की मॉडल की क्षमता पर निर्भर करता है।" बेन जियांग ने कहा। उन्होंने कहा कि हाल की तकनीकी प्रगति ने इन उपकरणों का उपयोग करना आसान बना दिया है, खासकर ऑडियो-विजुअल सिंक्रोनाइजेशन और आवाज स्थिरता के मामले में।
रचनाकारों के लिए, ये सुधार पहले से ही उनकी उत्पादन प्रक्रियाओं को नया आकार दे रहे हैं। जॉर्जिया के त्बिलिसी में स्थित एक स्वतंत्र एआई फिल्म निर्माता और संपादक जॉर्ज वोन ने कहा:"सीडांस 2.0 ने मेरी रचनात्मक स्वतंत्रता को काफी हद तक मुक्त कर दिया है।"
उन्होंने कहा, "यह चरित्र के चेहरे की विशेषताओं को खोए बिना या प्रकाश कंट्रास्ट को नष्ट किए बिना आक्रामक कैमरा कोण और तेज गति को संभालने में सक्षम है। अधिकांश एआई मॉडल तेजी से आगे बढ़ने पर स्क्रीन शेक या विषय बदलाव से पीड़ित होते हैं।"
उच्च रेटिंग
केलिंग, सीडांस 2.0 और अलीबाबा हैप्पीहॉर्स 1.0 सभी को एरेना प्लेटफॉर्म की सर्वश्रेष्ठ वीडियो मॉडल रैंकिंग में उच्च अंक प्राप्त हुए। रैंकिंग स्वतंत्र प्लेटफ़ॉर्म उपयोगकर्ताओं के वोटिंग डेटा के आधार पर संकलित की गई है। अधिकांश मॉडल बेंचमार्क परीक्षण प्रणालियों की तुलना में, इस प्रकार के मूल्यांकन को अधिक विश्वसनीय माना जाता है, क्योंकि प्रमुख एआई प्रयोगशालाएं अक्सर बेंचमार्क परीक्षणों के लिए अनुकूलन करती हैं, जिसके परिणामस्वरूप परिणाम वास्तविक परिदृश्यों में मॉडल के प्रदर्शन को सटीक रूप से प्रतिबिंबित नहीं कर सकते हैं।
Google का Veo 3 मॉडल भी काफी प्रतिस्पर्धी है। विशेषज्ञों ने कहा कि इस मॉडल का लाभ यह है कि यह यूट्यूब प्लेटफॉर्म पर वीडियो सामग्री प्राप्त कर सकता है, लेकिन साथ ही यह डेवलपर्स के लिए अधिक सामग्री सुरक्षा सुरक्षा और उपयोग प्रतिबंध निर्धारित करता है।

चीन का वीडियो जेनरेशन टूल सबसे ज्यादा स्कोर करता है
इस प्रगति के पीछे बड़ी मात्रा में मालिकाना वीडियो डेटा का नियंत्रण है। बाइटडांस और कुआइशौ दुनिया के अग्रणी लघु वीडियो प्लेटफ़ॉर्म संचालित करते हैं, जो उन्हें प्रशिक्षण लाभ प्रदान करते हैं जिन्हें प्रतिस्पर्धियों के लिए दोहराना मुश्किल होता है, खासकर जब से वीडियो सामग्री को टेक्स्ट की तरह बड़े पैमाने पर आसानी से क्रॉल नहीं किया जा सकता है।
पिछले हफ्ते, कुआइशौ ने घोषणा की कि वह अपने केलिंग व्यवसाय को बंद करने की संभावना तलाश रहा है और अपने एआई वीडियो व्यवसाय की तीव्र वृद्धि से उत्पन्न अवसरों का लाभ उठाने के लिए एक स्वतंत्र लिस्टिंग की तलाश कर सकता है।
ऐसी सामग्रियों के उपयोग ने बाहरी जांच को भी आकर्षित किया है। बाइटडांस को पहले कथित कॉपीराइट उल्लंघन पर कानूनी धमकियों का सामना करना पड़ा था, जिसमें उपयोगकर्ताओं को उचित प्राधिकरण के बिना मार्वल फिल्मों और "साउथ पार्क" टीवी श्रृंखला के पात्रों सहित पात्रों का उपयोग करके वीडियो बनाने की अनुमति देने का आरोप लगाया गया था।बाइटडांस ने कॉपीराइट सुरक्षा उपायों को मजबूत करने का वादा किया है।
कई डेवलपर्स और सामग्री निर्माताओं ने कहा कि ढीली सामग्री प्रतिबंध चीनी मॉडल को वास्तविक उपयोग के लिए अधिक सुविधाजनक बनाते हैं। बेन जियांग ने कहा,अमेरिकी उपकरण "त्रुटियों की रिपोर्ट करना जारी रखें", लेकिन विशिष्ट कारणों के बारे में आगे नहीं बताऊंगा।
उच्च लागत प्रदर्शन
व्यक्तिगत रचनाकारों के लिए, चीनी प्लेटफ़ॉर्म अक्सर पश्चिमी विकल्पों की तुलना में सस्ते और अधिक लचीले होते हैं। वे सदस्यता या भुगतान-एज़-यू-गो मॉडल की पेशकश करते हैं, जिससे उपयोगकर्ताओं को विभिन्न प्रकार के रचनात्मक प्रयोग तुरंत करने की अनुमति मिलती है। हालाँकि, इस साल फरवरी से, सीडांस 2.0 की मजबूत मांग के कारण, कुछ उपयोगकर्ताओं को सीमित उपयोग और लंबे समय तक प्रतीक्षा समय का अनुभव हुआ है।
एंटरप्राइज़ ग्राहकों के लिए, बाइटडांस ने एक अलग रणनीति अपनाई है। मामले से परिचित लोगों के अनुसार, कुछ अमेरिकी ग्राहकों के लिए, बाइटडांस को एक बड़े अग्रिम भुगतान की आवश्यकता होती है, और मॉडल एक्सेस और कोटा आवंटन प्राप्त करने के लिए ग्राहकों को लगभग 2 मिलियन अमेरिकी डॉलर का भुगतान करना पड़ता है। बाइटडांस ने टिप्पणी के अनुरोध का जवाब नहीं दिया।
कुछ उपयोगकर्ता BeHooked जैसे तृतीय-पक्ष प्लेटफ़ॉर्म के माध्यम से इन बाधाओं को दूर कर देते हैं। ऐसे प्लेटफ़ॉर्म इन मॉडलों को दोबारा पैक करते हैं और अलग-अलग मूल्य निर्धारण योजनाएं पेश करते हैं।
वीडियो बनाने के लिए टेक्स्ट या ऑडियो की तुलना में कहीं अधिक टोकन की आवश्यकता होती है, इसलिए बड़े पैमाने पर तैनाती बेहद महंगी है। इस साल मार्च में, OpenAI ने कंप्यूटिंग पावर की उच्च लागत के कारण आंशिक रूप से अपने सोरा वीडियो जेनरेशन मॉडल की सेवा बंद कर दी।
इस तकनीक के आधार पर व्यवसाय बनाने वाली कंपनियों के लिए, उत्पादन गुणवत्ता में हालिया छलांग व्यवसाय के अवसर पैदा कर रही है।
"अतीत में, जेनरेट किए गए वीडियो शर्मनाक और कठोर थे और ब्रांड के मानकों को पूरा नहीं करते थे। अब हम एक ऐसे स्तर पर पहुंच गए हैं जहां यह बताना मुश्किल है कि यह एआई द्वारा जेनरेट किया गया था या किसी वास्तविक व्यक्ति द्वारा शूट किया गया था।" ई-कॉमर्स वेबसाइटों के लिए वीडियो इंफ्रास्ट्रक्चर प्रदान करने वाली कंपनी फायरवर्क्स के सीईओ विंसेंट यांग ने कहा।
उसने कहा,प्रौद्योगिकी पहले से ही विज्ञापन उद्योग को नया आकार दे रही है, जिससे ब्रांडों को अभूतपूर्व पैमाने पर वीडियो सामग्री तैयार करने की अनुमति मिल रही है।
उन्होंने कहा, "एक बार एक खुदरा विक्रेता ने हमसे अपने उत्पाद पृष्ठों के लिए 100,000 वीडियो बनाने के लिए कहा था।" "एआई के बिना, लागत बहुत अधिक होगी। अब, प्रत्येक उत्पाद का अपना वीडियो हो सकता है, और यह विभिन्न ग्राहकों के लिए कई अनुकूलित संस्करण भी तैयार कर सकता है।"