以文本翻译工具闻名的 AI 公司 DeepL 今日发布一套语音到语音翻译产品组合,进军实时语音翻译市场,覆盖线上会议、移动与网页对话,以及一线员工通过定制应用参与的群组沟通等多种场景。 同时,DeepL 还推出面向开发者和企业的 API,支持在其技术之上为呼叫中心等业务定制专用语音翻译方案。

डीपएल के सीईओ जेरेक कुटिलोव्स्की ने एक साक्षात्कार में कहा कि पाठ अनुवाद पर वर्षों तक ध्यान केंद्रित करने के बाद, भाषण कंपनी का "स्वाभाविक अगला कदम" था। उन्होंने इस बात पर जोर दिया कि डीपएल ने पाठ और दस्तावेज़ अनुवाद में एक लंबा सफर तय किया है, लेकिन वास्तविक समय भाषण अनुवाद के क्षेत्र में, "अभी भी वास्तव में उत्कृष्ट उत्पाद की कमी है," यही वजह है कि कंपनी ने प्रवेश करने का फैसला किया।
कुटलोव्स्की ने बताया कि वास्तविक समय अनुवाद उत्पाद बनाने में मुख्य कठिनाई यह है कि विलंबता को कम करने और सटीकता बनाए रखने के बीच संतुलन कैसे बनाया जाए। तथाकथित विलंब का तात्पर्य उपयोगकर्ता के बोलने और अनुवादित आवाज बजाने के बीच के समय के अंतर से है। सम्मेलन और संवाद परिदृश्यों में, अंतर जितना छोटा होगा, उपयोगकर्ता का संचार अनुभव "एक साथ संवाद" के उतना ही करीब होगा।
इस रिलीज़ में, डीपएल ने ज़ूम और माइक्रोसॉफ्ट टीमों के लिए प्लग-इन लॉन्च किया है, जो दूरस्थ बैठकों में श्रोताओं को उनकी मूल भाषाओं में बोलने वाले सभी पक्षों को सुनने, वास्तविक समय में अनुवादित आवाज़ें सुनने या स्क्रीन पर वास्तविक समय में अनुवादित उपशीर्षक पढ़ने की अनुमति देता है। कार्यक्रम अभी भी प्रारंभिक परीक्षण में है, और डीपएल व्यवसायों को इस सुविधा को आज़माने वाले पहले व्यक्ति बनने के लिए प्रतीक्षा सूची में शामिल होने के लिए आमंत्रित कर रहा है। इसके अलावा, कंपनी मोबाइल टर्मिनलों और वेब पेजों के लिए वार्तालाप उत्पाद भी प्रदान करती है, जिससे उपयोगकर्ता व्यक्तिगत रूप से या दूर से क्रॉस-भाषा में संवाद कर सकते हैं।
प्रशिक्षण और सेमिनार जैसे बहु-व्यक्ति ऑफ़लाइन या ऑनलाइन समूह परिदृश्यों के लिए, डीपएल प्रतिभागियों को क्यूआर कोड को स्कैन करके एक ही सत्र में शामिल होने की अनुमति देता है, और हर कोई अपने डिवाइस पर संबंधित भाषा में अनुवादित सामग्री प्राप्त कर सकता है। डीपएल ने कहा कि उसकी स्पीच-टू-स्पीच तकनीक व्यावसायिक परिदृश्यों में इसके उपयोग को बेहतर बनाने के लिए कस्टम शब्दावली, जैसे ऊर्ध्वाधर उद्योग की शर्तें, कंपनी के नाम और व्यक्तिगत नाम भी सीख और अनुकूलित कर सकती है।
कुटलोव्स्की का मानना है कि एआई अगले कुछ वर्षों में ग्राहक सेवा उद्योग के आकार को नया आकार दे रहा है। उच्च गुणवत्ता वाली अनुवाद परत कंपनियों को ऐसे बाज़ार में बहुभाषी सेवा सहायता प्रदान करने में मदद कर सकती है जहां स्थानीय भाषा प्रतिभाओं की कमी है और भर्ती लागत अधिक है। इस दृष्टिकोण के तहत, डीपएल को उम्मीद है कि उसकी आवाज तकनीक न केवल सम्मेलन परिदृश्यों में सेवा प्रदान करेगी, बल्कि ग्राहक सेवा केंद्रों और वैश्विक उद्यमों के लिए बुनियादी भाषा बुनियादी ढांचे में से एक बन जाएगी।
तकनीकी रोडमैप पर, डीपएल ने कहा कि उसके वर्तमान उत्पाद स्व-विकसित पूर्ण "स्पीच-टू-स्पीच" प्रौद्योगिकी स्टैक द्वारा संचालित होते हैं, लेकिन इस स्तर पर यह अभी भी "स्पीच टू टेक्स्ट - टेक्स्ट ट्रांसलेशन - टेक्स्ट टू स्पीच" की तीन-चरणीय प्रक्रिया का उपयोग करता है। कंपनी का मानना है कि पाठ अनुवाद पर उसका दीर्घकालिक फोकस उसे समग्र अनुवाद गुणवत्ता में लाभ देता है। आगे बढ़ते हुए, डीपएल एक एंड-टू-एंड भाषण अनुवाद मॉडल विकसित करने की योजना बना रहा है जो विलंबता और स्वाभाविकता में और सुधार प्राप्त करने के लिए पाठ मध्यवर्ती चरणों को छोड़ देता है।
भाषण और अनुवाद के क्षेत्र में, डीपएल को कई स्टार्टअप्स से प्रतिस्पर्धा का सामना करना पड़ता है। उनमें से, सनास ने पिछले साल क्वाड्रिल कैपिटल और टेलीपरफॉर्मेंस से 65 मिलियन अमेरिकी डॉलर जुटाए थे। यह उस तकनीक पर केंद्रित है जो मुख्य रूप से कॉल सेंटर एजेंटों के लिए वास्तविक समय में स्पीकर के उच्चारण को संशोधित करती है। Camb.AI, जिसका मुख्यालय दुबई में है, मीडिया और मनोरंजन कंपनियों के लिए भाषण संश्लेषण और अनुवाद सेवाएं प्रदान करता है, जिससे ग्राहकों को बड़े पैमाने पर सामग्री की डबिंग और स्थानीयकरण पूरा करने में मदद मिलती है। Reddit के सह-संस्थापक एलेक्सिस ओहानियन के फंड सेवन सेवन सिक्स द्वारा निवेश किया गया पलाब्रा, एक वास्तविक समय भाषण अनुवाद इंजन बनाता है जो अनुवाद प्रक्रिया के दौरान स्पीकर की मूल आवाज विशेषताओं को बनाए रखने की कोशिश पर जोर देता है, जिससे डीपएल द्वारा बनाई जा रही क्षमताओं के साथ अधिक प्रत्यक्ष प्रतिस्पर्धी संबंध बनता है।
टेक्स्ट ट्रांसलेशन मार्केट में पैर जमाने के बाद, डीपएल वॉयस उत्पादों के माध्यम से अपनी सीमाओं का विस्तार करने, सम्मेलन सहयोग, ग्राहक सेवा और फ्रंट-लाइन ऑपरेशन परिदृश्यों तक प्रौद्योगिकी का विस्तार करने की कोशिश कर रहा है। जैसे-जैसे अधिक कंपनियां क्रॉस-भाषा संचार लागत को कम करने के लिए एआई का उपयोग करना चाहती हैं, वास्तविक समय भाषण अनुवाद प्रतिस्पर्धा के नए दौर का फोकस बनने की उम्मीद है, और डीपएल इस ट्रैक पर अपनी तैनाती में तेजी ला रहा है।