वाशिंगटन विश्वविद्यालय के शोधकर्ताओं का कहना है कि वे अब छोटे ऑडियो रोबोटों के झुंड की बदौलत शोरगुल वाले कमरे के विभिन्न हिस्सों को शांत कर सकते हैं, या अव्यवस्थित वातावरण में बातचीत को अलग कर सकते हैं, जो स्वायत्त रूप से कई गतिशील ध्वनि स्रोतों का पता लगा सकते हैं, इंगित कर सकते हैं और ट्रैक कर सकते हैं।
हम मनुष्य अपनी आँखें बंद करके ध्वनि स्रोतों का पता लगा सकते हैं, हमारे कानों द्वारा प्रदान की गई थोड़ी वितरित दोहरी-माइक्रोफोन सरणी और ऑडियो परिरक्षण के लिए धन्यवाद। लेकिन जब ऑडियो वातावरण जटिल हो जाता है, तो चीजें बहुत भ्रमित करने वाली हो सकती हैं - कुछ ऐसा जो शोर-शराबे, भीड़-भाड़ और उच्च-ऊर्जा वाले स्थानों (जैसे रविवार की सुबह की कॉफी शॉप) की तलाश करने और फिर उनमें बातचीत करने की हमारी विशिष्ट प्रवृत्ति के खिलाफ जाता है।
इन अधिक अव्यवस्थित ऑडियो स्थानों में, व्यक्तिगत ध्वनि स्रोतों को अलग करने और अन्य को म्यूट करने का एकमात्र तरीका बड़े माइक्रोफोन सरणी को तैनात करना है और फिर सभी ऑडियो स्ट्रीम को एक साथ संसाधित करके उस स्थान का नक्शा बनाना है जो प्रत्येक ध्वनि के स्थान को त्रिकोणित करता है और ध्वनि को हवा के माध्यम से यात्रा करने और प्रत्येक माइक्रोफोन तक पहुंचने में लगने वाले समय में छोटे समय के अंतर को मापता है। फिर आप सभी ऑडियो स्ट्रीम को पुन: संसाधित करने, प्रत्येक ध्वनि स्रोत के लिए स्वतंत्र ऑडियो स्ट्रीम बनाने और अन्य ध्वनि स्रोतों से सभी शोर को हटाने के लिए मायावी गहन शिक्षण एल्गोरिदम का उपयोग कर सकते हैं।
यह विचार अपने आप में नया नहीं है, लेकिन वाशिंगटन विश्वविद्यालय के शोधकर्ताओं ने अब इस अवधारणा पर एक नया मोड़ दिया है, सात छोटे पहियों वाले माइक्रोफोन रोबोटों के झुंड का उपयोग करते हुए, प्रत्येक चॉकलेट ट्रफल के आकार के बारे में, जो एक चार्जिंग स्टेशन से स्वायत्त रूप से तैनात होते हैं और उपलब्ध स्थान के भीतर एक स्व-अनुकूलन सरणी बनाते हैं।
रोबोट सोनार के माध्यम से टेबल की सतह पर नेविगेट करने, बाधाओं से बचने और माइक्रोफोन के बीच समय के अंतर को अधिकतम करने के लिए जितना संभव हो उतना व्यापक रूप से फैलाने के लिए अंतर्निहित माइक्रोफोन और स्पीकर का उपयोग करते हैं। दुर्भाग्य से, इसका मतलब यह है कि उन्हें एक-एक करके स्थानांतरित करना होगा, लेकिन एक बार अपनी जगह पर स्थापित होने के बाद वे काफी आश्चर्यजनक प्रदर्शन करते हैं, जैसा कि आप नीचे दिए गए वीडियो में देख सकते हैं।
तो अंतिम लक्ष्य क्या है? अनुसंधान टीम का मानना है कि इस तरह के रोबोटिक ऐरे का उपयोग सम्मेलन कक्ष के लाइव प्रसारण आदि के लिए पोर्टेबल, स्वचालित रूप से तैनात, ध्वनि-पृथक माइक्रोफोन ऐरे के रूप में किया जा सकता है, जो सैद्धांतिक रूप से मनुष्यों की तुलना में अपनी आवाज को बेहतर तरीके से फैलाता है।
टीम का कहना है कि यह दो-तरफ़ा वीडियो कॉल में बहुत उपयोगी नहीं होगा क्योंकि यह कुशलता से काम करता है, लेकिन वर्तमान में ध्वनि के प्रत्येक तीन-सेकंड ब्लॉक को संसाधित करने में लगभग 1.82 सेकंड का समय लगता है। विलंबता का अर्थ यह भी है कि यह कम समय में किसी शोर-शराबे वाले कैफे में वार्तालाप भागीदार से हेडफ़ोन पर साफ़ ऑडियो स्ट्रीम करने में सक्षम नहीं होगा - हालाँकि कंप्यूटिंग शक्ति और गति में सुधार के कारण दोनों अनुप्रयोग संभव हैं।
बेशक, यह एक बहुत ही सुविधाजनक निगरानी उपकरण भी बन सकता है, जो भीड़ के शोर और निजी बातचीत को रिकॉर्ड करने के मास्किंग प्रभाव को खत्म कर देता है। दिलचस्प बात यह है कि वाशिंगटन विश्वविद्यालय की शोध टीम का कहना है कि यह बिल्कुल विपरीत काम कर सकता है।
अध्ययन के सह-प्रथम लेखक, डॉक्टरेट छात्र मालेक इटानी ने कहा, "वर्तमान स्मार्ट स्पीकर की अनुमति से परे इसमें वास्तव में गोपनीयता को लाभ पहुंचाने की क्षमता है।" "मैं कह सकता हूं कि 'मेरे डेस्क के आसपास कुछ भी रिकॉर्ड न करें,' और हमारा सिस्टम मेरे आस-पास की हर चीज को रिकॉर्ड करेगा।" फीट (0.9 मीटर)। इस बबल में कुछ भी रिकॉर्ड नहीं किया जाएगा. या, यदि आस-पास लोगों के दो समूह बात कर रहे हैं, एक समूह निजी बातचीत कर रहा है जबकि दूसरा समूह रिकॉर्डिंग कर रहा है, तो एक समूह की बातचीत को म्यूट ज़ोन में रखा जा सकता है और निजी रखा जा सकता है।
वास्तव में, स्थैतिक वितरित माइक्रोफ़ोन सरणियों का उपयोग स्मार्ट रूम या स्मार्ट होम डिज़ाइन में किया जाना शुरू हो सकता है, जहां वे ध्वनि नियंत्रण आदेशों को विभिन्न क्षेत्रों में आसानी से अलग कर सकते हैं। उदाहरण के लिए, आप केवल सोफे से आवाज़ सुनकर टीवी को नियंत्रित कर सकते हैं, या शोर-शराबे वाली जगह पर बार में खड़े व्यक्ति से पेय का ऑर्डर भी ले सकते हैं।
यह पेपर नेचर कम्युनिकेशंस पत्रिका में प्रकाशित हुआ था।