9 अप्रैल को, बाइटडांस ने बड़े पैमाने पर देशी फुल-डुप्लेक्स वॉयस मॉडल सीडुप्लेक्स लॉन्च किया, जिसे अब पूरी तरह से डौबाओ ऐप पर लॉन्च किया गया है। यह मॉडल "एक ही समय में सुनें और बोलें" के नए फ्रेमवर्क डिज़ाइन पर आधारित है। पिछली पीढ़ी के हाफ-डुप्लेक्स एंड-टू-एंड स्पीच मॉडल की तुलना में, यह एक साथ सुनने और बोलने की वास्तविक समय की बातचीत को प्राप्त करता है, और बातचीत की लय, स्वाभाविकता और हस्तक्षेप-विरोधी क्षमता में सुधार करता है।

आधिकारिक परिचय के अनुसार, सीडुप्लेक्स ने मॉडल आर्किटेक्चर नवाचार और प्रशिक्षण अनुकूलन के माध्यम से उच्च संगामिति के तहत लैगिंग और स्थिरता जैसी इंजीनियरिंग चुनौतियों पर काबू पा लिया है। सटीक हस्तक्षेप-रोधी के संदर्भ में, मॉडल में लगातार "सुनने", उस ध्वनिक वातावरण को समझने की क्षमता है जिसमें उपयोगकर्ता स्थित है, और पृष्ठभूमि शोर और अप्रासंगिक वार्तालापों को सटीक रूप से अनदेखा करता है। जटिल परिदृश्यों में, हाफ-डुप्लेक्स मॉडल की तुलना में गलत उत्तर दर और गलत रुकावट दर 50% कम हो जाती है। गतिशील निर्णय लेने के संदर्भ में, मॉडल उपयोगकर्ता के इरादे को व्यापक रूप से निर्धारित करने के लिए भाषण और अर्थ संबंधी विशेषताओं को जोड़ता है। जब उपयोगकर्ता झिझक रहा हो तो यह धैर्यपूर्वक सुन सकता है और उपयोगकर्ता के बोलने के बाद तुरंत प्रतिक्रिया दे सकता है। हाफ-डुप्लेक्स मॉडल की तुलना में प्रीमेप्टिव कॉल का अनुपात 40% कम हो गया है, और निर्णय लेने के प्रदर्शन में 8% का सुधार हुआ है।

बहु-आयामी मूल्यांकन से पता चलता है कि बातचीत के प्रवाह और लय के मामले में सीडुप्लेक्स पारंपरिक हाफ-डुप्लेक्स समाधान और उद्योग में मुख्यधारा के ऐप्स के वॉयस कॉल फ़ंक्शन से काफी बेहतर है। यह मॉडल बड़े पैमाने पर कार्यान्वयन हासिल करने वाला उद्योग में पहला मॉडल रहा है और सैकड़ों लाखों उपयोगकर्ताओं के लिए निरंतर उच्च गुणवत्ता वाले वास्तविक समय वॉयस इंटरैक्शन अनुभव प्रदान कर सकता है।