इस वर्ष के I/O डेवलपर सम्मेलन में, Google ने आधिकारिक तौर पर जेमिनी 3.5 श्रृंखला मॉडल की नई पीढ़ी और नई जेमिनी ओमनी श्रृंखला जारी की। जेमिनी 3.5 फ्लैश जनता के लिए खोला जाने वाला पहला है, जबकि जेमिनी ओमनी "किसी भी इनपुट से वीडियो उत्पन्न करने" की क्षमता पर ध्यान केंद्रित करता है।

जेमिनी 3.5 फ्लैश जेमिनी ऐप और गूगल सर्च में एआई मोड के माध्यम से सभी उपयोगकर्ताओं के लिए पहले से ही उपलब्ध है। Google का दावा है कि फ्लैश श्रृंखला के लगातार उच्च गति प्रदर्शन को बनाए रखते हुए, मॉडल में कई आयामों में बड़े फ्लैगशिप मॉडल की तुलना में खुफिया स्तर है।

परिचय के अनुसार, जेमिनी 3.5 फ्लैश वर्तमान में सबसे मजबूत जेमिनी एजेंट और कोड जेनरेशन मॉडल है। यह जटिल कोड और एजेंटों से संबंधित बेंचमार्क परीक्षणों में जेमिनी 3.1 प्रो से भी आगे निकल जाता है, और मल्टी-मोडल समझ में बढ़त बनाए रखता है, इसलिए इसे वर्तमान डिफ़ॉल्ट मॉडल के रूप में भी सेट किया गया है। उपयोगकर्ता तेज़ और बेहतर उत्तर और कोड समर्थन प्राप्त करने के लिए दैनिक खोजों, इन-ऐप वार्तालापों और अन्य परिदृश्यों में सीधे इस मॉडल को कॉल कर सकते हैं।

उसी समय अनावरण किया गया जेमिनी ओमनी, जेनरेटिव वीडियो की दिशा में Google के नवीनतम प्रयास का प्रतिनिधित्व करता है। यह नया मॉडल किसी भी इनपुट से वीडियो जेनरेट कर सकता है। उपयोगकर्ता स्वतंत्र रूप से छवियों, ऑडियो, वीडियो और टेक्स्ट को इनपुट के रूप में जोड़ सकते हैं, और मॉडल जेमिनी के वास्तविक दुनिया के ज्ञान के आधार पर उच्च गुणवत्ता वाली वीडियो सामग्री उत्पन्न करता है। जेनरेशन पूरा होने के बाद, उपयोगकर्ता वीडियो में विवरणों को संशोधित और बेहतर बनाने के लिए प्राकृतिक भाषा के माध्यम से वार्तालाप संपादन के कई दौर भी कर सकते हैं।

जेमिनी ओमनी श्रृंखला में पहला मॉडल जेमिनी ओमनी फ्लैश है, जो वीडियो के आंशिक या समग्र संशोधन का समर्थन करता है और निर्माण के कई दौरों के दौरान मूल दृश्य की कथात्मक सुसंगतता को बनाए रखना जारी रख सकता है, जिससे उपयोगकर्ताओं को मुख्य कहानी को खोए बिना लगातार समायोजित करने की अनुमति मिलती है। Google ने कहा कि इस मॉडल में गुरुत्वाकर्षण, गतिज ऊर्जा और द्रव गतिशीलता जैसी भौतिक अवधारणाओं की अधिक सहज समझ है, जो इसे अधिक यथार्थवादी और विश्वसनीय गतिशील दृश्य उत्पन्न करने की अनुमति देती है।

रचनात्मक अनुभव के संदर्भ में, जेमिनी ओमनी उपयोगकर्ताओं को वीडियो निर्माण में भाग लेने के लिए अपनी आवाज और अवतार का उपयोग करने की अनुमति देता है, जिससे व्यक्तिगत विशेषताओं के साथ डिजिटल अवतार तैयार होते हैं। सिंथेटिक सामग्री की ट्रेसबिलिटी और सुरक्षा मुद्दों से निपटने के लिए, इस मॉडल द्वारा उत्पन्न सभी वीडियो को एआई-जनरेटेड सामग्री को लेबल करने और पहचानने के लिए सिंथआईडी डिजिटल वॉटरमार्क के साथ एम्बेड किया जाएगा।

उपलब्धता के संदर्भ में, जेमिनी ओमनी फ्लैश आज से वैश्विक ग्राहकों के लिए उपलब्ध है। जो उपयोगकर्ता Google AI प्लस, प्रो और अल्ट्रा प्लान की सदस्यता लेते हैं, वे सीधे जेमिनी ऐप और Google फ़्लो में मॉडल का उपयोग कर सकते हैं। साथ ही, Google इस क्षमता को YouTube शॉर्ट्स और YouTube क्रिएट में भी मुफ्त में पेश कर रहा है, जिससे अधिक रचनाकारों को मुख्यधारा के सामग्री प्लेटफार्मों पर जेमिनी तकनीक पर आधारित वीडियो निर्माण फ़ंक्शन का अनुभव करने की अनुमति मिल सके।