Google ने हाल ही में Google जेमिनी एपीआई में फ़ाइल खोज फ़ंक्शन के विस्तार की घोषणा की, जिससे डेवलपर्स को अधिक पूर्ण मल्टी-मोडल पुनर्प्राप्ति उन्नत पीढ़ी (आरएजी) क्षमताएं मिल गईं। इस अद्यतन के मूल में शामिल हैं: छवियों और पाठ की मिश्रित पुनर्प्राप्ति के लिए समर्थन, कस्टम मेटाडेटा फ़िल्टरिंग के लिए समर्थन, नए पेज-स्तरीय संदर्भ समर्थन, और एंटरप्राइज़ ज्ञान आधार, दस्तावेज़ क्यू एंड ए और एजेंटों जैसे परिदृश्यों में एआई सिस्टम की बेहतर पहुंच और सटीकता।

Google के आधिकारिक ब्लॉग के अनुसार, फ़ाइल खोज फ़ंक्शन का नया संस्करण अब पारंपरिक टेक्स्ट वेक्टर खोज तक सीमित नहीं है, बल्कि जेमिनी एंबेडिंग 2 पर निर्मित एकीकृत मल्टी-मोडल एम्बेडिंग क्षमता पर आधारित है, जो छवियों, पीडीएफ और दस्तावेजों में दृश्य सामग्री और टेक्स्ट सामग्री को एक साथ समझ सकता है। डेवलपर्स को जटिल वेक्टर डेटाबेस, एंबेडिंग पाइपलाइन या दस्तावेज़ विभाजन सिस्टम बनाने की आवश्यकता नहीं है, और संपूर्ण आरएजी वर्कफ़्लो को सीधे जेमिनी एपीआई में पूरा कर सकते हैं।

पारंपरिक आरएजी प्रणालियों में, चित्र, चार्ट, स्क्रीनशॉट और डिज़ाइन चित्र जैसी दृश्य सामग्री को प्रभावी ढंग से अनुक्रमित करना अक्सर मुश्किल होता है, जिसके परिणामस्वरूप एआई उत्तरों में प्रासंगिक समझ की कमी होती है। जेमिनी एपीआई की नई मल्टी-मोडल फ़ाइल खोज क्षमता चित्रों में सामग्री को मूल रूप से पहचान सकती है और पाठ के साथ एक खोज सूचकांक बना सकती है। उदाहरण के लिए, कंपनियां उत्पाद छवियों, डेटा चार्ट, या तकनीकी वास्तुकला आरेख वाली पीडीएफ फाइलें अपलोड कर सकती हैं, और एआई उत्तर देते समय दृश्य जानकारी और पाठ विवरण को एक साथ समझ सकता है।

Google का कहना है कि यह क्षमता विशेष रूप से एंटरप्राइज़-स्तरीय ज्ञान सहायकों, ग्राहक सेवा रोबोट, दस्तावेज़ विश्लेषण प्रणाली और एआई एजेंटों के निर्माण के लिए उपयुक्त है। स्वतंत्र छवि पुनर्प्राप्ति प्रणालियों के अतिरिक्त रखरखाव की आवश्यकता के बिना डेवलपर्स आंतरिक दस्तावेजों के आधार पर मॉडलों से निष्कर्ष निकाल सकते हैं। बड़ी मात्रा में मिश्रित छवि और पाठ डेटा वाली कंपनियों के लिए, इसका मतलब कम तैनाती जटिलता और उच्च पुनर्प्राप्ति सटीकता है।

एक और नई सुविधा कस्टम मेटाडेटा फ़िल्टरिंग है। डेवलपर्स अपलोड की गई फ़ाइलों में टैग, श्रेणियां, समय और विभाग जैसे मेटाडेटा जोड़ सकते हैं, ताकि सटीकता और दक्षता में सुधार के लिए बाद की पुनर्प्राप्ति के दौरान उन्हें मेटाडेटा के अनुसार फ़िल्टर किया जा सके। यह बड़े पैमाने पर ज्ञान आधार प्रबंधन के लिए भी अधिक उपयुक्त है और अप्रासंगिक सामग्री को संदर्भ विंडो में प्रवेश करने से कम करता है।

एक अन्य महत्वपूर्ण विशेषता पृष्ठ-स्तरीय उद्धरण है। उत्तर तैयार करते समय, जेमिनी एआई संपूर्ण फ़ाइल को अस्पष्ट रूप से संदर्भित करने के बजाय स्पष्ट रूप से चिह्नित कर सकता है कि जानकारी दस्तावेज़ के किस पृष्ठ से आई है। यह उपयोगकर्ताओं को उत्तर प्राप्त करने के बाद सामग्री की सटीकता का आकलन करने और अधिक जानकारी प्राप्त करने के लिए संपूर्ण दस्तावेज़ को पढ़ने के लिए विशिष्ट दस्तावेज़ पृष्ठ को देखने के लिए क्लिक करने की अनुमति देता है।

वर्तमान में, Google जेमिनी एपीआई फ़ाइल खोज फ़ंक्शन का नया संस्करण सभी डेवलपर्स के लिए खुला है। इच्छुक डेवलपर्स इसका अनुभव लेने के लिए Google AI स्टूडियो और Google क्लाउड जैसे प्लेटफार्मों के माध्यम से जेमिनी एपीआई खोल सकते हैं।

डेवलपर गाइड: https://dev.to/googleai/multimodal-rag-with-the-gemini-api-file-search-tool-a-developer-guide-5878