ओपनएआई पर प्रशिक्षण डेटा की गोपनीयता का उल्लंघन करने का आरोप लगाने वाले एक वर्ग-कार्रवाई मुकदमे में वादी ने कंपनी के खिलाफ अपना मामला छोड़ दिया। अदालती दस्तावेज़ों के अनुसार, मामला बिना किसी पूर्वाग्रह के ख़ारिज कर दिया गया और वादी के पास फिर से मुकदमा दायर करने का विकल्प है।मुकदमा, जो पहली बार जून में कैलिफोर्निया के उत्तरी जिले में दायर किया गया था, ओपनएआई के मकड़ियों पर "उन सभी व्यक्तियों की संपत्ति और गोपनीयता अधिकारों का उल्लंघन करने का आरोप लगाया गया है जिनकी व्यक्तिगत जानकारी को स्क्रैप किया गया था और [ओपनएआई के] उत्पादों में शामिल करने के लिए उसका दुरुपयोग किया गया था।"

मुकदमे में वादी का नाम नहीं है, जिनकी पहचान केवल उनके शुरुआती अक्षरों से की जाती है। क्लार्कसन लॉ फर्म ने उनकी ओर से एक वर्ग कार्रवाई मुकदमा दायर किया।

OpenAI, अन्य जेनेरिक AI कंपनियों की तरह, बड़े भाषा मॉडल को प्रशिक्षित करने में मदद के लिए इंटरनेट से सार्वजनिक रूप से उपलब्ध डेटा खींचता है।

ओपनएआई जैसी जेनेरिक एआई कंपनियां अपने मॉडलों को प्रशिक्षित करने के लिए सार्वजनिक रूप से उपलब्ध डेटा कैसे प्राप्त करती हैं और उसका उपयोग कैसे करती हैं, इस पर कई मुकदमे दायर किए गए हैं। अधिकांश मामले गोपनीयता के मुद्दों के बजाय जटिल कॉपीराइट के इर्द-गिर्द घूमते हैं। कॉमेडियन सारा सिल्वरमैन, लेखक क्रिस्टोफर गोल्डन और रिचर्ड काड्रे ने GPT-4 और Llama2 को प्रशिक्षण देते समय कॉपीराइट उल्लंघन का आरोप लगाते हुए OpenAI और मेटा पर मुकदमा दायर किया।

जुलाई में, अमेरिकी संघीय व्यापार आयोग ने डेटा संग्रह और गलत जानकारी प्रकाशित करने के माध्यम से उपभोक्ताओं को ओपनएआई के संभावित नुकसान की जांच शुरू की।

अगस्त में, OpenAI ने कहा कि वेबसाइट मालिक अब अपने वेब क्रॉलर को ब्लॉक कर सकते हैं। द न्यूयॉर्क टाइम्स जैसे समाचार प्रकाशकों सहित कुछ वेबसाइटों ने ओपनएआई को अपना डेटा स्क्रैप करने से रोक दिया है।