मेटा को हाल ही में कृत्रिम बुद्धिमत्ता मॉडल को प्रशिक्षित करने के लिए हजारों पायरेटेड पुस्तकों के उपयोग के कानूनी जोखिमों पर कॉपीराइट उल्लंघन के मुकदमे का सामना करना पड़ा।बताया गया है कि मेटा ने अपने LLAM1 और LLAM2 मॉडल को प्रशिक्षित करने के लिए बड़ी संख्या में पायरेटेड पुस्तकों के "Books3" डेटा सेट का उपयोग किया। हालाँकि मेटा ने स्वीकार किया कि उसने बुक्स3 डेटा सेट का उपयोग किया, लेकिन उसने लेखकों को उचित मुआवजा देने से इनकार कर दिया।

बुक्स3 एक टेक्स्ट डेटा सेट है जिसमें लगभग 37GB की कुल क्षमता वाली 195,000 किताबें हैं। इसे मशीन लर्निंग एल्गोरिदम में सुधार के लिए बेहतर डेटा स्रोत प्रदान करने के लिए एआई शोधकर्ता शॉन प्रेसर द्वारा 2020 में बनाया गया था।

मेटा इसका उपयोग अपने स्वयं के एलएलएएम मॉडल को प्रशिक्षित करने के लिए भी करता है। हालाँकि, बुक्स3 में पायरेटेड वेबसाइट बिब्लियोटिक से क्रॉल किए गए बड़ी संख्या में कॉपीराइट कार्य शामिल हैं, जो मेटा के कार्यों को कानूनी जोखिम में डालते हैं।

इस साल कई प्रौद्योगिकी कंपनियों को इसी तरह की शिकायतों का सामना करना पड़ा है, जिसमें उन पर जेनरेटिव एआई मॉडल बनाते समय कलाकारों, लेखकों और अन्य सामग्री निर्माताओं के कॉपीराइट का उल्लंघन करने का आरोप लगाया गया है।

इसके अलावा, कृत्रिम बुद्धिमत्ता पर नए अस्थायी यूरोपीय संघ नियम कंपनियों को मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा सेट का खुलासा करने के लिए मजबूर कर सकते हैं, जो उन्हें अधिक कानूनी जोखिमों में डाल सकता है।