Home Nieuws BREIN haalt Artificial Intelligence dataset offline

BREIN haalt Artificial Intelligence dataset offline

Stichting BREIN heeft een grote Nederlandstalige dataset offline gehaald die werd gebruikt om kunstmatige intelligentie (AI) modellen te trainen. Na een tip ontdekte BREIN dat deze dataset bestond uit illegale kopieën van tienduizenden boeken, miljoenen regels uit nieuwsartikelen van websites zoals nu.nl en ondertitels van talloze films en tv-series uit illegale bron.

De enorme dataset was gecomprimeerd zodat deze makkelijk te gebruiken was door AI computermodellen zoals large language models (LLMs). Hoewel de dataset daarmee niet direct geschikt was voor consumenten om te lezen als e-book of nieuwswebsite, is dit niet toegestaan. Het kopiëren en dus ook het dataminen uit illegale bron is nooit toegestaan. Ook voor het dataminen van legale bronnen met een auteursrechtenvoorbehoud is toestemming van de auteursrechthebbenden vereist.

“Brein treedt op tegen inbreukmakend en tegen onrechtmatig gebruik van artificial intelligence. We hebben in de dataset onder meer gezocht naar de letterlijke tekst: ‘Niets uit deze uitgave mag worden verveelvoudigd’ en dit leverde meer dan 10.000 resultaten op. Stuk voor stuk betrof dit illegaal gekopieerde boeken. Ook de nieuwsartikelen zijn gekopieerd van websites met auteursrechtvoorbehoud. Dit toont duidelijk aan dat de auteursrechten niet zijn gerespecteerd, een heterdaadje noemen we dat ook wel” aldus directeur Bastiaan van Ramshorst van Stichting BREIN.

De dataset is inmiddels offline gehaald. De maker van de dataset heeft een verklaring ondertekend waarin hij belooft geen inbreuk meer te maken en heeft informatie gegeven over wie de dataset heeft ontvangen. BREIN onderzoekt nu welke AI-modellen deze dataset hebben gebruikt en zal de betrokken partijen aanspreken.

Om te helpen voorkomen dat partijen auteursrechtelijk beschermd materiaal massaal scrapen uit legale bronnen, raadt BREIN aan dat rechthebbenden een voorbehoud maken in lijn met de Auteurswet (artikel 15o.1). Veel bij BREIN aangesloten rechthebbenden doen dit al. Zie bijvoorbeeld de volgende websites:

Buma/Stemra: Standpunt over AI

Pictoright: Opt-out voor Aangeslotenen

Federatie Beeldrechten: AI opt-out now!

Mediafederatie: de opt-out keuze voor een uitgever