Mag mijn werk gebruikt worden als trainingsdata voor een AI-systeem?
Uiteraard mag de trainingsdata waarmee een AI-systeem getraind wordt niet illegaal zijn. Dat betekent niet alleen dat er niet zonder toestemming persoonsgegevens mogen worden verwerkt, of dat er geen kinderporno of terroristische content in de database mag worden opgenomen, maar ook dat rekening gehouden dient te worden met het auteursrecht.
Er wordt wel gezegd dat wat AI doet, iets maken op basis van wat het zelf tot zich heeft genomen, erg lijkt op wat menselijke makers doen. In feite wordt de AI, net als een menselijke maker die inspiratie opdoet in diens omgeving, ‘geïnspireerd’ door wat het tot zich neemt. Toch is deze situatie heel anders. AI wordt niet geïnspireerd, maar verwerkt en dus reproduceert beelden als zijnde data, herstructureert deze, en gebruikt het dan op een andere manier. Dit zijn auteursrechtelijk relevante handelingen, in tegenstelling tot een menselijke maker die zich door diens omgeving laat inspireren tot het creëren van iets nieuws.
Om te kijken hoe dit auteursrechtelijk gezien beoordeeld moet worden moeten we terugvallen op de bestaande wetgeving. Daarbij kan gekeken worden naar bepaalde uitzonderingen op het auteursrecht, waaronder mogelijk de uitzondering voor ‘tijdelijke reproductie’, maar ook de uitzonderingen voor tekst- en datamining (TDM). In deze FAQ wordt gefocust op deze laatste bepalingen, omdat deze de meest concrete aanknopingspunten voor actie bieden. TDM is volgens de wet “een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden.” Een dergelijke techniek wordt ook gebruikt voor het trainen van AI om bepaalde output te genereren. Deze uitzonderingen in de wet maken duidelijk in welke gevallen tekst- en datamining van auteursrechtelijk beschermd werk eventueel is toegestaan.
Dat is allereerst wanneer dit wordt gedaan door onderzoeksorganisaties en cultureel erfgoedinstellingen met het oog op wetenschappelijk onderzoek. Zij mogen op basis van deze uitzondering waarschijnlijk gebruik maken van auteursrechtelijk beschermde werken voor TDM-doeleinden (waaronder het trainen van experimentele AI), wanneer zij rechtmatige toegang hiertoe hebben. Zij mogen ook een database maken van hun trainingsdata, wanneer zij deze goed beschermen.
De tweede uitzondering ziet op gebruik voor andere doeleinden, waaronder commerciële doeleinden. Ook bij dit gebruik mag aan tekst- en datamining worden gedaan wanneer de gebruiker rechtmatige toegang heeft tot de auteursrechtelijk beschermde content, maar rechthebbenden hebben de mogelijk om te ‘opt-out’-en van gebruik voor deze doeleinden. Wanneer zij expliciet het auteursrecht voorbehouden en door hen dus duidelijk is aangegeven dat het werk niet gebruikt mag worden voor tekst- en datamining, kan er geen beroep worden gedaan op deze uitzondering. Bovendien mag geen database van de trainingsdata worden aangelegd.
De vraag is echter in hoeverre deze ‘opt-out’ -mogelijkheid daadwerkelijk een uitkomst biedt voor makers en hen effectief de mogelijkheid geeft om hun eigen rechten te beheren. Allereerst is (nog) onduidelijk of een ‘opt-out’ wordt gerespecteerd of in welke vorm dit dient te gebeuren. Zeker wanneer de maker sociale media platforms gebruikt, heeft zij weinig controle over wat er met haar uploads gebeurt. Bovendien kan een opt-out eigenlijk alleen worden ingeroepen vóórdat AI met het ge-opt-oute werk is getraind: een AI-systeem kan iets eigenlijk niet ‘ontleren’. Er wordt dus wel gezegd dat ‘het kwaad al is geschied’ wat betreft het werk dat tot op heden nog niet onder een opt-out is gepubliceerd. Momenteel zijn verschillende organisaties zich aan het beraden over wat hieraan te doen, en of bijvoorbeeld met een geldelijke vergoeding tegemoet gekomen kan worden aan deze makers.