Wat kan ik doen om te voorkomen dat mijn werk, dat is geplaatst op een door mij beheerde site, wordt gebruikt als trainingsdata voor een AI-systeem?
Zoals hierboven beschreven kun je als maker niet voorkomen dat je werk wordt ‘gescraped’ van het internet, en gebruikt voor TDM-doeleinden, wanneer dit wordt gedaan door non-profit wetenschappelijk onderzoeksorganisaties en cultureel erfgoedinstellingen. De Auteurswet biedt wél de mogelijkheid om te ‘opt-out’-en van commerciële tekst- en datamining. Dit moet echter wel op een manier worden gedaan die leesbaar is voor de TDM-software (‘machine-leesbaar’). Hoe dit precies gedaan dient te worden is nog onduidelijk: enige coördinatie op dit gebied wordt op den duur vanuit Europa wel verwacht. Tot die tijd moeten we het doen met wat er nu voor handen is. Pictoright kan de werkbaarheid en juridische status van onderstaande methoden niet kan garanderen. Maar ze helpen je wellicht op weg om, wanneer je dat wilt, de ‘opt-out’ te implementeren in je artistieke praktijk.
Er zijn waarschijnlijk verschillende manieren om dit te doen. Allereerst kan dit bijvoorbeeld door het gebruiken van het zogenaamde ‘robots.txt-protocol’ op je website. LAION, de database achter Stable Diffusion AI, heeft aangegeven dat diens crawler het robots.txt-protocol respecteert. Het risico hiervan is echter dat je webpagina ook niet meer vindbaar is via Google, wat eventueel slecht zou kunnen uitpakken voor je online aanwezigheid als maker. Daarom zijn verschillende initiatieven opgezet om een protocol te ontwikkelen dat meer specifiek gericht is om het scrapen voor TDM-doeleinden te voorkomen. Deze kunnen geïmplementeerd worden in je eigen website. Kijk bijvoorbeeld eens naar het W3C TDM protocol, of naar het door Spawning ontwikkelde ai.txt-protocol. Een andere optie is om een soort ‘mantel’ over je werk heen te leggen, die het moeilijker maakt voor AI om je werk te reproduceren. Deze optie wordt bijvoorbeeld aangeboden door Glaze. Online kun je meer vinden over hoe dit alles technisch in elkaar zit.
Waar mogelijk kun je daarnaast gebruik maken van vaste instellingen op platforms waar veel beeldend werk wordt gedeeld. Zo hebben ArtStation en DeviantArt inmiddels een ‘tag’ ontwikkeld, de zogenaamde NoAI of NoImageAI- tags, die je kunt selecteren bij het uploaden van je werk op deze platforms. Hiermee geef je aan dat je dit specifieke werk uitzondert van de mogelijkheid om het voor TDM te gebruiken. Dit wordt geïntegreerd in de HTML, en is leesbaar voor crawling software.
Tot slot hanteren sommige makers ook een geschreven disclaimer op de website, bijvoorbeeld in de algemene voorwaarden of onderaan de eigen webpagina. Hoewel onduidelijk is of dit voldoende machine-leesbaar is of volledig sluitend voor de (Nederlandse) juridische situatie, is dit een makkelijke en toegankelijke manier om te opt-outen. Denk er hierbij aan dat het het beste is om dit in het Engels te doen, vanwege de veelal Engelstalige AI-producenten, en kijk ter illustratie bijvoorbeeld eens naar het voorbehoud dat door de Authors Guild wordt gesuggereerd hiervoor.
In de toekomst komt er naar verwachting een standaardprocedure voor een gestandaardiseerde opt-out procedure, die door alle AI-ontwikkelaars geaccepteerd zal worden. Dit zal mogelijk op EU-niveau gecoördineerd worden. De vraag is echter of een dergelijke procedure voldoende is om daadwerkelijk effectief gebruik te maken van de mogelijkheid tot ‘opt-out’, nu de huidige opties vooral toezien op uploads waar de maker zélf controle over heeft, bijvoorbeeld op de eigen website of social media pagina. Of een opt-out ook gaat kunnen toezien op illegale uploads, of dat dit op collectief niveau of per oeuvre/maker gedaan gaat kunnen worden, is nu nog onduidelijk.