Beleidsreactie rapport Webharvesting
Informatie- en communicatietechnologie (ICT)
Brief regering
Nummer: 2025D43290, datum: 2025-10-02, bijgewerkt: 2025-10-03 07:27, versie: 1
Directe link naar document (.docx), link naar pagina op de Tweede Kamer site.
Gerelateerde personen:- Eerste ondertekenaar: G. Moes, minister van Onderwijs, Cultuur en Wetenschap
Onderdeel van kamerstukdossier 26643 -1418 Informatie- en communicatietechnologie (ICT).
Onderdeel van zaak 2025Z18645:
- Indiener: G. Moes, minister van Onderwijs, Cultuur en Wetenschap
- Volgcommissie: vaste commissie voor Digitale Zaken
- Voortouwcommissie: vaste commissie voor Onderwijs, Cultuur en Wetenschap
Preview document (🔗 origineel)
De voorzitter van de Tweede Kamer der Staten-Generaal Postbus 20018 2500 EA Den Haag |
---|
Datum | 2 oktober 2025 |
---|---|
Betreft | Beleidsreactie rapport Webharvesting |
Onderzoek en Wetenschapsbeleid Rijnstraat 50 Den Haag Postbus 16375 2500 BJ Den Haag www.rijksoverheid.nl |
Onze referentie 54578556 |
Op 23 mei jl. heeft mijn ambtsvoorganger uw Kamer het rapport ‘Het faciliteren van webharvesting’ toegezonden.1 Met deze brief reageer ik op dit rapport en geef ik invulling aan de motie Dekker-Abdulaziz, waarin de regering is verzocht om in kaart te brengen wat de wettelijke, technische en financiële obstakels zijn die in de weg staan van een mogelijke archivering van het .nl-domein en hoe deze te overkomen.2
Achtergrond
Veel organisaties in Nederland verzamelen bronnen die nu of in de toekomst kunnen bijdragen aan onze kennis over het verleden. Bibliotheken, archieven en musea zorgen voor duurzame bewaring van deze bronnen, al dan niet vanuit een wettelijke taak, en maken ze toegankelijk voor gebruikers.
Met de komst van het internet vindt steeds meer communicatie online plaats. Om internetbronnen veilig te stellen voor de toekomst, ontplooit een aantal Nederlandse erfgoedinstellingen webharvestingactiviteiten: het opslaan, bewaren en beschikbaar stellen van websites binnen het Nederlandse webdomein.
Anders dan in een aantal andere Europese landen, biedt de Nederlandse wet geen grondslag voor deze activiteiten. Dat betekent in de praktijk dat erfgoedinstellingen toestemming moeten vragen aan alle betrokken (auteurs)rechthebbenden voor het verzamelen en bewaren van websites. Meestal maken ze daartoe gebruik van een opt-out-procedure: rechthebbenden krijgen bericht van een voornemen om content te harvesten; als zij daar geen bezwaar tegen maken (‘opt-out’), vindt het harvesten plaats.
Deze procedure is echter heel tijdrovend. Daardoor is webharvesting op grote schaal, bijvoorbeeld door een momentopname te maken van het hele Nederlandse webdomein (een zogenaamde ‘nationale domeincrawl’) nu niet mogelijk. Maar ook het uitvoeren van beredeneerde selecties, bijvoorbeeld van online uitingen rond specifieke thema’s of gebeurtenissen, is erg bewerkelijk. Bovendien ervaren erfgoedorganisaties en rechthebbenden bij het uitvoeren van deze activiteiten een grote mate van rechtsonzekerheid.
Om die reden hebben de Koninklijke Bibliotheek (KB), de Koninklijke Vereniging Archiefsector Nederland (KVAN) en het Nederlands Instituut voor Beeld en Geluid (NIBG) in een brief aan de vaste commissie Onderwijs, Cultuur en Wetenschap van uw Kamer gepleit voor het wettelijk faciliteren van webharvesting.3
Uw Kamer heeft de regering met de motie Dekker-Abdulaziz verzocht om in kaart te brengen wat de wettelijke, technische en financiële obstakels zijn die in de weg staan van een mogelijke archivering van het Nederlandse webdomein en hoe deze te overkomen. Om hierin inzicht te krijgen, heeft mijn ambtsvoorganger een extern onderzoek uitgezet bij PBLQ in samenwerking met Ecorys en Confider.
Scope van het onderzoek
Uitgangspunt voor het onderzoek was de vraag hoe de webharvestingactiviteiten van erfgoedinstellingen (al dan niet wettelijk) gefaciliteerd kunnen worden. In antwoord op deze vraag hebben de onderzoekers vier scenario’s ontwikkeld. Het rapport bespreekt de voor- en nadelen van ieder scenario vanuit de volgende perspectieven: het informatie- en erfgoedbelang, het belang van (auteurs)rechthebbenden, de bescherming van de persoonsgegevens van betrokkenen, de kosten, de juridische risico’s, het draagvlak voor elk scenario en de uitvoerbaarheid ervan (in zowel de technische als de organisatorische zin).4 Het onderzoek bouwt voort op een onderzoek naar webharvesting dat in 2021 is uitgevoerd door het Instituut voor Informatierecht (IViR) van de Universiteit van Amsterdam in opdracht van het Wetenschappelijk Onderzoek- en Datacentrum (WODC).5
Met het voorliggende onderzoek en deze reactie ga ik een stap verder dan waar de motie Dekker-Abdulaziz mij om vroeg. Naast het in kaart brengen van mogelijke obstakels voor webharvesting, levert het onderzoek ook een aantal concrete scenario’s op voor het (wettelijk) faciliteren van webharvestingactiviteiten en een weging van de voor- en nadelen van elk scenario. Daarbij is er ook aandacht voor aanvullende perspectieven, zoals het draagvlak en de uitvoering.
Resultaten van het onderzoek
Vier scenario’s
Het rapport beschrijft de onderstaande vier scenario’s voor het al dan niet (wettelijk) faciliteren van webharvestingactiviteiten in Nederland. Ook gaat het rapport in op de afbakening van het nationaal webdomein.
Het faciliteren van centrale uitvoering door één instelling met loketfunctie voor andere instellingen
In dit scenario krijgt één centrale instelling een wettelijke basis om zowel nationale domeincrawls als beredeneerde selecties uit te voeren. Andere erfgoedinstellingen kunnen een verzoek doen bij de centrale instelling om specifieke websites te harvesten, waarbij de centrale instelling een loketfunctie heeft.
Het faciliteren van centrale uitvoering van de nationale domeincrawl en decentrale uitvoering van beredeneerde selecties
Net als in het eerste scenario krijgt één centrale instelling een wettelijke basis om nationale domeincrawls uit te voeren. Daarnaast krijgen één centrale instelling en andere erfgoedinstellingen een wettelijke basis om beredeneerde selecties uit te voeren.
Afspraken maken over uitvoering van webharvestingactiviteiten (consensusmodel)
In dit scenario worden door recht- en belanghebbenden expliciete en duidelijke afspraken gemaakt over het uitvoeren van webharvestingactiviteiten, zowel ten aanzien van een nationale domeincrawl als beredeneerde selecties. Dit wordt aangevuld met een notice-and-takedown-systeem.6 Deze afspraken kennen geen wettelijke basis. Daarmee zou dit scenario neerkomen op een niet-wettelijk faciliteren van webharvestingactiviteiten.
Status quo (geen afspraken maken)
Met dit scenario blijft de huidige situatie in stand. Webharvestingactiviteiten worden dus niet (wettelijk) gefaciliteerd, met als gevolg dat er geen nationale domeincrawl plaats kan vinden. Wel voeren een aantal partijen (beperkt) beredeneerde selecties uit, onder de condities die ook nu al gelden.
Voor het realiseren van scenario 1 en 2 is een wetswijziging nodig. Dat geldt niet voor scenario 3 en 4.
Definitie nationaal webdomein
De motie Dekker-Abdulaziz spreekt over archivering van het .nl-domein. Dat een webpagina gebruik maakt van het topleveldomein .nl is echter niet het enig mogelijke criterium om het Nederlandse webdomein af te bakenen. Ook de taal van de tekst op een website kan bijvoorbeeld een criterium zijn, of de geografische locatie waar de pagina gepubliceerd is.
Het rapport wijst uit dat er twee mogelijke strategieën zijn om tot een standaard definitie van het nationaal webdomein te komen.
Een strategie op basis van vooraf vastgelegde criteria die zoveel mogelijk automatiseerbaar en objectief zijn. Een voorbeeld hiervan is het gebruik van top-level domeinen (pagina’s met .nl, maar bijvoorbeeld ook .frl en .amsterdam).
Een strategie waarbij criteria niet vooraf vastgelegd zijn, maar via een vastgesteld proces worden bepaald. Naast automatiseerbare en objectieve criteria kan het hierbij ook gaan om criteria die om meer specifieke of individuele beoordeling vragen, zoals criteria van culturele aard.
Een heldere definitie is noodzakelijk om duidelijkheid te verschaffen over het bereik van het Nederlandse webdomein. Dit geeft rechthebbenden meer zekerheid, omdat het zorgt voor grotere voorspelbaarheid en transparantie ten aanzien van wat binnen de wettelijke kader gearchiveerd kan worden.
Beantwoording van de motie Dekker-Abdulaziz
De motie Dekker-Abdulaziz onderscheidt drie mogelijke obstakels voor archivering van het .nl-domein en heeft de regering gevraagd deze in kaart te brengen en uit te zoeken hoe deze te overkomen.
Wettelijke obstakels en hoe deze te overkomen
In 2021 hebben de onderzoekers van IViR reeds betoogd dat duurzame beschikbaarheid van online informatie van belang is, bijvoorbeeld vanuit het perspectief van vrijheid van meningsuiting, informatievrijheid en in het licht van het waarborgen van het recht op wetenschap. Zij oordeelden destijds dat het legitiem en raadzaam is om maatregelen te nemen die webharvesting mogelijk maken. Dit zal echter op zodanige wijze moeten gebeuren dat andere fundamentele rechten niet te verregaand aangetast worden.7 IViR heeft daartoe al een aanzet gedaan. Het nu uitgevoerde onderzoek heeft geen (nieuwe) fundamentele obstakels voor een (wettelijke) facilitering van webharvesting langs deze lijnen blootgelegd. Wel moeten de randvoorwaarden voor het doorvoeren van specifieke oplossingen nog beter in kaart gebracht worden.
Technische obstakels en hoe deze te overkomen
Zoals gezegd voeren verschillende erfgoedinstellingen in Nederland op kleine schaal al webharvestingactiviteiten uit. Uit hun praktijk blijkt dat het technisch mogelijk is om (delen van) het Nederlandse webdomein op te slaan, te bewaren en (beperkt) beschikbaar te stellen. Er zijn daarmee op dit moment geen onoverkomelijke technische obstakels voor het uitvoeren van webharvestingactiviteiten.
Financiële obstakels en hoe deze te overkomen
De instellingen die nu al webharvestingactiviteiten uitvoeren, maken daarvoor kosten die ze dekken uit hun reguliere begroting. In het rapport wordt doorgerekend wat de extra kosten zouden zijn als zij deze activiteiten zouden uitbreiden nadat ze (al dan niet wettelijk) gefaciliteerd worden. De auteurs schatten deze extra kosten ruw in op gemiddeld € 500.000 per jaar, maar dit is afhankelijk van het gekozen scenario en de benodigde opslag over de jaren heen.
Het collectiebeleid van erfgoedinstellingen vormt in de praktijk de basis voor afwegingen over de verdeling van middelen over verschillende taken. De keuze om kosten te maken om webharvestingactiviteiten uit te voeren, beschouw ik als onderdeel van de afwegingen die erfgoedinstellingen moeten maken bij de uitvoering van hun collectiebeleid. Daarbij is het uitgangspunt dat de instellingen opereren binnen de huidige budgettaire kaders. In het vervolgtraject wordt nader uitgewerkt of er financiële gevolgen zijn voor OCW als gevolg van het wettelijk faciliteren van webharvesten en hoe deze mogelijke financiële gevolgen binnen de OCW begroting opgevangen kunnen worden.
Beleidsreactie
Ik erken dat er met het harvesten van het Nederlandse web, een groot publiek belang gemoeid is: de inhoud van het internet vormt (mede) het culturele erfgoed van Nederland, en is een potentiële bron voor onderzoekers, nu en straks. Ik concludeer dat het wenselijk is om de mogelijkheid tot het uitvoeren van webharvestingactiviteiten wettelijk te faciliteren (zoals in scenario 1 of 2). Een wettelijke basis zorgt in mijn ogen voor de beste balans tussen het informatie- en erfgoedbelang, het belang van (auteurs)rechthebbenden, de bescherming van persoonsgegevens en de rechtszekerheid van zowel de rechthebbenden als de partijen die webharvestingactiviteiten uitvoeren. Daarom start ik met de voorbereiding van een wetstraject. Dit met als doel om de mogelijkheid tot wettelijke faciliteren van webharvestingactiviteiten nader uit te werken.
In het consensusmodel (scenario 3) blijft er (rechts)onzekerheid bestaan voor alle betrokken partijen, omdat een wettelijke grondslag voor het uitvoeren van webharvestingactiviteiten ontbreekt. Tevens ontstaan er grote onzekerheden op het gebied van de bescherming van persoonsgegevens, omdat er door de uitvoerende partijen waarschijnlijk geen beroep kan worden gedaan op de uitzonderingsgronden van de AVG. Dit vind ik onwenselijk.
Bij een keuze voor de status quo (scenario 4) blijven de huidige drempels voor het uitvoeren van webharvestingactiviteiten bestaan. Daarom heeft dit scenario niet mijn voorkeur.
Vervolgproces
Ik ben voornemens om in 2026 te starten met de voorbereiding van een wetstraject. Deze voorbereiding duurt tot eind 2027. Indien in deze fase blijkt dat er een concrete, praktische route is naar wettelijke facilitering van webharvestingactiviteiten door één of meer organisaties, wordt het wetstraject om dit mogelijk te maken begin 2028 gestart. Het streven is dan om het wetstraject eind 2029 af te ronden.
Nadere invulling
Verschillende vraagstukken moeten in het voorbereidende traject nog verder worden uitgezocht. Enkele voorbeelden:
Ten aanzien van scenario 2 zal in het voorbereidende traject gekeken worden in hoeverre het mogelijk en wenselijk is om een wettelijke grondslag te creëren op basis waarvan meerdere instellingen beredeneerde selecties kunnen uitvoeren. Erfgoedpartijen hebben aangegeven dit van belang te vinden. Rechthebbenden wijzen in dit kader onder meer op de noodzaak van duidelijkheid over welke partijen dan webharvestingactiviteiten zouden kunnen uitvoeren en over de scope van beredeneerde selecties. In het voorbereidende traject zal ook uitgezocht worden hoe voor die duidelijkheid gezorgd kan worden.
Ten aanzien van scenario 1 en 2 vragen rechthebbenden om voorwaarden voor de beschikbaarstelling van het geharveste materiaal. Ook de vraag hoe die voorwaarden juridisch verankerd kunnen worden, zal meegenomen worden in het voorbereidende traject.
Voor beide scenario’s moet nader worden uitgewerkt wat de reikwijdte is van het nationale webdomein, inclusief de mate waarin dit juridisch dient te worden geëxpliciteerd.
Daarnaast moet uitgezocht worden welke partij het beste geplaatst is om een nationale domeincrawl uit te voeren. De bij het onderzoek betrokken erfgoedpartijen zien de Koninklijke Bibliotheek als een geschikte kandidaat voor het uitvoeren van deze webharvestingactiviteit. In het voorbereidende traject moet nagegaan worden hoe de mogelijkheid om een dergelijke domeincrawl uit te voeren, juridisch goed belegd kan worden en wat dit organisatorisch gezien vraagt van de betrokken partij.
Tot slot
Ik besef dat erfgoedinstellingen op korte termijn hun webharvestingactiviteiten verder willen uitbreiden. Tegelijkertijd vind ik het van groot belang dat het proces richting wettelijk faciliteren van webharvesting zorgvuldig verloopt, zodat er een duurzame oplossing komt waarin de verschillende rechten en belangen goed worden geborgd én die ook werkbaar is voor de partijen die webharvestingactiviteiten uitvoeren. Daartoe zal in de komende jaren een zorgvuldige uitwerking volgen.
In de tussentijd kunnen webharvestingactiviteiten onder de huidige (beperkende) omstandigheden doorgang vinden. Dit betekent dat erfgoedinstellingen die websites harvesten, hier vooraf toestemming voor moeten vragen aan alle betrokken (auteurs)rechthebbenden. Ik realiseer me dat de aanwas van webcollecties daarmee in de komende periode nog beperkt zal zijn. Binnen de huidige wettelijke kaders is dit echter de beste manier om de verschillende belangen die spelen, goed in balans te houden. Intussen blijf ik alert op signalen van de betrokken partijen over de effecten van deze praktijk.
Eind 2027 wordt uw Kamer geïnformeerd over de uitkomsten van het voorbereidende traject.
de minister van Onderwijs, Cultuur en Wetenschap,
Gouke Moes
Tweede Kamer, vergaderjaar 2024-2025, 26 643, nr. 1339.↩︎
Tweede Kamer, vergaderjaar 2023-2024, 26 643, nr. 1076.↩︎
Tweede Kamer, vergaderjaar 2024-2025, 26 643, nr. 1339, p. 20.↩︎
Martin R.F. Senftleben, Stef J. van Gompel, Anne Helmond, Luna D. Schumacher, Jef Ausloos, Joris V.J. van Hoboken, João Pedro Quintais. (2021). Webharvesting. https://www.ivir.nl/publicaties/download/Webharvesting_WODC.pdf.↩︎
Een dergelijk systeem wordt gebruik om verzoeken van rechthebbenden om een specifieke website uit het archief te verwijderen, te honoreren.↩︎
Martin R.F. Senftleben, Stef J. van Gompel, Anne Helmond, Luna D. Schumacher, Jef Ausloos, Joris V.J. van Hoboken, João Pedro Quintais. (2021). Webharvesting, p.3. https://www.ivir.nl/publicaties/download/Webharvesting_WODC.pdf.↩︎