25-06-2024

Huygens Instituut pakt historische vooringenomenheid in datasets aan

Het Huygens Instituut heeft een NWO-subsidie toegekend gekregen om vooringenomenheid en subjectiviteit in historische datasets aan te pakken. Het project Combatting Bias wil de manier veranderen waarop onderzoekers en AI-systemen met historische data werken. Het project is ingebed in een internationaal netwerk.

NWO financiert het Combatting Bias-project van het Huygens Instituut via een TDCC-SSH subsidie. NWO ziet ‘bias’ als een groot probleem bij sociaal- en geesteswetenschappelijke data en erkent de behoefte aan een ethisch kader. Combatting bias gaat richtlijnen opstellen voor kritische reflectie bij het samenstellen en structureren van datasets en wil zo vooringenomenheid in datasets identificeren en verminderen.

“Op die manier krijgt de samenleving genuanceerdere en meer diverse weergaven van het verleden – weergaven die de stemmen en ervaringen bevatten van degenen die historisch niet of minder gehoord zijn,” belooft Lodewijk Petram, projectleider. ‘Dit heeft ook positieve effecten op AI-systemen, zoals taalmodellen, waarin historische vooringenomenheid vaak onbedoeld doorwerkt.’

Vooringenomen verhalen

Vooral in de sociale en geesteswetenschappen weerspiegelen datasets vaak de perspectieven van historische machthebbers, waardoor ongelijke verhoudingen in stand blijven.

“Het is de taak van de makers van datasets om scheve voorstellingen van het verleden in datasets op te merken, deze zo veel mogelijk recht te trekken, en gebruikers hierover te informeren”, vindt Manjusha Kuruppath, coördinator van het project. “Maar de makers van datasets kunnen hier hulp bij gebruiken.”

Het komende jaar sluit het Combatting Bias-team aan bij vier projecten die gegevens verzamelen uit koloniale archieven, een bij uitstek vooringenomen databron. Gebruikmakend van principes uit de data-ethiek gaat het bijvoorbeeld adviseren over het gebruik van terminologie en categoriseringen die recht doen aan het verleden.

Verschillende perspectieven

Samenwerking staat centraal in het project. “Door samen te werken met een diverse groep adviseurs kunnen we putten uit een schat aan expertise, ervaringen en perspectieven om uitgebreide richtlijnen te ontwikkelen die bias sociaal- en geesteswetenschappelijke datasets effectief aanpakken”, zegt Mrinalini Luthra, data steward bij het initiatief.

Adviseurs en partners dragen regionale perspectieven aan uit Nederland, Palestina, de VS en Zuid-Afrika, en expertise variërend van de studie van muziek in verschillende culturen tot sociaalwetenschappelijk onderzoek, politiek activisme en FAIR-datapraktijken. FAIR staat voor Findable, Accessible, Interoperable en Reusable. Het betekent dat zowel mensen als computers de data moeten kunnen vinden, begrijpen en (her)gebruiken.

Het project wordt ingebed bij het Huygens Instituut en het Internationaal Instituut voor Sociale Geschiedenis (IISG). Data stewards van de data-afdelingen van beide instituten zullen op het project werken. Zij zullen samenwerken met partnerprojecten om richtlijnen te ontwikkelen voor het tegengaan van bias in datasets. Daarnaast zullen ze ervoor zorgen dat de inzichten uit het Combatting Bias-project duurzaam worden geïntegreerd bij de instituten.

Individu of handelswaar

GLOBALISE, een partnerproject dat de omvangrijke VOC-archieven online toegankelijk maakt, heeft regelmatig te maken met de uitdagingen waar Combatting bias zich op gaat richten. Bij het werk aan een dataset over goederen die genoemd worden in de VOC-archieven, kwam de vraag op of tot slaaf gemaakte personen in de dataset moesten worden opgenomen. Het project wilde de gewelddadige geschiedenis van slavernij niet verhullen, maar ook niet via de dataset een vorm van legitimiteit meegeven aan de behandeling van tot slaaf gemaakte personen door de VOC. GLOBALISE koos voor een intersectionele benadering, waarbij tot slaaf gemaakte personen worden opgenomen in de dataset van handelswaar, maar ook als individuen met een rijke persoonlijke geschiedenis, relaties en sociale posities. Dit helpt onderzoekers om geschiedenissen te schrijven die recht doen aan de menselijkheid van de tot slaaf gemaakte personen.