Menu
NL
Floor

Floor Maertens

PACKED: stagiair Floor verdiept zich in open data

In 2018 volgde bij PACKED voor het eerst een betaalde stagiair een project rond open data op. Ook dit jaar nemen we iemand tijdelijk via een een BIS-baan (vroeger BIO) aan: sinds begin september 2019 werkt Floor Maertens aan een project rond het opschonen, modelleren en online publiceren van data. Haar achtergrond in conservatie en restauratie zorgt voor een interessante nieuwe invalshoek.

Voor haar eerste project werken we samen met het Huis van Alijn. Daarover zegt Floor zelf:

“De eerste weken heb ik me beziggehouden met de bestaande circusthesaurus die het Huis van Alijn ons heeft voorgelegd. Het doel is om te onderzoeken of deze zo volledig mogelijk in Wikidata kan worden opgeladen, met het oog op zaken als uitwisselbaarheid en standaardisering. Hiervoor ben ik de overeenkomsten en verschillen met de bestaande thesaurus in Wikidata nagegaan. Wat is bruikbaar en wat niet? Wat zijn eventuele kleine aanpassingen, of grotere? De bekomen conclusies omtrent eventuele aanpassingen zullen nog worden voorgelegd aan het Huis van Alijn.”

Naast de circusthesaurus heeft Huis van Alijn nog veel meer gegevens over circus in hun collectie, gaande van een gestructureerde database tot doorlopende biografische teksten over circusfamilies. Floor zal tijdens haar stage onderzoeken hoe deze data maximaal bruikbaar en machineleesbaar te maken. 

Verder verdiept Floor zich in data van FoMu over Belgische fotografen, in eerste instantie uit de Directory of Belgian Photographers, maar ook een tweetal andere datasets worden overwogen. Ze gaat aan de slag met de opensourcesoftware OpenRefine om deze gegevens te schonen en maximaal om te zetten naar (her)bruikbare data.  

Waar mogelijk en wenselijk worden deze data als open data publiek en vrij herbruikbaar gepubliceerd op Wikidata. Wanneer dit niet mogelijk is omwille van de structuur, de inhoud of gebruiksbeperkingen op de data, zal Floor experimenteren met Wikibase als software om de data met een zo groot mogelijke flexibiliteit te kunnen modelleren en gestructureerd op te slaan voor intern gebruik.

Vlaanderen - Verbeelding werkt