Europeana: het streven naar betere metadata (update )

In maart 2016 werd een Europeana Data Quality Committee (DQC) in het leven geroepen om aan de verschillende aspecten van datakwaliteit te werken. Kwalitatief betere metadata in Europeana is noodzakelijk om tegemoet te kunnen komen aan de gebruikersbehoeften. Het verbetert zowel de zoekperformantie, de gebruikerservaring van de Europeana-bezoekers als het hergebruik van de data.

Gebruikersnoden beantwoorden met goede metadata
Het DQC heeft niet gekozen voor een theoretische oefening, maar is gaan kijken naar datakwaliteit vanuit het perspectief van het verwachte of vereiste gebruik. Dat resulteerde in de creatie van een reeks gebruiksscenario’s die vereisten voor het ophalen van informatie reflecteren. Die scenario’s vormen de context en de leidende principes voor het werk van het DQC.

Helderder formuleren van de vereisten
Vereisten op een helderder manier formuleren is voor Europeana een manier om de datakwaliteit te verbeteren. Het DQC heeft besloten om de huidige EDM-elementen in twee groepen op te delen: verplichte elementen en faciliterende elementen. Daar waar de faciliterende elementen zeker wenselijke (maar optionele) functionaliteiten ondersteunen voor een bepaald aantal gebruiksscenario’s, zijn de verplichte elementen vereist als werkelijk minimum voor elke metadatabeschrijving. Het DQC heeft een lijst aanbevelingen geformuleerd voor verplichte elementen die in de EDM-mappingrichtlijnen zullen worden opgenomen. Die aanbevelingen bevestigen sommige elementen als verplicht, definiëren sommige nieuwe elementen als aanbevolen, en heft beperkingen op voor andere elementen. De volgende stap is een lijst van faciliterende elementen. De nieuwe aanbevelingen moeten vooral het belang aantonen van bepaalde elementen in specifieke gebruiksscenario’s. Ondertussen werden ook verduidelijkingen gesuggereerd in de definities van sommige elementen.

Meten van de kwaliteit van metadata
Het controleren van de kwaliteit van de metadata is cruciaal voor Europeana. Daarom is het DQC beginnen werken aan een volledigheidsbeoordeling die de meest volledige metadatabeschrijvingen aanduidt. Er wordt verwacht dat dat een manier zal opleveren om de volledigheid van metadata te meten, die zowel de hergebruikers van data en de medewerkers van Europeana kan informeren over de kwaliteit van de datasets als de zoekresultaten en de ranking van de zoekresultaten van de Europeana Collections zal verbeteren.

Identificeren van fouten in metadatawaarden
Terwijl het meten van de volledigheid zich richt op de aanwezigheid van een bepaald veld in een metadatarecord, geeft het geen enkele kwaliteitsaanduiding over de waarde die is opgenomen in het veld. Het DQC heeft een lijst van problemen opgesteld voor metadatawaarden die een invloed hebben op het zoeken en die interfereren met de rankingalgoritmes. De volgende stap zal het testen van nieuwe technologieën zijn om probleempatronen in de data te identificeren en die door bv. normalisering gedaan te maken.

Lees hierover meer in de originele blogpost.

  • Terug naar overzicht
  • Diamond works: interior view (a) diamond cutters (b) elevations of faceted cut diamonds. Etching by Bénard after Lucotte. Image: The Wellcome Library, CC BY.
met de steun van de vlaamse overheid

Copyright © 2017 PACKED / Legaal / Privacy / Sitemap
Webdesign by thisconnect.be / pixelman.be