Menu
NL
1200Px Wikidata Con 2019  2019 10 26  2636  Group Photo

Beeld: groepsfoto WikidataCon2019, Pierre-Selim Huard CC BY 4.0 via Wikimedia Commons

PACKED: verslag WikidataCon 2019

Eind oktober trok PACKED-medewerker Bart Magnus naar Berlijn voor WikidataCon 2019. De conferentie focuste zowel op Wikidata als op Wikibase. Na een aantal jaren met data van Vlaamse cultuurorganisaties op Wikidata te hebben gewerkt, richten wij onze aandacht sinds kort ook op Wikibase. De conferentie kwam dus op een ideaal moment om onze eerste ervaringen te delen en met en bij andere gebruikers antwoorden te zoeken op vragen.

Wikidata versus Wikibase

Wikidata is de vrije en meertalige kennisbank die zorgt voor de centrale opslag van de gestructureerde gegevens ter ondersteuning van Wikipedia, Wikimedia Commons en andere wiki's van de Wikimedia-beweging. Ze is zeer geschikt is voor linked open data die door een brede gemeenschap van mensen mag hergebruikt en bewerkt of verrijkt worden. Dat is zeer zinvol, maar niet de enige mogelijke manier om linked open data op te slaan en te publiceren. Heel wat organisaties beschikken immers over informatie die niet geschikt is voor Wikidata, bv. omdat ze te specifiek is of volledig door de organisatie gecontroleerd moet kunnen worden. 

Wikibase is een verzameling van applicaties en bibliotheken voor het creëren, beheren en delen van gestructureerde gegevens. Nu deze achterliggende software die ontwikkeld werd voor Wikidata sinds kort voor iedereen herbruikbaar is, ontstaan er mogelijkheden om sommige data in een eigen lokale versie (instance) van Wikibase te publiceren. Het voordeel is dat je data in je lokale Wikibase volledig zelf beheert. Zo controleer je er bijvoorbeeld wie data mag toevoegen of bewerken. Je kan Wikibase kan net als Wikidata als een open data repository gebruiken en de data voor iedereen toegankelijk maken. Maar indien wenselijk - bijvoorbeeld omwille van privacygevoeligheid van data - kan je de toegang ook beperken. PACKED / VIAA zette een eigen Wikibase-testomgeving op om zelf te kunnen experimenteren. Ons doel is om uit te zoeken welk potentieel Wikibase voor Vlaamse cultuurorganisaties heeft. Onze ervaringen met Wikidata en onze nieuwsgierigheid naar Wikibase lichtten we op de conferentie toe met een poster.

Hieronder vind je een selectie van interessante inzichten uit WikdataCon 2019.

Strategieën voor GLAMs

Andrew Lih (Wikimedia-strateeg bij The Metropolitan Museum of Art, New York) focuste in zijn presentatie op strategieën voor GLAMs (galeries, bibliotheken, archieven en musea) om vanuit hun collectie bij te dragen aan Wikidata en Wikimedia Commons, de centrale beeldbank voor Wikipedia, Wikidata en andere wiki's van de Wikimedia-beweging. Het document met zijn presentatie, de videoregistratie en de gezamenlijke notities van de aanwezigen zijn vindbaar via deze link. De presentatie ging onder meer in op de workflows voor beeld- en datadonatie om vervolgens de mogelijkheden en uitdagingen van machine learning aan te snijden. Wikidata Depiction Game - waar we het in een eerder nieuwsbericht al over hadden - resulteerde in meer dan 7.000 menselijke validaties van automatisch getagde kunstwerken en leidde tot ongeveer 5.000 effectieve edits in Wikidata, waaronder veel edits die betrekking hadden op werken uit de collectie van The Met. Dit is voor The Met maar een eerste stap in de omgang met machine learning als onderdeel van de organisatiestrategie rond open data en crowdsourcing. Andrew Lih gaf een bondig overzicht van rapporteringstools om op te volgen wat er op de Wikimedia-platformen met geüploade data en beelden gebeurt. 

De recent geïntroduceerde Structured Data on Commons opent een aantal nieuwe mogelijkheden voor de omgang met beelden. Zo is het sinds kort mogelijk om gestructureerde data aan afbeeldingen op Wikimedia Commons toe te kennen. Door de meertaligheid van de gestructureerde data (afkomstig uit Wikidata) draagt Structured Data on Commons bij tot een betere vindbaarheid van geüploade afbeeldingen. Ter illustratie: de tool Vizquery Commons maakt het mogelijk om in de gestructureerde data te zoeken met een SPARQL-query (of zoekvraag) en de resultaten te visualiseren.

Interessante tools en games

Met Monumental kan je bouwkundig erfgoed in een bepaalde streek ontdekken. De tool combineert informatie uit Wikidata, Wikimedia Commons en Wikipedia in een vloeiende interface. Als voorbeeld zoomden we in op een stukje Brussel:

VhpbBdphrNNKIBESQWZ1FfQ6K5Kyr7ACZCozejykd_TNv7hPuWM-RtHg-IdvLhDzU8QEYoYsWsD8FL_wik7WcEW4YUsGygdPgAmhpM5wlisJvJSNOQBtVz9p91D3k6KicARv9buD

Wanneer je doorklikt op een item, krijg je dit te zien:

XJTgjtoqy96_3y78C1sVvbOd4oTn5n_u7lHxhKCbnxUf1i16D8ztmgHax2GRuZ0oNkfMqJ4CCrc67QvDDAXacCd8EXQTqFIlF6z8X9uRtXwheq3a-W7itHaUv7L22boA3mWtk2t-

Vervolgens krijg je een selectie van properties uit Wikidata en een kaart te zien: 

8f-NkO9iYF1p7xWT_JAhbMTgTHacGFGHXylL3xTCylf-VQ7Y4g_VvmsKvfnZWAr-3Pb9jXBDsBIdzf8S4onlQRfQHHH5gDQTWv4tr5KZbSwBCy9iAGWzEHLBs-zmUvd9kfKgITYp

dakBcDF_n6cIHRO14Xk760F1Xz4El0SEAoaTWAbbB3sCiaijG_Dhy_TQlNQAfr96W6Yw3fW-mJ3yb_YicuJxc47PQ4An3RzqWsTvx-mswwQmWpGcFIOPtHZHJqBBzBN8UKvX7dhv

Met TABernacle voeg je iconografische informatie over kunstwerken toe aan Wikidata. Via deze game-interface behoud je het overzicht en kan je op korte tijd veel informatie toevoegen. De selectie van werken die je te zien krijgt, bepaal je zelf aan de hand van een SPARQL-query. In dit voorbeeld vroegen we bijvoorbeeld de werken op uit de collectie van Mu.ZEE die op Wikidata staan en die een gelinkte afbeelding op Wikimedia Commons hebben. Mu.ZEE kun je door om het even welke andere collectie vervangen. Een zeer leuke manier voor musea om hun fysieke en virtuele bezoekers aan de slag laten gaan met hun collectie. Alle data in Wikidata zijn gepubliceerd onder een CC0-licentie en dus zonder restricties herbruikbaar, ook door de collectiebeherende instellingen zelf.

ayqsHPh6GiP57S096iMsIVeeXAVx62PJEDYWJhuF-LY4UJRUXZrfq-fjKlSVs6m90gEmYG6Hbya55ykdYdTcLnDVIOcKAe7I0Rf6zhb9nSqrGx_w8xlyTiJe0zLjOV0dtie01DFb

Wikidata Art Depiction Explorer is een nieuwe laagdrempelige tool om mensen iconografische informatie over schilderijen te laten toevoegen aan Wikidata. Je kunt willekeurige schilderijen uit verschillende collecties bekijken en indien mogelijk iconografische info toevoegen, maar je kunt ook per collectie browsen aan de hand van het Q-nummer van een museum. In onderstaand voorbeeld kozen we voor de schilderijen uit Museum M (Q2362660) die op Wikidata beschreven staan en een gelinkte afbeelding in Wikimedia Commons hebben.

pKEZF4VUVqDu_t6FRq54VBXxRWsSj3hI0-AvGhyGYcTol6uB9U5SluUEqVVs1RxkIGGLuNp67W4RowQUEWJZtFSB-yOkkg7yoBsW0muTo_sXvA-Tk3rcIuk9xSjxef4dHN41GPjh

Wanneer je doorklikt op een schilderij kan je informatie toevoegen en opslaan.

Xw3m7BitqOCVupS2IN7i6g-H8v3kKLRMcmSFiOxnyBiQ1Wj7e16-sVU60Uazr_kLQLSVUv-cX0sDo3CMpSg3KP7e3bmUw7gLgW1on4YhVmdvr0BleCT57nnkfnSdd9DgPL_sreE-

Vervolgens kan je een volgend schilderij kiezen, bv. van dezelfde kunstenaar of uit dezelfde collectie:

aOsVqJEdzp9deg1GY96VZ_9NqEc9_g-h3tH8jyMSovuZkFpwf3UqHBTSBNXmRbn-TkkqB8CizbG5ikFTwP1QQev9J1kN7f_OVKx_vBWLnQaWHskb5xtXP9G8N-6RsYXWaI0qxPOT

De ISA-tool nodigt je uit om in spelvorm gestructureerde data aan beelden op Wikimedia Commons toe te voegen. Met de tool kun je “campagnes” aanmaken om beelden binnen een bepaalde categorie van gestructureerde metadata te (laten) voorzien. Tijdens de conferentie was er een ISA-challenge met beelden van Berlijn. Op dit moment loopt er ook een campagne om de beelden van de fotowedstrijd Wiki Loves Heritage België 2019 van gestructureerde data te voorzien. Test het uit! Ook de fotowedstrijd zelf loopt overigens nog enkele weken. 

LSKPdNJxjLyxoWc0jclHGjkc5DMimUmiaTVj_JXlt7c0zMpg3BYD5Lyo_zT87uJjI9tAoLFH6mvLTyENX9V9rr-7N3ENZ-Vje61rXE88l4MOrigYBJqB8mM5WqojrmWmNX_WTPS6

Wikibase: bijgeleerd en uitgeklaard

Naast klassieke presentatieformats was er op deze Wikidata Con 2019 ook ruimte om goede praktijken uit te wisselen en van elkaar te leren tijdens meetups. Dit waren de momenten bij uitstek om een antwoord te vinden op onze vragen over Wikibase. Zo hadden we vragen bij de mogelijkheid tot het hergebruiken van Wikidata-properties in een eigen Wikibase. Dat is vandaag al mogelijk met de Wikibase-Import-extensie, maar is nog niet echt laagdrempelig en betreft bovendien een eenmalige import. Een volgende uitdaging is dus om het mogelijk te maken om de properties na de import ook in sync te houden. Wikimedia Deutschland werkt de komende maanden aan de technische ontwikkeling hiervan.

Om grote hoeveelheden data naar Wikidata op te laden is het handig om Quickstatements, een tool voor batch upload, te gebruiken. Deze tool werkt eveneens op je eigen lokale Wikibase. 

Een ander veelbesproken onderwerp bij het gebruik van Wikibase was “federated queries”. Net als Wikidata heeft je eigen Wikibase een SPARQL-endpoint waarmee je de data kan bevragen. Een uitdaging daarbij is om binnen eenzelfde SPARQL-query zowel je eigen data als die van een andere Wikibase (bv. Wikidata) te combineren. Op zich is het vandaag al mogelijk om in één query meerdere SPARQL-endpoints aan te spreken (zie bv. deze rangschikking van universiteiten). Er moet echter nog een goede oplossing komen om verschillende Wikibases tegelijk te bevragen die beide P-nummers als properties gebruiken om te voorkomen dat er verwarring ontstaat uit welke Wikibase je een property wil gebruiken in een query.

Er zijn al heel wat voorbeelden van organisaties die aan de slag zijn gegaan met Wikibase, waarvan de meerderheid is geregistreerd in het Wikibase Registry. Op de WikidataCon 2019 viel heel wat te leren uit hun eerste ervaringen. Wie Wikibase eens wil uitproberen, maar niet de moeite wil doen of het geld wil spenderen om zelf een Wikibase instance op te zetten, kan sinds kort gebruik maken van https://www.wbstack.com/, een soort vrijblijvende Wikibase-speeltuin. Aangezien dit een testopstelling is, zijn je data publiek toegankelijk en kun je er ook niet vanuit gaan dat ze er zullen blijven inzitten, maar het is wel een ideale omgeving om vrijblijvend het één en ander uit te proberen.

Workflows

Goede tools voor bulkuploads van data en beelden zijn belangrijk voor cultuurorganisaties om aan de slag te gaan op Wikimedia-platformen of in een eigen Wikibase. In een specifieke GLAM meetup werden de noden onder de loep genomen. Sinds kort neemt Wikimedia Sweden de wereldwijde coördinatie voor GLAMs in handen. Ze zullen de komende tijd initiatieven ontwikkelen die partnerships tussen Wikimedia-platformen en GLAM-instellingen moeten vergemakkelijken en verduurzamen. 

De continue ontwikkelingen in Wikibase en Wikimediaplatformen als Wikimedia Commons en Wikidata, zorgen ervoor dat ook de bijhorende tools mee moeten evolueren. Door de intrede van Structured Data on Commons is het bv. wenselijk dat data uit exports van collectiebeheersystemen ook rechtstreeks aan beelden gekoppeld kunnen worden in plaats van enkel aan Wikidata-items. De opkomst van lokale Wikibases doet de vraag rijzen naar gebruiksvriendelijke tools om ook in bulk met data aan de slag te gaan in Wikibase. De tools die er vandaag zijn voor uploads naar Wikidata en Wikimedia Commons komen maar deels tegemoet aan de noden die Structured Data on Commons en lokale Wikibase instances genereren. 

Een interessante piste tijdens de discussie ging over het potentieel van Open Refine, open source desktop-applicatie voor het opschonen van gegevens en het omzetten naar andere formaten. Die heeft vandaag een Wikidata reconciliation service voor het normaliseren van data en een Wikidata-extensie voor het schrijven naar Wikidata. Het is technisch ook al mogelijk om via OpenRefine een reconciliation service op je eigen Wikibase te laten draaien en vervolgens met QuickStatements grote hoeveelheden data te uploaden. OpenRefine lijkt de meest voor de hand liggende tool om in de toekomst de upload van beelden met gestructureerde data naar Wikimedia Commons te ondersteunen. Het zou collectiebeherende organisaties die data en beelden willen uploaden in staat stellen om het hele proces voor beide platformen met één tool te doorlopen. We duimen alvast mee op Github!

Bovenstaande was maar een greep uit het geheel. Wie heel het programma wil ontdekken, met daarbij ook per sessie links naar documentatie en video-opnames van de sessies kan terecht op https://www.wikidata.org/wiki/Wikidata:WikidataCon_2019/Program.

Vlaanderen - Verbeelding werkt