Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Rapportering/Verktyg för att hålla Libris-information på Wikidata uppdaterad

Externt mål: [Rapport] Uppbyggnad av verktyg för att hålla Libris-information på Wikidata uppdaterad T205402

Bakgrund

Att ladda upp data till Wikidata är ett stort steg mot att öka synligheten och användbarheten av datan. Datakällans natur kan dock göra en enstaka uppladdningsinsats otillräcklig för att till fullo utnyttja datans potential. En bibliotekskatalog har speciella förutsättningar då den befinner sig i ständig förändring: nya poster läggs till kontinuerligt samtidigt som gamla poster berikas med ny information och felaktiga uppgifter rättas till. Då vi laddar upp innehållet i Libris till Wikidata skapar vi en ögonblicksbild av katalogens innehåll vid en viss tidpunkt.

För att ytterligare öka värdet av datan vill vi härmed lägga fram ett förslag på möjliga strategier och verktyg för att hålla datan uppdaterad.

Utförande

Nya poster

Antag att man har identifierat ett antal Librisposter, antingen auktoriteter eller bibliografiska poster, som ej finns med på Wikidata. Antingen ingick de ej i massuppladdningen eller så skapades de i Libris efter att denna har genomförts. Det finns två möjliga scenarion för att ladda upp dessa till Wikidata.

Skapa enstaka poster efter behov

I detta scenario är det en Wikidata- eller Wikipediaanvändare som uppmärksammat bristen; hen vill kanske använda boken som källa på Wikipedia eller är allmänt intresserad av att kunna se den på Wikidata.

Den optimala lösningen i det här scenariot är att ge användaren möjlighet att halvautomatiskt skapa ett Wikidataobjekt genom att ange bokens Libris-identifierare. Verktyget skulle kontrollera att det inte redan finns ett Wikidataobjekt med samma Libris-URI, varpå ett nytt objekt skulle skapas och fyllas på med uppgifter inhämtade medelst Libris öppna API. Förslagsvis skulle detta verktyg ha formen av ett enkelt tillägg till Wikidatas gränssnitt för att kunna användas av personer utan Wikidata-vana. Eftersom en del av målgruppen i detta scenario är Wikipediaskribenter, som ej bör tvingas lära sig Wikidata för att kunna fortsätta skriva artiklar på Wikipedia, är det önskvärt att kunna använda verktyget utan att lämna Wikipedia. Användaren skall kunna uppnå sitt mål – att importera bibliografiska uppgifter från Libris och bifoga dem i en Wikipedia-artikel – utan att exponeras för en annan webbplats med en betydligt svårövergripligare struktur.

Masskapa objekt utifrån nytillkomna Librisposter

En annan möjlighet är att bygga ett verktyg som då och då, antingen med regelbundna intervaller eller när det triggas av en användare, "stämmer av" relationen mellan Wikidata och Libris för att identifiera Librisposter utan motsvarighet på Wikidata. Ifall Libris XL har ett fungerande RSS-flöde med nytillkomna poster skulle detta med fördel kunna nyttjas till detta ändamål. Precis som i föregående scenario skulle Libris URI användas för att matcha mot eventuella befintliga Wikidataobjekt.

Vilka användare som skulle ges tillgång till detta verktyg – vilket skulle erbjuda en möjlighet att masskapa Wikidataobjekt utifrån uppgifter inhämtade från Libris öppna API – är en öppen fråga.

Befintliga poster

En annan utmaning är hur man skall hantera förändringar och uppdateringar i befintliga Librisposter. Med befintliga poster menar vi poster vars innehåll redan importerats till Wikidata, vilket innebär att det finns ett Wikidataobjekt försett med postens Libris-URI. Även i detta scenario skulle ett RSS-flöde med förändringarna vara till stor hjälp.

I så fall skulle man kunna utnyttja samma gränssnitt som i föregående scenario – en sida som stämmer av Wikidatainnehållet med RSS-flödet. En bot (ett automatiskt skript) skulle kunna, med jämna mellanrum, undersöka RSS-flödet och, efter att ha identifierat förändringar i poster som har motsvarande Wikidataobjekt, posta notifikationer om vilka av objektets fält som påverkas, samt ändringsförslag. En användare skulle då kunna granska förslaget och godkänna det med ett klick.

Allmänna anmärkningar

Vi kan tänka oss att alla de ovan beskrivna verktyg (gränssnitt för att stämma av Wikidatainnehållet med Libris, notifikationer om nya/modifierade Librisposter m.m.) skulle kunna samlar på en projektsida på Wikidata. Detta skulle göra det möjligt för gemenskapen att utföra de olika åtgärden utifrån individuellt behov och intresse samtidigt som det skulle öka synligheten för projektet och samarbetet mellan WMSE och KB. Projektsidan skulle erbjuda gemenskapen ett naturligt utrymme för diskussioner om projektets framskridande och framtid samt för felanmälningar.

En viktig aspekt av uppdateringsverktyget är att alla redigeringar skall vara källbelagda – varje redigering utförd med verktyget skall förses med källhänvisning till Libris. Helst skall det utföras helt automatiskt, utan att användaren behöver tänka på det.

Inom ramen för projektet FindingGLAMs, som har finansiering av Postkodstiftelsen, kommer vi att titta på (semi-)automatiska uppdateringar som en fallstudie för att ge guidning till andra bibliotek eller kulturarvsinstitutioner som är intresserade av att tillgängliggöra material till Wikidata. Detta kommer att möjliggöra ett ökat värde av arbetet vi genomför i projektet då fler bibliotek kan ta del av lärdomarna och det material och metoder vi utvecklat.