Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2019/Ansökan

Ansökan har beviljats.


Detta är den reviderade ansökan som skickades in till KB den 8 april 2019.

PDF-versionen av ansökan.


Nyttan

Wikidata är en hub för länkade öppna data (LOD) från olika källor och ett av de många projekten inom Wikimediavärlden. Wikidata innehåller i dag stora mängder bibliografisk information och inom projektet Strategisk inkludering av biblioteksdata på Wikidata har vi berikat Wikidata med bibliografiska uppgifter om en mängd böcker utgivna i Sverige. Detta var ett första steg för att göra mer biblioteksdata tillgängligt och enkelt konsumerbart. Detta fortsättningsprojekt syftar till att ta arbetet vidare.

Kungliga bibliotekets arbete med digitalisering och Libris XL har under året som projektet pågått fortsatt. Det innebär att mer material i närtid är möjligt att inkludera på Wikidata, och kan därigenom enkelt inkluderas på Wikipedia, världens femte mest använda webbplats. Materialet får genom detta ökad synlighet och kan återanvändas enklare då ett stort antal tjänster hämtar data från Wikidata. Wikidata är inte bara en plats att lagra data, utan har blivit en central hubb där olika datakällor kopplas samman. Materialet som finns där återanvänds på oräkneliga tjänster, allt från Googles Knowledge Graph till tjänster såsom inventaire.io. Materialet underhålls av tusentals frivilliga från hela världen på över 300 olika språk.

Att enkelt kunna källbellägga information är ett viktigt redskap i ett digitalt och snabbt föränderligt medielandskap där även falska nyheter och ryktesspridning sker otroligt snabbt och når en stor publik. Genom att inkludera olika strategiskt utvalda dataset från biblioteksvärlden ökar möjligheten för allmänheten att enkelt källbelägga och kontrollera uppgifter. Inkludering av bibliotekens information och sammankoppling av data är därmed en strategisk möjlighet. Informationen skulle genom inkluderingen på Wikimediaplattformarna även knytas till liknande dataset och samlingar i andra länder. Genom inkluderingen av dessa dataset ges biblioteken och dess samlingar ökad sökbarhet, synlighet och kontext. Liknande insatser pågår i många andra länder och vi har under den första delen av vårt första projekt sett att det finns ett stort intresse av att lära sig mer om vårt pågående arbete med data från Kungliga biblioteket för att ta det arbetet framåt.

Projektet möjliggjordes av att en av Libris deldatabaser, Svenska nationalbibliografin, sedan några år tillbaka finns som öppna data med den Wikidata-kompatibla licensen CC0. Tack vare detta kloka beslut kan bibliotekets data fritt återanvändas, modifieras och kopplas samman med data från andra källor; något som Wikidata är en idealisk plattform för.

Möjligheterna med öppna data slutar dock inte med att ladda upp det till Wikidata. Tvärtom, det finns mycket man kan göra efter uppladdningen för att maximera den nytta man har av datan. Ett område där det finns utrymme för tekniska lösningar som kan höja nyttan av bibliotekets data är integrationen med svenskspråkiga Wikipedia. Wikidata och Wikipedia är två separata och självständiga projekt som båda kan gagnas av närmare synergier. Genom att göra det lättare för Wikipedias skribenter att upptäcka, använda och redigera bibliotekets bibliografiska data kan vi uppnå två mål: dels underlätta att skapa källhänvisningar, vilket kommer att höja Wikipedias status som en högkvalitativ och tillförlitlig kunskapskälla, och dels förbättra synligheten för Kungliga bibliotekets arbete med länkade öppna data.

Kopplingar till andra projekt

Föreningen driver även projektet Wikipedia i Biblioteken. Projektet drivs av Wikimedia Sverige med finansiering från Kungliga biblioteket och har som syfte att höja de svenska folkbibliotekariernas kompetens inom att använda sig av, och bidra till, Wikipedia. Eftersom Wikidata har blivit en viktig del av Wikipedias underliggande infrastruktur, samt erbjuder intressanta möjligheter för personer yrkesverksamma inom informationsvetenskapliga fält, är det relevant för denna målgrupp.

Effektmål

Detta projekt är designat för att uppnå följande effektmål:

  • Öka användningen av svensk biblioteksrelaterade data.
  • Nationellt och internationellt synliggöra det arbete som skett runt LOD i Sverige samt samarbetet med Wikimediarörelsen.
  • Sporra bibliotekens tekniska personal som jobbar med LOD m.m. genom att ge konkreta exempel på det värde deras arbete skapar samt tillsammans identifiera framtida utvecklingsmöjligheter för fri kunskap.
  • Visa på bibliotekens värdet för allmänheten genom att tydliggöra insatserna och det värdefulla material de förvaltar.
  • Öka kunskapen om hur Wikimediaprojekten kan användas av biblioteken för att prioritera sin digitalisering.

Genomförande

Vi vill genomföra ett större strategiskt projekt för att inkludera bibliotekens digitala information på Wikimedias plattformar. Projektstart är 2019-08-01 och projektet pågår till 2020-08-31. Under perioden kommer en plan för ytterligare arbete i ett fortsättningsprojekt tillsammans med KB att utvecklas, om detta bedöms vara i linje med de nya nationella utvecklingslinjerna. Vi kommer att arbeta med följande delar: (1) Tillgängliggörande av ytterligare biblioteksdata; (2) Användande av biblioteksdata på Wikipedia; (3) Kommunikation och evenemang för ökad kunskap och involvering av fler.

Kontinuerlig uppdatering av data

Arbete med länkade öppna data slutar inte när en första uppsättning data har laddats upp till en plattform som Wikidata, särskilt när datakällan, i detta fall Libris, är under ständig utveckling och aldrig förväntas bli färdigställt. För att säkerställa att den biblioteksdata vi inkluderat ej stagnerar, krävs det verktyg för att enkelt kunna ladda upp ytterligare Librisbokposter till Wikidata. Målgruppen är en Wikipedia/Wikidata-användare som upplever en brist på en viss bok i Wikidata – till exempel för att använda den som referens i ett Wikidataobjekt – men som kan leta upp boken i Libris och ta fram dess identifierare. Verktyget skulle kunna ha formen av ett JavaScripttillägg till Wikidatagränssnittet, eller en extern webbplats där användaren får mata in en eller flera Libris-identifierare.

Den växande mängden biblioteksrelaterade data på Wikidata öppnar dessutom upp för möjligheten att lägga till Wikidatas identifierare i Libris. Precedens finns i auktoritetsdatasystemet VIAF, där många av posterna innehåller länkar till Wikidataobjekt. Tillfället är ypperligt nu när Libris XL är under pågående utveckling, vilket ger bibliotekets personal plats för planering och diskussion om hur integrationen kan se ut. Denna idé fick ett positivt mottagande under det “hackathon” (workshop) vi anordnade i januari 2019, och en testimplementation gjordes i Libris utvecklingsmiljö. Vi kan bistå med att skapa rapporter om vilka Wikidataobjekt som länkar till vilka Librisposter.

Tillgängliggörande av ytterligare samlingar biblioteksdata

Under 2018 har vi laddat upp information om auktoriteter samt utgåvor från Svenska nationalbibliografin. Vårt fokus har legat på de bokverk som ofta används som källor på svenskspråkiga Wikipedia, vilket har givit oss en inblick i hur bibliografiska data kan struktureras på Wikidata och hur arbetet kan fortsätta i framtiden.

Med den erfarenheten står vi nu framför en möjlighet att ladda upp betydligt större mängder data, inklusive specialsamlingar, men det måste klargöras att de är under licensen Creative Commons Zero (CC0) innan det arbetet kan initieras. Vi kommer att föra en kontinuerlig dialog med Kungliga biblioteket om detta och vid behov även kontakta databasägarna för att förklara värdet av en tydlig licensiering och förse dem med material för att underlätta deras beslutsfattande. I de fall där CC0 specificeras kommer vi att titta på möjligheten att ladda upp de specialsamlingarna på Wikidata.

Användande på Wikipedia

Vi vill undersöka och implementera möjligheter att använda bibliografiska data från Wikidata på svenskspråkiga Wikipedia. Detta skulle bli en pionjärinsats inom Wikimedias projekt, då det i skrivandets stund ej finns någon språkversion av Wikipedia där sådan funktionalitet är i vanligt bruk. På engelskspråkiga Wikipedia finns det en försöksmall under pågående utveckling, Template:Cite Q, men den är inte färdigbyggd och därmed inte godkänd för användning i Wikipediaartiklar. Mallen har kopierats till ett mindre antal språkversioner av Wikipedia, men det rör sig om experimentella insatser av enstaka användare som ej har diskuterats med relevant gemenskap. Därför har vårt arbete stor potential för att visa hur bibliografiska data från Wikidata kan användas på Wikipedia.

Detta arbete kommer huvudsakligen att bestå av två delar: dels diskussioner med svenskspråkiga Wikipedias gemenskap och dels teknisk utveckling av själva lösningen. En aktiv dialog med gemenskapen kommer att behövas för att få en inblick i deras källhanteringsrutiner respektive -problem och utifrån detta utveckla en strategi som verkligen kan gynna användarna. Verktygets form och funktionalitet kommer till stor del att bero på gemenskapens behov.

Sedan tidigare vet vi att det är en mindre andel av Wikipedias skribenter som är positivt inställda till och förmögna att implementera Wikidata i sitt redigeringsarbete. En alltför tät koppling mellan Wikipedia och Wikidata, som skulle både höja ingångströskeln för nya Wikipedianer och tvinga de mer erfarna att förändra sina rutiner, är inte önskvärd. Vi syftar därför inte till att bygga om det befintliga källhanteringssystemet utan att bygga ett tillägg som kan användas frivilligt av de användare vars arbete skulle gynnas av Wikidatas möjligheter.

Detta tillägg skulle även kunna presenteras inom den fördjupningsutbildning som kommer att arrangeras inom projektet Wikipedia i Biblioteken. Det kommer att kunna användas för att tydliggöra kopplingen mellan Wikipedia och Wikidata och ge deltagarna en djupare förståelse för Wikidata både som ett Wikimediaprojekt och som ett nav för bibliografiska data. Genom att prova på olika sätt att hantera källor i artiklarna kommer deltagarna att vidare stärka sina Wikipediafärdigheter, vilka de kommer att kunna utnyttja under kampanjen 1Lib1Ref samt under de evenemang de väljer att organisera.

Kommunikation och evenemang

Wikidata har blivit en oumbärlig del av både Wikimediaprojekten och öppna data-landskapet, både i Sverige och internationellt. Av den anledningen känns det befogat att erbjuda bibliotekspersonal en chans att skaffa sig grundläggande kunskaper och färdigheter inom Wikidata, gärna satta i ett större sammanhang av Wikimedia- och öppna data-rörelsen.

Det ter sig därför naturligt att inkludera Wikidata i det material och de aktiviteter som vi genomför inom projektet Wikimedia i Biblioteken. Wikidatakompetens kommer att bli ett mycket aktuellt tillägg i verktygslådan för de bibliotekarier som vill få en djupare förståelse av hur kunskap sprids på nätet (det sker inom ramen för den fördjupningsutbildning som kommer att erbjudas de mest intresserade). Det kommer även att öppna en dörr mot en långsiktig engagemang i öppna data-rörelsen.

För att öka medvetenheten om det arbete som skett både bland bibliotekspersonal, MIK-specialister, Wikimediagemenskapen samt för den breda allmänheten kommer vi att genomföra ett aktivt kommunikationsarbete inom ramen för projektet. Detta innefattar bl.a. presentationer och liknande på olika evenemang, workshops och träningstillfällen för volontärer om hur de kan bidra till Wikidata och den biblioteksdata som finns där, kommunikationsinsatser via sociala medier och webbplatser, m.m. Vi kommer att vända oss till såväl svenskspråkig som internationell publik. Vi kommer även att bjuda in bibliotekspersonal från Kungliga biblioteket till konferensen Wikimania 2019 som anordnas i Stockholm 14-18 augusti 2019.

För att ge personal på Kungliga biblioteket kunskap om Wikidata och om vårt arbete kommer vi att anordna minst ett utbildningstillfälle.

Framåtsyftande arbete

Vi kommer att under projektet titta på vad som skulle kunna genomföras i ett eventuellt fortsättningsprojekt. Ett par saker har redan identifierats vilket vi kommer att undersöka ytterligare.

  • Vi kommer att börja titta på hur vi kan hänvisa till bibliotek där källmaterialet kan nyttjas. Implementation av ett sådant verktyg räknar vi kommer att ske under ett senare projekt.
  • Ett möjligt verktyg för att, baserat på behovet hos Wikipediagemenskapen, ge guidning till Kungliga biblioteket i vilken ordning verk bör digitaliseras kommer att undersökas. Det vill säga vilka källor som efterfrågas av gemenskapen.
  • Möjligheten att skapa ett flöde för hur digitaliserade verk kan inkluderas i Wikimedia Commons och Wikisource för att enklare tillgängliggöras i källorna kommer att undersökas.

Budget

  • Arbetstid för projektledning: 75 000 SEK
  • Arbetstid för utveckling: 200 000 SEK
  • Arbetstid för kommunikation och evenemangsorganisering: 30 000 SEK
  • Overhead: 50 000 SEK
  • Lokal: 50 000 SEK
  • Resor: 40 000 SEK
  • Evenemangskostnader: 25 000 SEK
  • TOTALT: 470 000 SEK, varav 70 000 SEK i egenfinansiering

Uppskattningsvis 30-40% av arbetet kommer att ske under 2019 och resten under 2020. Detta på grund av andra åtaganden samt för att kunna dra nytta av att Kungliga bibliotekets arbete med Libris XL har nått längre. Viss del av det arbete vi planerade runt utbildningsmaterial runt Wikidata kommer att kunna genomföras inom ramen för projektet Wikipedia i Biblioteken som vi fått finansiering för från Kungliga biblioteket.