Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Ansökan

Ansökan har beviljats.


Detta är den reviderade ansökan som skickades in till KB den 22 mars 2018.

PDF-versionen av ansökan.

Nyttan

Bibliotekens samlingar digitaliseras i allt högre grad. Detta innefattar både arbete med metadata, inskanning av böcker och annat material samt projekt för att göra detta sökbart och lättillgängligt.

Möjligheterna med länkade öppna data (LOD), då olika datakällor kopplas samman, är många. Sökningar som tidigare inte varit möjliga är plötsligt en knapptryckning bort. De senaste åren har utvecklingen av Libris skapat nya möjligheter runt informationssökning och Libris XL tar detta vidare. Centralt är att materialet får ökad synlighet och kan återanvändas mer.

Som en del av öppna data-(r)evolutionen har Wikidata kommit att ta en central plats. Det är inte bara en plats att lagra data, utan har blivit en central hubb där olika datakällor kopplas samman. Wikidata har utvecklats till att bli en del av internets infrastruktur och underhålls av tusentals frivilliga från hela världen på över 300 olika språk. Materialet som finns där återanvänds på oräkneliga tjänster, allt från Googles Knowledge Graph till tjänster såsom inventaire.io.

Wikidata lagrar redan idag stora mängder bibliografisk information. Wikidata har potentialen att göra det enklare än någonsin att källbelägga den information som finns på Wikipedia och i andra tjänster. Luckorna i den information som finns är dessvärre ännu stor. Att enkelt kunna källbelägga information är ett viktigt redskap i ett digitalt och snabbt föränderligt medielandskap där även falska nyheter och ryktesspridning sker otroligt snabbt och når en stor publik. Genom att inkludera olika strategiskt utvalda dataset från biblioteksvärlden ökar möjligheten för allmänheten att enkelt källbelägga och kontrollera uppgifter. Inkludering av bibliotekens information och sammankoppling av data är därmed en strategisk möjlighet. Informationen skulle genom inkluderingen på Wikimediaplattformarna även knytas till liknande dataset och samlingar i andra länder. Genom inkluderingen av dessa dataset ges biblioteken och dess samlingar ökad sökbarhet, synlighet och kontext.

Parallellt med att arbeta med metadata om de verk som biblioteken har, digitaliserar biblioteken allt mer av sina samlingar. Även om det är en central fråga av strategisk betydelse kräver det stora resurser att bygga upp en egen teknisk lösning för att kunna hitta den digitaliserade informationen och säkerställa att den kommer till användning. En egen lösning konkurrerar dessutom med redan existerande och etablerade produkter som det ofta har investerats miljarder i för att komma dit de är. En annan väg kan vara att istället arbeta för att inkludera materialet på plattformar där allmänheten redan är aktiva och befinner sig, såsom Wikipedia. De digitaliserade filerna kan sedan tillgängliggöras via mediedatabasen Wikimedia Commons samt Wikisource där frivilliga, arkivarier och bibliotekarier samverkar för att göra böcker, tidningar och arkivdokument läsbara, sökbara, enkelt citerbara och länkade. Det är ett resurssparande och effektivt sätt att nå ut.

Detta erbjuder en väg tillbaka till bibliotekens samlingar då varje informationssida för en mediefil kan förses med en länk tillbaka till bibliotekens information om samma bok/dokument. Erfarenheterna från att arbeta med museisektorn är att den trafik deras webbplatser får från Wikipedia är oerhört högkvalitativ; användarna stannar länge, söker runt och återkommer.

Effektmål

Detta projekt är designat för att uppnå följande effektmål:

  • Öka användningen av svensk biblioteksrelaterad-data.
  • En grund finns för inkludering av verksdata inför att denna skapas i Libris XL.
  • Sporra bibliotekens tekniska personal som jobbar med LOD m.m. genom att ge konkreta exempel på det värde deras arbete skapar samt tillsammans identifiera framtida utvecklingsmöjligheter för fri kunskap.
  • Visa på bibliotekens värdet för allmänheten genom att tydliggöra insatserna och det värdefulla material de förvaltar.
  • Öka kunskapen om hur Wikimediaprojekten kan användas av biblioteken för att prioritera sin digitalisering.

Genomförande

Vi vill genomföra ett större strategiskt projekt för att inkludera bibliotekens digitala information på Wikimedias plattformar. Projektstart är 2018-05-01 och projektet pågår till 2019-04-30.

Under projektet kommer vi att arbeta med att inkludera den auktoritetsdata som finns på Libris på Wikidata. Inkluderingen av data bedömer vi bör ske i flera omgångar med utvärdering och insamlande av feedback däremellan. Vi planerar att börja med de författare vars verk används som källor på Wikipedia då vi vet att dessa är av intresse för volontärgemenskapen. Utöver detta vill vi lägga en grund för inkludering av verksdata, inför att denna inkluderas i Libris XL. Dessa är de huvudsakliga målen i detta avgränsade projekt. Denna erfarenhet kommer att lägga en god grund för fortsatt inkludering av återstående data. Därtill kommer vi att arbeta med uppbyggnaden av verktyg som gör det möjligt att hålla informationen på Wikidata uppdaterad med de ändringar som fortlöpande sker på Libris. Om utrymme finns vill vi även undersöka möjligheterna att inkludera utvalda delar av andra KB-dataset på Wikidata, exempelvis Biblioteksdatabasen, där dessa bedöms som lämpliga av båda parter.

Vi ser ett stort behov av att koordinera arbetet runt inkludering av biblioteksrelaterad data med den internationella Wikimediagemenskapen då detta projekt får en stor påverkan på Wikimediaprojekten. Deltagandet och diskussionerna syftar till att finna lösningar för att inkludera biblioteksrelaterad data på Wikimedias olika plattformar. Exempelvis genom att tillsammans med Wikidatagemenskapen definiera vilka författare och verk, och vilken information om dessa som automatiskt är kvalificerade för inkludering på Wikidata. Därtill undersöka vilken ytterligare information som kan vara till nytta för framtida inkludering på exempelvis Wikipedia, Wikimedia Commons och Wikisource. För att koordinera detta kommer vi att delta på ett antal internationella konferenser såväl som att aktivt arbeta online. Vi kommer att utveckla stödsidor och material runt inkludering av biblioteksdata och om hur massuppladdningarna går till. Det är även viktigt att ha en god kommunikation med Libris XL-teamet i samband med att strukturer läggs till i det nya systemet för att se vilka möjligheter denna data öppnar upp för.

Vi vill relativt snart efter projektstart genomföra ett par event (hackathons) tillsammans med utvecklare från biblioteken för att lära av och inspirera varandra. Vi kommer därefter att aktivt kommunicera med de intresserade deltagarna om hur projektet fortgår. En föreslagen inriktning på dessa evenemang är att utveckla koncept för verktyg för att visualisera och nyttja datamängderna. Det kan handla om allt från att visa vilka bibliotek som har ett verk som ännu inte har digitaliserats (så att den intresserade kan besöka biblioteket och läsa där), visualisering av statistik, till hur olika datamängder hänger ihop. En annan identifierad möjlighet är verktyg som kan understödja den strategiska digitaliseringen, exempelvis kan ett enkelt koncept tas fram för hur en monitorsida för att få fram vilka verk som används mest som källor på Wikipedia kan utformas. Detta för att ge biblioteken ytterligare en signal om vad som är mest värdefullt att digitalisera. I förlängningen skulle ett sådant initiativ med fördel komma att innefatta ett fokuserat arbete inriktat på hur inskannat material kan inkluderas på ett användarvänligt sätt.

Vi kommer under hela projektet även att aktivt arbeta med utåtriktad kommunikation för att göra allmänheten medveten om bl.a. integrationen av Libris-data och vilka möjligheter som skapas. Kommunikation kommer utöver information på wikis att ske via sociala medier, via den nya webbplats vi planerar samt via pressreleaser och blogginlägg.

Att ha i åtanke under genomförandet av projektet

Utöver det som sker inom ramen för detta projekt kommer vi, om vi får finansiering genom en projektansökan vi skickat in till Postkodstiftelsen, att inom ramen för det projektet att använda den inkluderade Biblioteksdatabasen som en fallstudie och en pilot inför våra diskussioner med IFLA om inkludering om biblioteksdata från andra länder. Detta om Kungliga biblioteket är intresserade av att arbeta med oss runt detta. Denna finansiering är inte säkerställd men även utan den är vi intresserade av att experimentera med att inkludera information om biblioteken.

För att hantera stora mängder nytt digitaliserat material från biblioteken krävs utveckling och förbättring av verktyg och de aktuella plattformarna. Detta är ett möjligt framtida projekt som vi kommer att ha i beaktande vid genomförandet av detta projekt.

Dessa insatser kan med fördel senare kombineras med utåtriktade projekt som syftar till att engagera bibliotekarier, studenter samt allmänhet att lägga till källorna i olika artiklar, ge dem en ökad media- och informationskompetens och säkerställa att fler källor görs tillgängliga under fria licenser.

Kostnad

  • Projektledning: 100 000 SEK
  • Utveckling: 300 000 SEK
  • Kommunikation och evenemangsorganisering: 50 000 SEK
  • OH: 30 000 SEK
  • Lokal: 60 000 SEK
  • Resor: 50 000 SEK
  • Evenemangskostnader: 10 000 SEK