Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Hackathon/Bakgrund

Vad är Wikidata?

Wikidata är en fri och öppen kunskapsdatabas, och ett av Wikipedias systerprojekt. Precis som Wikipedia kan Wikidata redigeras av vem som helst, och det är volontärgemenskapen som bestämmer vilka regler som gäller. I motsats till Wikipedia bygger Wikidata på strukturerade data, alltså objekt istället för fritext. Tack vare detta kan innehållet användas av såväl människor som datorer.

Är du nybörjare på Wikidata så kan du ha nytta av denna introduktion som tar upp de viktigaste begreppen. Du behöver inte kunna allt – det är i och för sig omöjligt då det pågår en ständig utveckling av såväl mjukvaran som de ämnesspecifika riktlinjerna.

En längre och mer detaljerad introduktion, som riktar sig specifikt åt bibliotekarier, kan du avnjuta i denna inspelade entimmeslånga föreläsning från OCLC Research.

Du kommer säkert att lägga märke till att den grundläggande strukturen är väldigt enkel. I motsats till t.ex. en bibliotekskatalog måste Wikidata kunna ta emot många olika sorters entiteter – t.ex. personer, vetenskapliga artiklar, historiska händelser, fornminnen, sjöar, efternamn… Det betyder att det är upp till oss (gemenskapen!) att bestämma hur dessa skall modelleras och kopplas samman. Möjligheterna – och utmaningarna – är oändliga.

Bibliografiska data på Wikidata

Under 2018 har Wikimedia Sverige samarbetat med Kungliga biblioteket för att importera delar av KB's CC0-licensierade öppna data till Wikidata. Vi har nu tillsammans tagit första steget till en storskalig dataimport.

Vi berättade om projektet på Libris användardag 2018. Här kan du se slides och snart även en videoinspelning.

Vi berättade om det även på konferensen WikiCite som är tillägnad just bibliografiska data på Wikidata. Här kan du se en inspelning och här kan du ladda ner slides.

Infrastruktur

Följande Librisrelaterade properties finns på Wikidata:

  • P906 – SELIBR; för auktoriteter.
  • P1182 – Libris editions; för editions i gamla Libris.
  • P5587 – Libris URI; för auktoriteter, editions och verk i nya Libris.

Datamodell

Wikidata tvingar ej användaren att använda någon speciell datamodell för en bestämd typ enheter. Det innebär att det är upp till gemenskapen att utarbeta modeller och regler. Det betyder även att själva gränssnittet är agnostiskt och kan varken hjälpa dig att utforma dina objekt eller stoppa dig från att göra fel. Därför kommer du att stöta på objekt som inte följer de regler som utarbetats av gemenskapen.

Böcker

Just när det gäller böcker finns det en aktiv gemenskap på WikiProject Books som diskuterar datamodellen. Den accepterade datamodellen är uppbygd med FRBR i grunden och är därmed kompatibel med tvånivåstrukturen i nya Libris.

Wikidata FRBR Nya Libris Exempel
written work work verk Våra fiskar
version, edition, or translation expression instans Våra fiskar (1985)

Se WikiProject Books för detaljerad beskrivning av vilka properties respektive objekttyp kan inneha.

Just nu finns det ca. 500 objekt av typen version, edition, or translation som har ett Libris URI. Vi har importerat dessa från Libris för att ta första steget. Urvalet gjorde vi med hjälp av svenskspråkiga Wikipedia – vi undersökte vilka böcker som [[Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Källor på Wikipedia |oftast förekom i källhänvisningarna]]. Av upphovsrättsliga skäl (CC0 licens) begränsade vi urvalet till böcker som tillhör den svenska nationella bibliografin – alltså böcker publicerade i Sverige.

Många menar att Wikidata bör bli den ultimata databasen för bibliografiska data. Det finns alltså inga principiella hinder för att ladda upp hela Nationalbibliografin till Wikidata. Varje publicerad bok är relevant.

Auktoriteter

Det finns ca. 60 000 personer på Wikidata som har någon av properties SELIBR / Libris URI inlagda. Se t.ex. Q6414881. Den här siffran är alltså mycket lägre än antalet poster i Libris' auktoritetsdatabas. Anledningen är att det inte är enkelt att matcha mellan Librispost och Wikidataobjekt. Vi har till exempel valt att inte skapa nya objekt om ett existerande objekt inte kunde identifieras automatiskt.

Libris innehåller många auktoritetsposter för personer som inte haft någon Wikipediaartikel eller Wikidataobjekt sedan tidigare – som småokända författare, journalister eller forskare vars enda verk i Libris är doktorsavhandlingen. Även om dessa personer varken är relevanta för Wikipedia eller intressanta för allmänheten så är de ändå – just tack vare att de existerar i en extern databas – relevanta för Wikidata.