Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Källor på Wikipedia

Källor på svenskspråkiga Wikipedia

Inom projektet Strategisk inkludering av biblioteksdata på Wikidata har vi undersökt hur olika sorters källor används på svenskspråkiga Wikipedia. Målet var att identifiera de vanligaste källorna som underlag till en diskussion om hur samarbetet med Kungliga Biblioteket skulle kunna hjälpa wikipedianerna i deras arbete. För att få en nyanserad insikt i den stora variation av såväl källtyper som sätt att använda dem (källmallar, speciella mallar) har vi anförskaffat samt undersökt flera olika dataset.

Datorkoden som har använts för analysen finns tillgänlig som öppen källkod.

Böcker med ISBN

Material

En databasdump från 2018-03-01 som innehåller alla ISBN-försedda referenser på svenskspråkiga Wikipedia: https://figshare.com/articles/Wikipedia_Scholarly_Article_Citations/1299540

Metod

En frekvenslista över ISBN-numren skapades. Därefter gjordes ett försök att hämta verkens bibliografiska uppgifter från Libris medelst dess API.

Resultat

Listan domineras av uppslagsverk om djur och växter som används i botskapade artiklar. Då dessa utgör en stor andel av artiklarna är det inte konstigt. Trots detta finns det många andra verk i top 50 som har använts av mänskliga skribenter – vi kan se att Wikipedianerna hyser ett stort intresse för Sveriges kyrkobyggnader, konstnärer, hundraser, opera och Andra Världskriget.

Alla fotnoter – böcker

Material

Alla förekomster av ref-taggar i artikelnamnrymden, harvestade 2018-08-01.

Metod

Alla förekomster av mallen {{Bokref}} i artikelnamnrymden.

Resultat

Den här frekvenslistan omfattar alla böcker som citerats med hjälp av mallen {{Bokref}}, oavsett om de har ett ISBN-nummer eller inte. Eftersom ISBN började användas på 1970-talet täcker detta urval även äldre böcker och är en intressant komplement till den tidigarenämnda undersökningen. Här kan vi se bland annat samtida biografiska källor som Sveriges befolkning och Sveriges dödbok; demografiska källor med uppgifter om Sveriges befolkning och flera band av Svensk uppslagsbok.

Alla fotnoter – webbplatser

Material

Alla förekomster av ref-taggar i artikelnamnrymden, harvestade 2018-08-01.

Metod

Alla URL:er i dumpen extraherades och normaliserades till domännamnen, varpå en frekvenslista över dessa skapades.

Resultat

Även här kan vi se dominansen av botskapade artiklar som har källbelagts med webbplatser som NASA Earth Observation (geografiska platser världen över), World Plants (växter) och Catalogue of Life (djur- och växtarter). Högt i toppen hamnar också Internet Archive, ett digitalt arkiv över webbsidor som hjälper oss skydda uppslagsverket mot länkröta. Svenskspråkiga Wikipedia innehåller inte mindre än drygt 100 000 länkar till arkiverade webbsidor. Andra adresser som utmärker sig på listan och som kan tänkas ha använts mest av mänskliga skribenter är svenskspråkiga tidningar och nyhetstjänster – Dagens Nyheter, Svenska Dagbladet, Sveriges Radio, Aftonbladet och Sveriges Television – samt det "konkurrerande" uppslagsverket Nationalencyklopedin.

Runeberg.org

Material

Alla förekomster av mallen {{runeberg.org}} i artikelnamnrymden – både i fotnoter och som vanlig text.

Metod

En frekvenslista över mallens parametrar skapades. Notera att själva mallen inte innehåller någon information om bokens titel/författare – hur dessa visas för läsaren styrs av mallkoden.

Resultat

Den allra vanligaste Runebergskällan är utan tvekan Nordisk Familjebok, särskilt dess andra upplaga (Uggleupplagan) som publicerades mellan 1904 och 1926. Dess 38 volymer dominerar fullständigt listan. Det kommer inte som någon överraskning då det finns Kategori:Ugglan många artiklar på svenskspråkiga Wikipedia som baseras på detta uppslagsverk.

Bland andra vanliga källor kan vi hitta olika upplagor av det biografiska uppslagsverket Vem är det som i decennier gett oss information om kända svenskar, samt generalregistret till Svenskt Porträttgalleri, som även det innehåller biografiska uppgifter. Det enda icke-biografiska verket i top 50 är Bilder ur Nordens Flora som innehåller beskrivningar av drygt 650 växter.