Slutrapport för Samarbetsprojekt mellan Nationalmuseum och Wikimedia Sverige.

2016-03-01

Genomförda aktiviteter

Koppling mellan Wikidata och Nationalmuseums dataset på KulturNav

Kopplingar gjordes mellan Nationalmuseums dataset över konstnärer på KulturNav och Wikidata. Mappningen har gjorts genom att datasetet importerats till Mix'n'Match-verktyget, genom vilket flera kopplingar kan komma att skapas även fortsättningsvis. I skrivande stund finns har ca 3 300 konstnärer kopplats samman mellan dataseten. Verktyg tillåter även att matchningarna exporteras vilket i sin tur kan utgöra en grund för att importera länkar mot Wikidata till KulturNav.

Källbeläggningar av faktauppgifter för konstnärer utifrån Nationalmuseums dataset
  • Utifrån den data som gjorts tillgänglig av Nationalmuseum på KulturNav har Wikidata-beskrivningarna av konstnärerna dels berikats med nya påståenden och dels fått existerande påståenden källbelagda.
Kopplingar mellan Wikidata och Nationalmuseums samlingar på collection.nationalmuseum.se

Två nya egenskaper har satts upp för att koppla konstnärer och konstverk direkt mot deras id/sidor på collection.nationalmuseum.se. Detta möjliggör dels en djupare koppling gentemot Nationalmuseums samlingar samt underlättar kopplingen mellan konstverk och konstnärer. Samtliga kopplade konstnärer samt tidigare kopplade konstverk har berikats med dessa egenskaper och merparten av kopplingarna mellan konstnärer och konstverk har skapats.

Övrigt
  • En lista över kvinnliga konstnärer som återfinns både på Wikidata och i Nationalmuseums samlingar har skapats. Denna lista uppdateras automatiskt utifrån existerande information på Wikidata och är tänkt att användas som ett enkelt sätt att identifiera vilka av de kvinnliga konstnärerna som saknar artiklar på svenskspråkiga Wikipedia.
  • Den mjukvara som byggts är tillgänglig på GitHub under en fri licens.
  • Ett pressmeddelande och ett blogginlägg har förberetts.

Ekonomi

66,25 upparbetade arbetstimmar[1] varav ca 60,61 arbetstimmar (20.000 kr) har täckning från Nationalmuseum.

Det fortsatta arbetet

  • Det återstår fortfarande ca 4 000 poster som behöver matchas mellan Wikidata och Nationalmuseum. Utav dessa har drygt 1 000 redan matchats av en dator men behöver manuell verifiering. Vem som helst, med ett Wikimedia-konto, kan använda verktyget.
  • För de konstnärer som ej går att matcha kan det vara aktuellt att skapa nya Wikidata-objekt. Även detta går att göras utifrån ovanstående verktyg.
  • Under matchningsprocessen har dubbletter upptäckts i Nationalmuseums samlingar. En rutin för att rapportera och åtgärda dessa bör skapas för att maximera den nytta som kan fås ur projektet.
  • I samband med nästa release av KulturNav (dvs. 1.4) bör det undersökas om import av födelse/dödsår kan aktiveras igen (det finns en bugg relaterat till okända/osäkra årtal).
  • Stöd bör byggas ut för att kunna importera mer komplexa konstnärskopplingar (typ förfalskning av X efter Y) från Nationalmuseums databasdump till Wikidata.
  • En rutin behöver plockas fram för hur kopplingarna bör importeras för att kunna länka från KulturNav till Wikidata. Det går att ladda ner alla matchningar, men snarare än massimport fungerar detta troligen bättre som förslagsunderlag för manuell verifiering.

Mätetal

Primära mätetal

  • ​3 407 KulturNav-kopplingar[2]
  • ​8 503 collection.nationalmuseum.se kopplingar[3]
    • P2538 (Nationalmuseum konstnärs ID ): används ​3 836 gånger[4]
    • P2539 (Nationalmuseum konstverks ID): används ​4 667 gånger[5]
  • Totalt 19 468 källhänvisningar till Nationalmuseums dataset på KulturNav[6]

Interna mätetal

  • Antal bytes (absolut):
    • på Wikidata (inom projektets tidsspann): 34,3 MB [7]
  • Antal involverade:
    • I Wikidata- och metadatadiskussionerna: 5 (1♀, 2♂, 2?)
    • I Mix'n'Match kopplingar: 16 (2♀, 6♂, 8?)[8] alla var aktiva före projektets start[9]. 2♂ överlappar med föregående.
  • Antal artiklar förbättrade:
    • på Wikidata: ​7 873[10]

Global Metrics

Global metrics
Calculating global metrics
PARTICIPATION (COMMUNITY)
? =
1. Number of active editors involved 2 6 0 8 16
2. Number of newly registered users 0 0 0 0 0
3. Number of individuals involved 3 6 0 10 19
CONTENT (Rapportverktyg)
4 a. Number of new images/media added to Wikimedia article pages 0
4 b. Number of uploaded media files 0
5. Number of articles added or improved on Wikimedia projects 7873
6. Number of bytes added to and/or deleted from Wikimedia projects (absolute value) ​35993183
LEARNING QUESTION
7. Learning question: Did your work increase the motivation of contributors, and how do you know?

Källor/länkar

  1. Wikimedia Sveriges budget (OBS! stort dokument)
  2. WDQ
  3. WDQ
  4. WDQ
  5. WDQ
  6. Query (tryck Execute)
  7. Kör AndreCostaWMSE-bot för datumspannen i Metrics-verktyget och sparat output som "metrics_result_Wikidata.json" i Dropbox.
  8. Mix'n'Match dataset 165 + 168.
  9. Kör användarna i Metrics-verktyget (Rolling active) för datumet 2016-01-15 och sparat output som "metrics_result_Wikidata_2.json" i Dropbox.
  10. Modifiera denna Quarry till att löpa över det aktuella datumspannet.