Projekt:Wikidata 2014/Ansökan till Vinnova om DCAT-AP

Ansökan har beviljats.
Ansökan
Organisation: Vinnova
Sista ansökningsdatum: 2014-09-09
Max bidrag: 110 000
Bedömd chans: Hög
Väntevärde:
Värde för WMSE (1-5): 4 (högt)
Beslutsdatum: 2014-09-30
Uppföljning inför inskick:

Projektbeskrivningen ska vara på max motsvarande 5 A4-sidor med 12 punkters text. Den ska skrivas på svenska och omfatta följande:

Projekttitel på svenska och engelska

DCAT-AP för Wikibase och Wikidata / DCAT-AP for Wikibase and Wikidata

Sammanfattning

Wikidata, den öppna länkade datakällan i Wikimediafamiljen, saknar idag beskrivning i DCAT-AP. Detta projekt syftar till att åtgärda det. Wikimedia Sverige kommer att arbeta tillsammans med Wikimedia Deutschland samt Wikidatas många volontärer för att implementera det hela. Hela processen kommer dessutom att generaliseras så att den kan upprepas på alla webbplatser som använder sig av Wikibase, programtillägget som driver Wikidata. När förändringen är genomförd kommer Wikimedia Sverige att kommunicera denna positiva förändring till öppna data-gemenskapen i Sverige.

Sammanfattning på engelska

Wikidata, the linked open data source in the Wikimedia family, does not have a DCAT-AP description. This projects aim to correct that. Wikimedia Sverige will work, together with Wikimedia Deutschland and the many volunteers on Wikidata to implement this. The entire process will be generalized in a way that it kan be repeated for any website that runs Wikibase, the software extension that runs Wikidata. When the change is done Wikimedia Sverige will communicate this positive change to the open data community in Sweden.

Projektets syfte kopplat till utlysningens syfte

Projektet syftar till att göra Wikidata möjligt att beskriva med DCAT-AP på ett standardiserat sätt så att det blir lättare att få metadata om projektet and to make it repeatable.

Projektets mål kopplat till utlysningens syfte

Målen med projektet är att:

  1. Skapa själva DCAT-AP beskrivningen
  2. Implementera DCAT-AP i Wikidata
  3. Generalisera processen för Wikibase
  4. Kommunicera ut om denna förändring

Potential och nytta

 
Antalet dataobjekt över tid.

Wikidata är ett projekt som vår systerförening Wikimedia Deutschland initierade den 30 oktober 2012 med målet att skapa en wiki för gemensam strukturerad och flerspråkig lagring av data. Utvecklingsarbetet har gått mycket bra och Wikidata är nu en mycket snabbt växande datakälla och kommer snart att börja användas på Wikipedia, vilket i sig kommer att öka bidragandet till den. Wikidata kan läsas, redigeras, återanvändas och tolkas av såväl människor som datorprogram.

 
Strukturen för ett påstående på ett objekt.

Då Wikidata är helt öppen, med ett tillgängligt API och fritt licensierad under CC 0 har det potentialen att bli en av de mest använda centrala datakällorna på hela nätet. Wikidata inkluderar mängder av officiella data och runt 5 000 aktiva användare berikar kontinuerligt projektet med data (juni 2014). Under juni gjordes även miljontals redigeringar automatiserat med script. Det finns över 15 miljoner dataobjekt som kan beskrivas med över 1 000 olika egenskaper. Det pågår projekt för att ytterligare göra det lättare att snabbt addera och kontrollera data. Projektet gör också ansträngningen att lägga till källor för värdena, vilket gör det möjligt för den som använder data att själv dra slutsatser. Ett objekt i Wikidata är alltså mer avancerat än vanliga "tripples" i länkade data och kan till och med innehålla kvalificerare för ett påstående.

Med sin koppling till Wikipedia, som dessutom kommer att ökas med tiden, är potentialen för Wikidata otroligt stor. Wikidata är flerspråkigt och finns även tillgängligt på svenska. I dagsläget finns över hundratusen poster inlagda med anknytning till Sverige, många av dessa redan med semantisk länkning till andra poster.

Brittiska centralbyrån arbetar med ett projekt för att massimportera sin data in i Wikidata vilket förmodligen bara är början av hur olika organisationer kommer att ta till vara på potentialen med Wikidata. Att övertyga fler dataägare att inkludera sin data på Wikidata skulle vara enklare om vi kunde peka på att Wikidata beskrivs med denna standard. Tyvärr finns dock inte DCAT-AP i det ordinarie utvecklingsteamets (i Tyskland) roadmap och Wikimedia Sverige ser här en möjlighet att bidra med en del av utvecklingsarbetet.

Wikidata körs på programtillägget Wikibase, som är open source och kan användas av andra webbplatser. Under 2015 kommer Wikimedia Commons, mediadatabasen med över 22 miljoner fritt licensierade filer att få sitt data strukturerat med hjälp av Wikibase. Genom att i detta projekt generalisera och noggrant dokumentera processen för att lägga till DCAT-AP kommer det att göras mycket enklare att snabbt få Wikimedia Commons att också kunna följa DCAT-AP så fort den webbplatsen har fått sitt data strukturerat. Detta kommer också till nytta för alla framtida användare av Wikibase, exempelvis har Europeana experimenterat med plattformen.

När Wikidata är beskrivet i DCAT-AP vill vi sprida kunskap om detta i den svenska öppna data-gemenskapen så att Wikidata kan användas som exempel i deras arbete.

Genomförande. Projektplan inklusive tids- och aktivitetsplan, resurser, budget mm samt plan för nyttiggörande av resultatet

Arbetet kommer att dels skapa själva DCAT-AP beskrivningen och dels interagera med utvecklingsteamet i Tyskland för att implementera denna. Då det är ett distanssamarbete och teamet har annan utveckling framför sig också kommer arbetet att bedrivas med ett relativt lågt tempo så att mailkonversationer och lokala konversationer kan hållas i synk. För att implementera något på Wikimedia Foundations driftservrar krävs också en omfattande kodgranskning vilken beräknas att ta en ansenlig tid. Under hela utvecklingen kommer alla nödvändiga steg att dokumenteras på ett generaliserat sätt så att det är enkelt att upprepa detta på andra Wikibase-installationer.

Efter att vi implementerat det hela kommer vi att kommunicera ut förändringen till den svenska och internationella öppna data-gemenskapen. Detta kommer främst att ske genom sociala medier och blogginlägg.

Tidsplan

  • Januari: Projektstart och kravspecifikation
  • Februari: Utveckling
  • April: Kodgranskning och implementation
  • Maj: Kommunikation om projektresultatet
  • Kontinuerligt: Dokumentation

Budget

Löner: 125 000 kr
Tjänster: 0 kr
Utrustning: 0 kr
Material: 0 kr
Immaterielrätt: 0 kr
Indirekta kostnader: 0 kr
Resor: 0 kr
Övrigt: 1 000 kr
Totalt sökt: 110 000 kr
Egen insats: 16 000 kr
Totalt: 126 000 kr

Upphovsrätt

All dokumentation kommer att produceras under Creative Commons BY-SA 3.0.

Uppföljning och kvalitetsarbete

Förvaltningsansvaret kommer att överlämnas till Wikimedia Deutschland efter att utvecklingen genomförts.

Aktörskonstellation inklusive roller och arbetssätt

Wikimedia Sverige driver projektet. Wikimedia Deutschland är produktägare av Wikidata och överser den tekniska implementeringen.

Organisationsnummer och arbetsställe för de olika parterna i projektet

802437-8310 Stockholm