Originalversionen av denna rapport hittas här. Mötesanteckningarna finns här.

Mötet ägde rum den 17 juli och var sammankallat under rubriken “A Wikimania meetup for discussing Wiktionary-Wikidata/Wikibase and it's place in the LOD world”.

Deltagarlista

  • André Costa (WMSE)Wikimania
  • Jan Ainali (WMSE)
  • Axel Pettersson (WMSE)
  • James Forrester (WMF)
  • Daniel Kinzler (WMDE/Wikidata)
  • Lydia Pintscher (WMDE/Wikidata)
  • Marius Hoch (WMDE/Wikidata)
  • Katie Filbert (WMDE/Wikidata)
  • Jan Zerebecki (WMDE/Wikidata)
  • Luca Martineli

Intresserade som inte kunde delta:

  • Denny Vrandečić (Google / fd. Wikidata)
  • Daniel Mietchen
  • Ilario

Fackverk 3.0

Mötet inleddes med en presentation av TNC samt projektet Fackverk 3.0. Här gav vi bakgrunden till varför mötet kallats samt våra inledande tankar kring möjliga kopplingar mot Wikimedia-världen.

Plattformen

Den första diskussionspunkten gällde möjligheten att använda Wikidatas plattform, Wikibase, för Fackverket[1]. Detta var speciellt intressant mot bakgrunden av att Wikidata kommer att byggas ut[2] för att kunna hantera all information i Wiktionary (den fria Ordboken).

Vi kom här fram till att Fackverket ligger betydligt närmare Wikidata (som är en semantisk begreppsdatabas) än WikitionaryData[3]. Således är vi inte beroende av den mjukvaruutveckling som kommer att ske för att kunna stödja Wiktionary (del två av mötet). De delar av mjukvaran som vi skulle behöva är således i praktiken till stor del färdigutvecklade.

Kopplingar Fackverket-Wikidata-WikitionaryData

Vi diskuterade även de framtida kopplingar som kan göras mellan Fackverket och Wikidata/WikitionaryData för att stärka båda projekten samt knyta de båda än starkare till den länkade öppna data världen. De förslag som lyftes var:

  • Att använda Wikidataobjekten som externa referenser för begreppen i Fackverket (där det är möjligt). Detta skulle i sin tur göra det enklare att hitta definitioner, mm. i Fackverket utifrån andra språk då Wikidata redan i dagsläget ofta förekommer som extern referens.
  • Att länka från Wikidatas objekt till existerande definitioner i Fackverket för de fall som Fackverket kan agera/anses som en auktoritetsdatabas i ämnet.
  • Att länka från WiktionaryDatas termer till existerande definitioner i Fackverket för att på så sätt tydliggöra de domänspecifika användningarna av en term.

Under dessa diskussioner framkom det tydligt att den här typen av korskopplingar mellan projekt var önskvärda. Det fanns också en positiv syn på det projekt vi bedrev och att vi aktivt förde öppna samverkansdiskussioner.

Övrigt

En reflektion från erfarenheter i myndighetsarbete i Storbritannien (James Forrester) där ett försök att semantiskt länka rapporter till definitioner och metodik. Detta stötte snabbt på problemet i det att rapporter förlitar sig på många andra dataset och rapporter, var med andra definitioner som i sin tur… osv. Det blev därför väldigt snabbt en omöjlighet att helt få spårbara definitioner/metodiker.

Wiktionarys framtid

På mötet diskuterades även Wiktionarys framtid. Detta är relevant då den tekniska lösningen inte är klar än och det är oklart vad som skulle kunna gå att återanvända rent programvarumässigt, men också för att det fortfarande finns möjligheter att påverka projektet i de delar där det kan finnas win-win situationer.

Bakgrund

Idag är Wiktionary bestående av ostrukturerad information. Det vill säga att sidorna har ett gemensamt utseende vilket bygger på en mallstruktur, men dessa är inte maskinläsbara och det finns många undantagsfall vilket gör det svårt att maskinellt tolka sidor. De olika språkversionerna använder sig inte av exakt samma mallar vilket gör att man måste beakta alla lokala avvikelser. Sedan en längre tid har tankar funnits om hur Wikidata skulle kunna nyttjas till att strukturera denna data.

Strategier

Mötet tog vid dessa tidigare förslag och diskuterade möjliga alternativa strategier för att kunna göra detta till verklighet. Flera kritiska val identifierades och en handlingsplan med åtgärdspunkter upprättades. Överslagsmässigt beräknades den tekniska utvecklingen ta 5 manår (och kanske 1 M€ och ett kalenderår.) Det var däremot klart att det inte är den största utmaningen utan det finns både licensmässiga och communitymässiga delar med ordentliga klurigheter som kommer att behöva behandlas.

Slutsatser

Reflektion

Vi upptäckte tyvärr att det var väldigt få deltagare från Wiktionary på Wikimania i år. Dessa var betydligt färre än under tidigare år och det finns ingen uppenbar anledning till varför så var fallet även om en möjlighet är den geografisk placeringen för årets konferens. Däremot var det väldigt många deltagare från Wikidata-projektet, och många sessioner som berörde det. Hela gruppen av kärnutvecklare från Tyskland var på plats och många av de mest kunniga och aktiva användarna. Eftersom slutsatsen dock var att Wikidata (i dagens form) ligger närmare Fackverket i sin struktur än det framtida WiktionaryData minskades behovet av att ha Wiktionary representanter på plats.

Vi upplevde det som givande att få ett möte med planeringsgruppen på Wikidata som är väldigt insatta i semantiska strukturer samt den problematik som finns. De var även väl insatta i skillnaderna mellan terminologier och ordlistor samt de olika tillvägagångssätt som de båda kräver.

Avsnittet om Wiktionarys framtid var oerhört givande och har säkert sparat in mycket tid för den framtida utvecklingen tack vare att flera av nyckelpersonerna som inte finns på samma kontinent till vardags kunde träffas och diskutera i en kreativ miljö. Att handlingsplanen togs fram gör att arbetet kan startas omgående, tidigare har det varit oklart om vad som behövde göras och i vilken ordning varför alla har avvaktat. Detta är positivt för Fackverk steg 2 och 3 då en påbörjad aktivitet här kommer att leda till ökad uppmärksamhet i området i allmänhet och att flera delproblem kommer att belysas både tekniskt, juridiskt och organisatoriskt och kanske få möjliga lösningar vilka även skulle kunna vara tillämpbara i semantiska projekt av andra slag.

Rekommendationer

Även om programvaran Wikibase fyller syftet för Fackverket kunde teamet bakom detta inte i rekommendera det för oss, i sitt nuvarande skick.

Wikidata-teamet rekommenderade att vi tittade på Lemon[4] som var den modell de kom fram till bäst passade för semantiska beskrivningar av lexikal information.

Oavsett vilken plattformslösning vi väljer för Fackverket bör vi definitivt söka olika möjligheter att koppla ihop detta med Wikidata och den övriga LOD-världen för att därigenom maximera den nytta och det genomslag Fackverket kan få.

Avslutande

Mötet resulterade i bättre personliga kontakter med kärngruppen bakom Wikidata samt var en möjlighet att få tydliga svar på svårformulerade frågor som utan ett fysiskt möte skulle resulterat i förlorad tid genom missförstånd samt energi på felaktiga (ej genomtänkta) spår. Det var även en möjlighet att profilera projektet för en internationell publik.

Fotnoter

  1. Vi antar här att semantiska terminologier bor i lösningen "Fackverket"
  2. D:Wikidata:Wiktionary/Development/Proposals/2015-05
  3. Det finns inget antaget namn för den del av Wikidata som kommer att innehålla Wiktionary, vi kallar det för WiktionaryData i detta dokument.
  4. http://www.lemon-model.net/