Skanna böcker till Wikisource

Den här steg-för-steg-instruktionen riktar sig i första hand till personer som vill lära sig använda bokskannern Fujitsu ScanSnap SV600 för att skanna källor till Wikisource. Instruktionen utgåt från programvaran i version Scansnap Home 1.0.12 (69).

På Wikisource, det fria biblioteket, tillgängliggörs äldre källor som böcker, tidningar och arkivdokument. Källorna är läsbara, sökbara och citerbara. Wikisource mål är att så korrekt som möjligt återge tryckta originaltexter.

Förberedelser

För att komma igång behöver du en bok som du vill skanna och en skanner. Du kan kontakta Wikimedia Sverige för att låna en bokskanner. Om du inte använder den bokskannern kan du skapa en pdf själv och hoppa över steget Skanna, redigera och spara som pdf.

Kontrollera att boken är fri

I Sverige gäller upphovsrätten vanligen i 70 år efter upphovspersonens död. Om det finns flera upphovspersoner till ett verk, till exempel flera författare eller en författare och en illustratör, så gäller upphovsrätten i 70 år efter att samtliga upphovspersoner har avlidit.

Kontrollera att boken inte redan är digitaliserad

Det finns ett flertal plattformar som samlar digitaliserade versioner av fria böcker. Undvik dubbelarbete och kontrollera att den bok du hittat inte redan finns uppladdad i en användbar version till:

  • Commons
  • Wikisource
  • Projekt Runeberg
  • Projekt Gutenberg
  • Google Books

Installera skannerns mjukvara

Den skanner som går att låna från Wikimedia Sverige heter Fujitsu Scansnap SV600. Mjukvaran finns för Windows och Mac. Du kan ladda ned den här. Du behöver koppla programvaran till skannerns serienummer, som du hittar på undersidan. För Windows, välj ScanSnap Installer.

Det kan hända att installationsprogrammet tvingar datorn till omstart. Se därför till att spara information i andra program som kan gå förlorad om datorn startar om.

Standardinställningarna i Scansnaps programvara skapar en tillfällig mapp för filerna. Dessa filer raderas efter ett visst antal dagar. Om du inte vill att detta ska hända, spara din pdf i en annan mapp.

Skanna, redigera och spara som pdf

Skanna alla sidor i boken

Gör så här:

  1. Koppla bokskannern till datorn.
  2. Öppna programmet Scansnap Home, högerklicka på ikonen som visar att programmet är igång, välj Scan settings och titta runt bland inställningarna. Du kan t.ex. välja att skanna i svartvitt eller färg.
  3. Tryck på Stop eller Scan för att starta skannern.
  4. Tryck på Scan för att starta programmet.
  5. Skanna alla sidor. Om du skannar ett uppslag, så skanna det två gånger för att få två sidor.
  6. Klicka Finish scanning i programmet eller Stop på skannern för att gå vidare till nästa steg.

Redigera de skannade sidorna

Gör så här:

  1. Gå igenom klippningen av varje sida och justera om det behövs.
  2. Klicka i rutan Continue with Point Retouch och klicka på Next.
  3. Klicka på Check and correct för att gå vidare till nästa steg.
  4. Se till att Correction mode är markerat och klicka på det du vill ta bort på sidan.
  5. Klicka på Apply för att korrigera det markerade området. Du kan behöva välja Correction mode igen för att kunna fortsätta redigera.

Spara som pdf

Gör så här:

  1. Spara och stäng med Save and quit. Då kommer du till ett nytt fönster där du kan välja var du ska spara filen. Välj Scan to folder och spara där du vill.

Ladda upp pdf-filen till Wikimedia Commons

Gör så här:

  1. Döp filen till samma som boktiteln, eventuellt med tillägg av t.ex. utgivningsår, till exempel: Anne på Grönkulla 1909.
  2. Ladda upp pdf:en till Wikimedia Commons.

Skapa en Index-sida på Wikisource

Gör så här:

  1. Kopiera den del av url:en som står efter File: på Wikimedia Commons, till exempel: Anne_på_Grönkulla_1909.pdf.
  2. Skapa en Index-sida på Wikisource genom att klistra in det kopierade filnamnet efter https://sv.wikisource.org/wiki/Index:
  3. Du kommer nu till en sida som säger att det inte finns någon text med den titeln på Wikisource. I alternativen som listas, välj att lägga till texten genom att redigera sidan.
  4. Du kommer nu till en sida där du kan lägga till information om boken. Fyll i den information du har och tryck på Publicera sida.

Digitalisera pdf:en på Wikisource

Aktivera finessen OCR-tolkning

Det finns finesser som gör det lättare att digitalisera boken, särskilt bra är OCR-tolkning. OCR-tolkningen gör en digital version av boksidan. OCR-tolkningen kan tolka många tecken fel, särskilt i äldre källor med svårlästa tecken, men det går ofta snabbare att rätta den ocr-tolkade texten än att skriva av hela texten själv.

Gör så här:

  1. Överst på sidan ser du Inställningar i menyn, klicka på den.
  2. Under rubriken Inställningar, i menyn ser du Finesser, klicka på den.
  3. Under rubriken Korrekturläsning finns en rad checkboxar.
  4. När du väljer Finess som i sidnamnrymden ger en extra knapp i verktygsraden som ocr-tolkar sidan i djvu- och pdf-filer får du en OCR-funktion i redigeringsläget.
  5. Det är viktigt att klicka på Spara innan du lämnar sidan.
  6. För att hitta tillbaka till din källa skriver du in titeln i sökrutan.

Lägg in text och korrekturläs alla sidor

Nu återstår att digitalisera texten och korrekturläsa den digitala källan innan den är färdig. Alla sidor ska korrekturläsas av minst två personer. Du kan därför inte på egen hand färdigställa den bok som du har laddat upp. Det krävs att ytterligare användare korrekturläser eller validerar samtliga sidor i den digitala boken. Gul färgmarkering betyder att sidan har korrekturlästs av en användare. Grön färgmarkering betyder att sidan har korrekturlästs av minst två användare och därför är validerad.

Gör så här:

  1. Gå in på en sida.
  2. Tryck på OCR i menyn.
  3. Rätta korrekturfel.

Sidans status markeras med hjälp av färgkodning.

Du sätter sidans status manuellt innan du sparar sidan:

  1. (Grått) Utan text sidan saknar text och behöver inte korrekturläsas.
  2. (Rött) Ej korrekturläst – texten består av den råa OCR-texten. Den har har inte korrekturlästs alls.
  3. (Lila) Ofullständigt – sidan är inte helt korrekturläst och/eller att det är något problem som måste diskuteras.
  4. (Gult) Korrekturläst – sidan har korrekturlästs av en användare.
  5. (Grönt) Validerad – sidan har korrekturlästs av flera personer.

Riktlinjer för redigering och korrekturläsning

  • På sidan Wikisource:Redigering hittar du riktlinjer för hur texten ska digitaliseras, t.ex. hur stavfel, radbrytning och rubriker ska hanteras.
  • På sidan Wikisource:Korrekturläsning hittar du formateringskoder för att typografera texten – centrering, specialtecken med mera.