Guide till teknikpoolen/Bokskanner
Wikimedia Sverige har två skannrar som lämpar sig särskilt väl för att skanna in litteratur. Dels en Fujitsu ScanSnap SV600, och dels en CZUR Ultra Shine. CZUR Ultra Shine är den senaste av skannrarna, och kommer med en fotpedal som gör att det går väldigt snabbt att skanna in boksidorna. Om båda finns inne rekommenderar vi att du lånar CZUR Ultra Shine.
Bägge skannrarna fungerar till Windows och Mac. Ingen av dem är dessvärre kompatibel med Linux.
CZUR Ultra Shine
Här kan du läsa på mer om själva skannern på CZUR:s supportsida. Du laddar ned programvaran för skannern därifrån. Med i skannern följer en specifik kod som du anger i programvaran för att kunna använda licensen till bildhanteringsprogrammet.
Grundtips
Skannern är gjord för att det ska gå lätt och snabbt att skanna in verken. Skannern sträcks ut med ett stativ, och med följer en svart matta som man lägger verket på. Det är viktigt att försöka se till att ljusinsläppet är bra. Solljus eller en felriktad lampa kan exempelvis ställa till det. Testa dig fram med olika ljuskällor. Det finns också en inbyggd ljuskälla, som kan hjälpa till i vissa sammanhang. Dessutom kan du välja olika typer av färginställningar. För mig fungerade det bäst att skanna av till svartvitt – då blev textresultatet bäst. Eftersom målet var att så snabbt och bra som möjligt få upp ett verk på Wikisource såg jag heller inte färgen som det viktigaste i ekvationen.
Med skannern kommer två hjälpmedel som gör ditt liv betydligt enklare. Dels en fotpedal. Det innebär att du styr när skanningen ska ske med din fot. När du väl kommit in i rytmen gör det att skanningen kan gå väldigt fort (se dock till att den inte går för fort – ibland lyckades jag få texten suddig i min iver att skynda på skanningen!). Wirséns diktsamling, på ungefär 300 sidor, tog ett tiotal minuter att skanna in.
Dessutom följer två väldigt smarta “extrafingrar” med. Det hade jag inte insett. Det innebär att mina fingrar syns på nästan alla bilder. Dessa små extrafingrar är till för att hålla ner boksidorna med, utan att det syns på bilden. Med extrafingrarna på, fotpedalen på plats, när du har hittat en bekväm arbetsställning, och dessutom lyckats hitta en bra uppsättning ljuskällor, är det bara att börja skanna!
Vad ska man skanna?
När skannern kom var modellen helt nysläppt, så det fanns inte jättemycket vägledning kring vad skannern klarar av. Vi valde att testa tre olika typer av objekt: dels gamla svartvita fotografier inklistrade i ett album, dels ett gammalt riksdagstryck från sent artonhundratal som kombinerar bild och text med samtliga invalda ledamöter i riksdagens andra kammare, och slutligen en diktsamling i public domain.
Skannern hade lite svårt med fotografier och bilder. Styrkan med skannern är inte nödvändigtvis bildkvaliteten, utan snarare snabbheten och möjligheten för skannern att läsa av texten. Resultatet av fotografierna och riksdagstrycket blev inte jättebra. Däremot gick det väldigt bra att skanna in diktsamlingen.
Gör så här:
- Koppla bokskannern till datorn.
- Öppna programvaran som du har installerat. Titta runt bland inställningarna. Du kan t.ex. välja att skanna i svartvitt eller färg. Se mer nedan.
- Skanna alla sidor, med hjälp av fotpedalen. Med CZUR Ultra Shine kan du skanna hela bokuppslaget, och skannern delar automatiskt upp det i två sidor, så länge boken ligger på den svarta mattan och mittenstrecket i skannern är avpassat till bokens mitt.
- När du har skannat in alla sidor kan du gå till resultatet.
- Titta igenom att du har fått en bra avskanning av alla boksidor. Det är absolut lättast att skanna om en sida redan nu, om du märker att någon har blivit suddig, än att göra det senare i processen. Det finns flera redigeringsverktyg som du kan använda dig av, för att förbättra färg eller ljus, för att rotera upp sidan, eller för att beskära den. Om inget hjälper är det lika bra att skanna om den aktuella sidan
Bildkvalitet och OCR-läsning
När du har skannat in sidorna och ser på resultatet i programvaran är det dags att säkerställa att alla boksidor är läsbara, och att förbereda för OCR-läsning – alltså den automatiska textavläsningen som programvaran utför. Automatiskt kommer skanningen rendera bildfiler. Det finns några olika verktyg för att justera bildkvaliten vad gäller exempelvis färg, rotera sidor om det behövs, och så vidare. Här kan du också snabbt se om det finns någon fil som har blivit suddig. I så fall kan du relativt enkelt ersätta den. Om du säkerställer kvalitén redan här sparar du tid senare.
När du har kommit fram till att sidorna har tillräckligt hög kvalitet kommer du till själva OCR-läsningen. Här är en av den nya skannerns riktigt bra egenskaper: OCR-programvaran är både bra och snabb. Du kan välja några olika format för OCR-läsningen, och beroende på hur du väljer kommer processen vidare se lite olika ut. Det lättaste för att föra upp böckerna på Wikisource är att antingen välja Word eller sökbar PDF. Markera alla bilder som du har skannat in, och välj det format som du avser att arbeta i. Tänk på att om du väljer sökbar PDF kommer en OCR-läst text automatiskt komma upp i korrekturläsningsfönstret i Wikisource, medan om du läser Word kommer du att behöva flytta över texten själv. Du kan läsa mer om det här!
Alternativ process för export
Programvaran som medföljer skannern har begränsningar när det kommer till att ändra ordning på sidor som har skannats. Dessutom upplevde komprimerades sidorna onödigt hårt i vissa fall. Vissa sidor roteras också för att text skulle vara uppåt på sidan, vilket är svårt att ändra på om man inte vill ha det så. För att få bättre kontroll på resultatet kan man välja att importera bilderna till ett annat program som kan sätta ihop en pdf, till exempel NAPS2. Genom att först skanna i den medföljande programvaran kan man ändå utnyttja funktionerna för att plana ut och beskära boksidor. NAPS2 har också minst lika kapabel OCR.
Fujitsu ScanSnap
Mjukvaran finns för Windows och Mac. Du kan ladda ned den här. Du behöver koppla programvaran till skannerns serienummer, som du hittar på undersidan. För Windows, välj ScanSnap Installer.
Det kan hända att installationsprogrammet tvingar datorn till omstart. Se därför till att spara information i andra program som kan gå förlorad om datorn startar om.
Standardinställningarna i Scansnaps programvara skapar en tillfällig mapp för filerna. Dessa filer raderas efter ett visst antal dagar. Om du inte vill att detta ska hända, spara din pdf i en annan mapp.
Gör så här:
- Koppla bokskannern till datorn.
- Öppna programmet Scansnap Home, högerklicka på ikonen som visar att programmet är igång, välj Scan settings och titta runt bland inställningarna. Du kan t.ex. välja att skanna i svartvitt eller färg.
- Tryck på Stop eller Scan för att starta skannern.
- Tryck på Scan för att starta programmet.
- Skanna alla sidor. Om du skannar ett uppslag, så skanna det två gånger för att få två sidor.
- Klicka Finish scanning i programmet eller Stop på skannern för att gå vidare till nästa steg.
Redigera de skannade sidorna
Gör så här:
- Gå igenom klippningen av varje sida och justera om det behövs.
- Klicka i rutan Continue with Point Retouch och klicka på Next.
- Klicka på Check and correct för att gå vidare till nästa steg.
- Se till att Correction mode är markerat och klicka på det du vill ta bort på sidan.
- Klicka på Apply för att korrigera det markerade området. Du kan behöva välja Correction mode igen för att kunna fortsätta redigera.
Spara som pdf
Gör så här:
- Spara och stäng med Save and quit. Då kommer du till ett nytt fönster där du kan välja var du ska spara filen. Välj Scan to folder och spara där du vill.