Uit Hack42
Ga naar: navigatie, zoeken
Project: Boeken Scannen
Schroefje24.png
Schroefje24.png
Schroefje24.png
Schroefje24.png
Boeken Scannen Picture.jpg

Boeken Scannen

Naam Boeken Scannen
Door Allen
Status Uitvoer
Madskillz Yes
Doel / Omschrijving
Handleiding boeken scannen voor het Computermuseum
Alle Projecten - Project Toevoegen
File:Boeken Scannen_Picture.jpg noez


Project Boekenscannen

In het museum staat een tafel met twee scanners, en daarnaast een met een werkstation met een externe harddisk. Dit is om boeken te scannen voor het museum, zodat de disk uiteindelijk aan archive.org geleverd kan worden, en iedereen weer blij is met documentatie.

Op dit moment wordt er gebruik gemaakt van een perl-script dat scanimage met de juiste argumenten aanroept. Deze argumenten worden bepaald door het soort scan wat gedaan moet worden, en welke scanner gebruikt moet worden. De scanners worden aangestuurd met het commando scan-left of scan-right. Gebruik scan-{left|right} (dit is een verkorte schrijfwijze voor scan-left of scan-right) als volgt:

scan-{left|right} <paginasoort> 

Waarbij paginasoort gedefinieerd wordt in een bestand, scan.ini in de huidige directory of in een van de bovenliggende directories. Dat laatste is makkelijk bij het scannen van een serie van dezelfde soort boeken, dan hoeft het bestand niet zoveel heen en weer gekopieerd te worden.

Het resultaat van de scans, een hele verzameling TIFF files met elk één pagina, komt op de externe harddisk, in de directory scans/ (omdat deze drive gemount is, komt dat uit op /media/scan/INTENSO/scans/ ).

Stappen

Verwerk in eerste instantie de losbladige boeken/binders, die zijn het makkelijkste snel te verwerken.

  1. Ga achter het werkstation in het museum zitten; gebruik het account MUSEUM (wachtwoord idem).
  2. Pak een boek losbladige binder uit een van de sinaasappeldozen, en pak er een hoofdstuk (of deel er van, max. vijftig pagina's) uit. Ook tabbladen, schutbladen, etc. Boeken gaan binnenkort losbladig gemaakt worden. Laat binders met een verzameling aantekeningen, losse of aan elkaar geniete blaadjes en dergelijke vage meuk maar liggen voor het museumteam.
  3. Maak in /media/scan/INTENSO/scans/ een directory aan met de titel van het boek, of de binder (voorbeeld: "VMS System Management"). Gebruik zoveel mogelijk letterlijk de titel van het boek, met hoofd en kleine letters. Vervang dubbele punten en slashes en zo door min-tekens of underscores zodat het er nog leesbaar uitziet.
    • maak subdirectories aan voor elk hoofdstuk, als het grote hoofdstukken betreft, of als er tabbladen tussen zitten die niet door de ADF (doorvoerscanner) heen kunnen.
  4. Maak zo nodig in elke net gemaakte directory een tekstbestand scan.ini met daarin de opties voor het scannen van de verschillende soorten pagina's.
  5. Plaats de vellen papier in de desbetreffende scanner: een tabblad (indien aanwezig) op de scanner, de rest in de Automatic Document Feeder (ADF).
    • Op de flatbed scanner, plaats de pagina met de beeldzijde naar onder (duh), op zijn kop (met de bovenkant naar je toe dus) op de glasplaat, tegen het driehoekje linksonder. Indien de pagina niet past, bijvoorbeeld met letter-size tabbladen, laat dan de perforatiezijde een beetje links uitsteken, als de rechterkant maar op de plaat ligt.
    • In de ADF, plaats een pak papier van maximaal ongeveer 50 pagina's op zijn kop, met de eerste pagina van je af, zodat je alleen de laatste pagina nog ziet
  6. Open een terminal, en ga naar de directory /media/scan/INTENSO/scans/NaamVanHetBoek/ChapterZoveel. Voer daar het commando scan-{left|right} paginasoort uit, met voor paginasoort de paginasoort uit scan.ini. Voorbeeld: scan front.
  7. De scans worden automatisch genummerd, met doorlopende nummering als je het volgende stapeltje pagina's invoert.
  8. Doe de gescande pagina's terug in de binder, en doe deze na het scannen in de IKEA-bak 'verwerkt'
    • Wanneer je denkt dat een aantal gescande pagina's niet juist is, bijvoorbeeld omdat er twee of meer pagina's tegelijk door de document feeder zijn gegaan of dat de pagina's verkeerd om in de feeder zijn gelegd, leg dan het gescande boek/binder apart met een geeltje er op, met een vermelding van het probleem (bijv. "Dubbele pagina gescand rond p.72")
  9. Om de twee scanners tegelijk te gebruiken maak je een tweede directory als boven, open je een tweede terminal, ga daarin naar deze directory, vul de scanner en geef het desbetreffende scan-commando. Ga niet een tweede set paginas van de binder die in de eerste scanner verwerkt wordt scannen, en ga ook niet in dezelfde directory werken. Dit zal hopeloze chaos veroorzaken. Pak bij voorkeur een binder van een heel andere serie.

scan.ini

De scan.ini file is een standaard ini-file geformatteerd tekstbestand, met secties en daarin opties met parameters.

Voorbeeld:

[page]

source = adf
mode = color
size = letter

[front]

source = flatbed
mode = color
size = fullsize

Mogelijke parameters en hun waardes zijn:

  • size
    • a4: 21 x 29.7 mm (default)
    • letter: 8.5 x 11 in
    • fullsize: zo groot mogelijk, alleen op de flatbed
  • mode
    • blackwhite: zwart/wit (2) (default)
    • grayscale: grijstonen (256)
    • color: kleuren (256x256x256)
  • source
    • adf: in de sheetfeeder (dubbelzijdig) (default)
    • adf-ss: in de sheetfeeder (enkelzijdig)
    • flatbed: onder de klep

Op dit moment werkt de flatbed optie alleen nog maar met fullsize.

Er kunnen meerdere secties met verschillende namen in de scan.ini file worden gedefiniëerd, zoals in het voorbeeld.