Project: Boeken Scannen | |
---|---|
Naam | Boeken Scannen |
Door | Allen |
Status | Uitvoer |
Madskillz | Yes |
Doel / Omschrijving | |
Handleiding boeken scannen voor het Computermuseum | |
Alle Projecten - Project Toevoegen |
Project Boekenscannen
In het museum staat een tafel met twee scanners, en daarnaast een met een werkstation met een externe harddisk. Dit is om boeken te scannen voor het museum, zodat de disk uiteindelijk aan archive.org geleverd kan worden, en iedereen weer blij is met documentatie.
Op dit moment wordt er gebruik gemaakt van een perl-script dat scanimage met de juiste argumenten aanroept. Deze argumenten worden bepaald door het soort scan wat gedaan moet worden, en welke scanner gebruikt moet worden. De scanners worden aangestuurd met het commando scan-left
of scan-right
. Gebruik scan-{left|right}
(dit is een verkorte schrijfwijze voor scan-left
of scan-right
) als volgt:
scan-{left|right} <paginasoort>
Waarbij paginasoort gedefinieerd wordt in een bestand, scan.ini
in de huidige directory of in een van de bovenliggende directories. Dat laatste is makkelijk bij het scannen van een serie van dezelfde soort boeken, dan hoeft het bestand niet zoveel heen en weer gekopieerd te worden.
Het resultaat van de scans, een hele verzameling TIFF files met elk één pagina, komt op de externe harddisk, in de directory scans/
(omdat deze drive gemount is, komt dat uit op /media/scan/INTENSO/scans/
).
Stappen
Verwerk in eerste instantie de losbladige boeken/binders, die zijn het makkelijkste snel te verwerken.
- Ga achter het werkstation in het museum zitten; gebruik het account MUSEUM (wachtwoord idem).
- Pak een
boeklosbladige binder uit een van de sinaasappeldozen, en pak er een hoofdstuk (of deel er van, max. vijftig pagina's) uit. Ook tabbladen, schutbladen, etc. Boeken gaan binnenkort losbladig gemaakt worden. Laat binders met een verzameling aantekeningen, losse of aan elkaar geniete blaadjes en dergelijke vage meuk maar liggen voor het museumteam. - Maak in
/media/scan/INTENSO/scans/
een directory aan met de titel van het boek, of de binder (voorbeeld: "VMS System Management"). Gebruik zoveel mogelijk letterlijk de titel van het boek, met hoofd en kleine letters. Vervang dubbele punten en slashes en zo door min-tekens of underscores zodat het er nog leesbaar uitziet.- maak subdirectories aan voor elk hoofdstuk, als het grote hoofdstukken betreft, of als er tabbladen tussen zitten die niet door de ADF (doorvoerscanner) heen kunnen.
- Maak zo nodig in elke net gemaakte directory een tekstbestand
scan.ini
met daarin de opties voor het scannen van de verschillende soorten pagina's. - Plaats de vellen papier in de desbetreffende scanner: een tabblad (indien aanwezig) op de scanner, de rest in de Automatic Document Feeder (ADF).
- Op de flatbed scanner, plaats de pagina met de beeldzijde naar onder (duh), op zijn kop (met de bovenkant naar je toe dus) op de glasplaat, tegen het driehoekje linksonder. Indien de pagina niet past, bijvoorbeeld met letter-size tabbladen, laat dan de perforatiezijde een beetje links uitsteken, als de rechterkant maar op de plaat ligt.
- In de ADF, plaats een pak papier van maximaal ongeveer 50 pagina's op zijn kop, met de eerste pagina van je af, zodat je alleen de laatste pagina nog ziet
- Open een terminal, en ga naar de directory
/media/scan/INTENSO/scans/NaamVanHetBoek/ChapterZoveel
. Voer daar het commandoscan-{left|right} paginasoort
uit, met voor paginasoort de paginasoort uitscan.ini
. Voorbeeld:scan front
. - De scans worden automatisch genummerd, met doorlopende nummering als je het volgende stapeltje pagina's invoert.
- Doe de gescande pagina's terug in de binder, en doe deze na het scannen in de IKEA-bak 'verwerkt'
- Wanneer je denkt dat een aantal gescande pagina's niet juist is, bijvoorbeeld omdat er twee of meer pagina's tegelijk door de document feeder zijn gegaan of dat de pagina's verkeerd om in de feeder zijn gelegd, leg dan het gescande boek/binder apart met een geeltje er op, met een vermelding van het probleem (bijv. "Dubbele pagina gescand rond p.72")
- Om de twee scanners tegelijk te gebruiken maak je een tweede directory als boven, open je een tweede terminal, ga daarin naar deze directory, vul de scanner en geef het desbetreffende scan-commando. Ga niet een tweede set paginas van de binder die in de eerste scanner verwerkt wordt scannen, en ga ook niet in dezelfde directory werken. Dit zal hopeloze chaos veroorzaken. Pak bij voorkeur een binder van een heel andere serie.
scan.ini
De scan.ini
file is een standaard ini-file geformatteerd tekstbestand, met secties en daarin opties met parameters.
Voorbeeld:
[page] source = adf mode = color size = letter [front] source = flatbed mode = color size = fullsize
Mogelijke parameters en hun waardes zijn:
- size
- a4: 21 x 29.7 mm (default)
- letter: 8.5 x 11 in
- fullsize: zo groot mogelijk, alleen op de flatbed
- mode
- blackwhite: zwart/wit (2) (default)
- grayscale: grijstonen (256)
- color: kleuren (256x256x256)
- source
- adf: in de sheetfeeder (dubbelzijdig) (default)
- adf-ss: in de sheetfeeder (enkelzijdig)
- flatbed: onder de klep
Op dit moment werkt de flatbed optie alleen nog maar met fullsize.
Er kunnen meerdere secties met verschillende namen in de scan.ini
file worden gedefiniëerd, zoals in het voorbeeld.