For at tydeliggøre bibliotekets politik omkring OCR-behandling kan jeg oplyse følgende:
Bibliotekets formål med OCR-behandling er ikke, at man skal kunne udtrække teksten korrekt fra OCR-laget (dvs. transskribering), dog med enkelte undtagelser som Hirschs Officerer. Formålet med OCR-behandlingen er alene at kunne foretage fritekstsøgning.
Vi er således klar over, at der er en vis procentandel fejl i OCR-behandlingen. Det er vores opfattelse, at dette ikke nedsætter søgbarheden væsentligt, idet begreber og navne, som man typisk vil søge på, vil optræde mere end én gang i de titler, der er mest interessante og dermed med stor sandsynlighed er genkendt korrent mindst én gang.
Det er vores politik, at vi ikke ud over titelblad, indholdsfortegnelse o.lign. læser korrektur på OCR. At skulle efterbehandle OCRen ville være så tidskrævende, at det slet, slet ikke ville stå mål med den marginalt øgede søgbarhed. På dette punkt prioriterer vi volumen over fejlfri OCR.
Vi kan således ikke tilgodese de få personer, der ikke anvender vores arbejde, som det var tiltænkt, eller som ønsker at anvende særlige programmer.
Med venlig hilsen,
Per
Leder, Slægtsforskernes Bibliotek