Midt-Telemark kommune

Veileder for dokumenter

12 Skanning fra papir til PDF

Dokument som er skannet inn består i utgangspunktet kun av et stort bilde. Et bilde av tekst er ikke mulig å lese for dem som bruker en skjermleser, og for dem som må forstørre opp innholdet. For at alle brukere skal kunne forstå innholdet, må teksten konverteres fra bilde til vanlig tekst.

Et annet poenge er at dokumenter som skannes inn ofte blir uskarpe. Kanskje ligger dokumentet skrått, eller det har blitt skannet og kopiert opp i flere runder, slik at det blir vanskelig å lese for alle brukere. Det blir også umulig å gjøre søk og kopiere deler av innholdet, så lenge det er i form av et bilde.

Konverter fra bilde til tekst

Du konverterer fra bilde til tekst ved hjelp av et eget OCR-program (Optical Character Recognition) som ofte følger med skanneren, eller med OCR-funksjon i for eksempel Adobe Acrobat Pro. Merk at uavhengig av om du bruker Acrobat Pro eller et annet program med OCR-funksjon, så trenger du Adobe Acrobat Pro for å kunne gjøre dokumentet fullt ut universelt utformet.

Kvaliteten på den optiske bokstavgjenkjenningen avhenger av mange faktorer, blant annet bildekvaliteten og skrifttypen. Når du har brukt OCR-funksjonen, må du derfor først sjekke at resultatet ble riktig.

Struktur

Det er også viktig å sørge for at innholdet får riktig struktur. Det vil si at for eksempel overskrifter presenteres som overskrifter, slik at brukere som bruker hjelpemidler kan navigere i og lese teksten. Du lager rett struktur ved å bruke tagger. Det finnes ulike veiledninger og verktøy i Adobe Acrobat Pro (Adobe, engelsk) som hjelper deg slik at tagg-strukturen blir bra.