11 tips voor Abbyy FineReader 11 | Personal Computer Magazine, februari 2012

Page 1

Digitaliseer

je papierwinkel

We regelen vrijwel alles digitaal, maar toch lijkt de hoeveelheid papier in ons leven maar niet te stoppen. Gelukkig kun je hier wat aan doen. Met deze elf tips voor Abbyy FineReader 11 digitaliseer je probleemloos al je documenten.

Abbyy FineReader 11 heeft een uitgebreid werkvenster met veel mogelijkheden om zaken geheel naar eigen inzicht in te stellen.

A

bbyy FineReader is al jaren op de markt en periodiek verschijnt er een nieuwe versie met meer mogelijk­ heden. Onlangs kwam de elfde editie uit. Voor gebruikers die serieus bezig zijn met het digitaliseren van documenten, is Abbyy al een bekende speler. Wil je FineReader 11 proberen, download dan van de website van Abbyy de gratis testversie die vijftien dagen functioneel is. Abbyy FineReader 11 is voor­ zien van Nederlandse menu’s. Veel gebrui­ kers vinden het prettig om in de eigen taal met het pakket te werken. Om optimaal te werken, heb je een scan­ ner nodig. In deze workshop maken we ge­ 114

PCM februari 2012

bruik van de Canon ImageFormula DR­ C125. Deze scanner is voorzien van auto­ matische documentendoorvoer en kan dub­ belzijdig scannen. Automatische documen­ tendoorvoer is vooral handig als je meer­ voudige documenten wilt scannen. Je be­ spaart hiermee een aanzienlijke hoeveelheid tijd, omdat je niet elke pagina afzonderlijk handmatig hoeft te scannen. Heb je Abbyy FineReader 11 vanaf cd­ rom geïnstalleerd, dan is het zinvol om de beschikbare update voor het programma te downloaden. Met deze update verwijder je een aantal vervelende bugs. Ga naar Help, Nu op updates controleren. Bij het installe­

ren van de update dien je wel nogmaals het serienummer in te voeren.

Tip 1: Doorzoekbare DocumenTen maken Het is mogelijk om een gescand document op te slaan in pdf­formaat met een door­ zoekbare tekstlaag. Zo’n doorzoekbare tekstlaag is hartstikke handig, want daarmee kun je het document laten indexeren door een gratis programma als Copernic Desktop Search Home. Via het zoekvak in dit pro­ gramma heb je binnen enkele seconden de gezochte passage in een document gevon­ www.pcmweb.nl


tIpS & tRuCS n

11 tips voor Abbyy FineReader 11

Het is mogelijk om pdf-documenten van een onzichtbare en doorzoekbare tekstlaag te voorzien.

den. Hoe maak je zo’n doorzoekbaar pdf­ document? Ga in het menu naar Gereed­ schappen, Opties. Klik op het tabblad Opslaan. Op dit tabblad klik je op het tabblad pDF. Onder Opslagmodus kies je voor tekst onder het paginabeeld. Ga terug naar het hoofdmenu en selecteer onder het kopje Documenttaal de taal van het document, dus bijvoorbeeld Nederlands of Engels. Klik op Bestand, pagina’s scannen. In het venster Scannen met Abbyy FineReader geef je een aantal instellingen aan. Onder Resolutie kun je kiezen tussen 300 dpi (normale tekst) en 600 dpi (kleine tekst). Bij Scanmodus kun je kiezen tussen kleur, grijswaarden en zwart­ wit. Is het document dat je wilt scannen aan twee kanten bedrukt en kan jouw scanner dubbelzijdig scannen, zet dan onderaan een vinkje bij Dubbelzijdig scannen. Heb je alles naar wens ingesteld, klik dan op Scannen. Hierna selecteer je in het hoofdmenu pagina, pagina lezen. In tekst klik je op Verificatie. Nu kun je handmatig controleren of Abbyy de tekstherkenning naar wens heeft gedaan. Het is ook nog mogelijk om fouten in de tekstherkenning te corrigeren. Als Abbyy over een bepaald woord of teken twijfelt, is dit te zien aan de rode kleur. Overigens ben je niet verplicht om dit verificatieproces door te lo­ pen. Ben je tevreden, ga dan in het hoofd­ menu naar Bestand, Document opslaan als en kies voor pDF­document.

Tip 2: Verrijk heT woorDenboek Abbyy maakt gebruik van een eigen inge­ bouwd woordenboek. Dit verbetert het pro­ ces van tekenherkenning. Natuurlijk zijn er al­ tijd woorden die niet in dit woordenboek voorkomen, vooral als het gaat om nieuwe www.pcmweb.nl

Als Abbyy FineReader 11 twijfelt over een woord juist is herkend, is dat zichtbaar via de rode balk rondom deze tekens.

denboek kun je ook exporteren. Geef het woordenboek een naam en sla het op. Dit is vooral handig als je Abbyy herinstalleert op een bestaande of nieuwe pc. Je hoeft niet meer opnieuw tijd en energie te steken in een eigen woordenboek met specifieke vak­ termen.

Tip 3: beelD-pDf Doorzoekbaar maken Voor een betere en snellere tekstherkenning voeg je zelf woorden toe aan het woordenboek.

woorden of vaktermen. tijdens het proces van tekenherkenning laat Abbyy in het ven­ ster Verificatie woorden zien waarover twijfel bestaat. Als Abbyy een woord niet herkend, maar wel correct is herkend, klik je op toe­ voegen. Dan wordt het woord toegevoegd aan het woordenboek. De volgende keer zal Abbyy dit toegevoegde woord direct herken­ nen en jou niet meer lastig vallen met de vraag of dit woord correct is. Naarmate je zelf meer woorden toevoegt, werkt de tekst­ herkenning van Abbyy in het vervolg sneller. De woorden die je zelf hebt toegevoegd, kun je bekijken in Abbyy. Ga naar Gereedschap­ pen, Woordenboeken bekijken. In Gebrui­ kerswoordenboek selecteer je eerst de taal (bijvoorbeeld Nederlands). Klik aan de rech­ terkant op Beeld en je ziet een overzicht van de toegevoegde woorden. Vanuit dit venster kun je zelf ook woorden toevoegen door eenvoudigweg op toevoegen te klikken. Een eigen woordenlijst importeren kan ook. Het invoerbestand moet in txt­formaat zijn en de woorden dienen door spaties van elkaar ge­ scheiden te zijn. Een zelf aangemaakt woor­

Soms ontvang je een pdf waarin het niet mo­ gelijk is om de stukken tekst uit het docu­ ment te selecteren. Zo’n pdf is eigenlijk een foto van een pagina. Wil je een bestaand pdf­document alsnog voorzien van een door­ zoekbare tekstlaag, dan is dat heel goed mo­ gelijk. Ga in het menu naar Bestand, kies pDF­bestand/afbeelding openen. tijdens het openen van het document analyseert Abbyy automatisch het document. Dit betekent dat het proces van tekenherkenning automatisch wordt gestart. Natuurlijk wil je zelf nog even controleren of Abbyy de tekens (en dus de woorden) goed heeft herkend. Ga naar het venster tekst en klik op Verificatie. Herhaal de eerder beschreven stappen voor het con­ troleren van de tekst. Ben je tevreden? Dan sla je het document in pdf­formaat op. Als je het originele pdf­bestand intact wilt laten, kies je in dit geval natuurlijk een nieuwe naam voor het doorzoekbare document.

Tip 4: pDf-DocumenT beVeiligen Het is mogelijk om een pdf­document te beveiligen. Ga in het hoofdmenu naar Gereedschappen, Opties, tabblad Opslaan. Selecteer het tabblad pDF. Onder Beveiliging klik je op pDF­beveiligingsinstellingen. Je PCM februari 2012

115


n tIpS & tRuCS

Met Abbyy FineReader 11 is het mogelijk om een pdfdocument op verschillende manieren te beveiligen.

stelt hier bijvoorbeeld in dat een pdf­docu­ ment pas opent nadat iemand het juiste wachtwoord heeft ingevoerd. Om dit voor elkaar te krijgen, zet je een vinkje bij Wacht­ woord vereisen om document te openen. Klik op de knop met de drie puntjes en voer twee keer het wachtwoord in. Ook is het mogelijk om beperkingen met betrekking tot afdrukken en wijzigen van een pdf­document in te stellen. Kies de gewenste optie in de uitrolmenu’s bij Afdrukken toegestaan en Wijzigingen toegestaan. Bij Coderingsniveau kies je voor Hoog (128­bit AES)­compatibel met Acrobat 7.0 en hoger). Bevestig met OK.

Tip 5: Sneller Scannen Als je gebruikmaakt van een scanner met automatische documentendoorvoer, kun je meerdere pagina’s achter elkaar laten scan­ nen. Zodra de documenten gescand zijn, zal Abbyy FineReader 11 automatisch starten met het proces van tekenherkenning. Dit ocr­ proces is redelijk processorintensief en kan

Als je kiest voor niet automatisch lezen en analyseren, kun je meer documenten scannen in dezelfde tijd.

enige tijd in beslag nemen. In de tussentijd kun je geen nieuwe documenten scannen. toch kun je via een handig trucje veel docu­ menten achter elkaar scannen. Hoe doe je dat? Ga Gereedschappen, Opties, tabblad Scannen/Openen. Onder Algemeen zet je een vinkje bij Verkregen pagina­afbeeldingen niet automatisch lezen en analyseren. Klik op OK. Het is mogelijk om de scanresultaten apart op te slaan en later het verificatieproces voor de tekstherkenning te starten. Na het scannen ga je naar Bestand, FineReader­ document opslaan. Later kun je dit Fine­ Reader­document weer openen en via Verificatie in het venster Beeld de herkende tekst gaan controleren. Ook het ocr­proces kun je versnellen. Ga naar Opties en selec­ teer het tabblad Lezen. Onder Leesmodus zet je een vinkje bij Snel lezen. Deze optie is interessant als het bronmateriaal van goede kwaliteit is en je eventuele kleine foutjes in de tekenherkenning voor lief neemt. In de kolom pagina’s kunnen meerdere pagina’s uit ver­ schillende documenten staan. Nadat je verifi­

Het is vrij eenvoudig om onderdelen uit een gescand document te verwijderen.

116

PCM februari 2012

catieproces voor de tekenherkenning hebt afgerond, kun je naar eigen inzicht de ver­ schillende pagina’s apart of gezamenlijk op­ slaan. Selecteer in de kolom pagina’s via de Ctrl­toets één of meer pagina’s. Klik vervol­ gens met rechts, kies Geselecteerde pagina’s opslaan als en selecteer het pdf­formaat.

Tip 6: camera alS Scanner Natuurlijk heb je niet altijd een scanner bij de hand. In sommige gevallen kan het nodig zijn dat je onderweg een digitale scan van een document (artikel in de krant, contract, et cetera) wilt maken. Gelukkig is tegenwoordig elke smartphone voorzien van een fotocame­ ra van goede kwaliteit. Deze camera kun je inzetten als alternatieve scanner. Wel is er aantal zaken waarmee je rekening moet hou­ den als je een goed eindresultaat voor ogen hebt. Voor het fotograferen van een A4’tje kun je het beste een camera gebruiken met een beeldsensor van minimaal vijf mega­ pixels. probeer ervoor te zorgen dat het do­ cument helder en gelijkmatig is verlicht. pro­ beer schaduw op het te fotograferen docu­ ment te vermijden. Als je een foto maakt van een glanzend stuk papier, kun je de flitser het beste uitzetten. De afstand tussen de came­ ra en het papier is minimaal twintig centime­ ter. Zorg ervoor dat het gehele document in het camerabeeld valt. Een gefotografeerd document importeer je probleemloos in Ab­ byy FineReader 11. Ga naar Bestand, pDF­ bestand/afbeelding openen. Je kunt alle gangbare grafische formaten, zoals jpeg en tiff, probleemloos inlezen. Als je de foto hebt ingelezen, kun je er alle handelingen op losla­ ten, bijvoorbeeld die in dit artikel worden be­ handeld. Het is wel handig om te controleren of Afbeelding voorbewerken inschakelen is geactiveerd. Deze optie zorgt ervoor dat au­ www.pcmweb.nl


tomatisch correcties op het fotomateriaal worden toepast. Je kunt hierbij denken aan het verwijderen van ruis, bewegingson­ scherpte verwijderen en tekstregels recht­ trekken. Ga naar Gereedschappen, Opties. In het tabblad Scannen/Openen zet je onder het kopje Afbeeldingen voorbewerken een vinkje bij Afbeeldingen voorbewerken inscha­ kelen.

Tip 7: VerTrouwelijke fragmenTen VerwijDeren Soms bevat een document vertrouwelijke passages die geheim moeten blijven. Met Abbyy FineReader 11 is het heel gemakkelijk om eenvoudige bepaalde passages uit een document uit te wissen. Scan een document en klik vervolgens in het venster Afbeelding op Afbeelding bewerken. De Afbeeldings­ editor zal automatisch openen. Klik in de rechterkolom op Gummetje. plaats de cursor in de linkerbovenhoek van de passage die je wilt wissen. Houd de linkermuisknop inge­ drukt en beweeg naar de rechteronderkant van de passage. Het gedeelte dat je hebt ge­ selecteerd, wordt automatisch gewist. Ga naar Bestand, Document opslaan als. Je hebt nu de beschikking over een document met een gewiste passage. Sterk punt van Abbyy FineReader 11: de functie Gummetje kun je ook inzetten bij bestaande pdf­docu­ menten. Het is een fluitje van een cent om een stuk tekst of afbeelding in een bestaand pdf­document onzichtbaar weg te poetsen.

Tip 8: TegenoVerliggenDe pagina’S Scannen Als je een boekje met een A5­formaat onder een flatbedscanner legt, dan presenteert Abbyy FineReader 11 als resultaat één pagina die bestaat uit twee tegenoverliggende bladzij­ den. Natuurlijk wil je dat het gescande docu­ ment bestaat uit een enkele pagina uit het ge­ scande boek. Gelukkig kun je heel gemakke­ lijk tegenoverliggende pagina’s splitsen. Hoe doe je dat? Ga naar Gereedschappen, Opties, tabblad Scannen/Openen. Onder Voorbewer­ ken zet je een vinkje bij Linker­ en rechterpagi­ na’s splitsen. Klik op OK. Overigens kun je een reeds gescand document dat bestaat uit te­ genoverliggende pagina’s ook op een andere manier gemakkelijk splitsen. In het venster Af­ beelding klik je op Afbeelding bewerken. In de Afbeeldingseditor klik je in de rechterkolom op Splitsen. Je kunt handmatig zowel horizontaal als verticaal aangeven op welke plek het do­ cument in tweeën moet worden gesplitst. De gesplitste pagina’s verschijnen nu automatisch in de kolom pagina’s als twee afzonderlijke pagina’s. Een alternatieve oplossing: bij veel kopieerwinkels en huisdrukkerijen kun je tegen betaling van een klein bedrag met een spe­ ciale snijmachine de rug van een boek laten www.pcmweb.nl

snijden. Het resultaat is een stapel losse blad­ zijden die je heel gemakkelijk in de sheetfee­ der van een documentenscanner invoert.

Tip 9: TekST inVerTeren Het komt voor dat een document bestaat uit witte letters tegen een donkere achtergrond. Veel mensen vinden dit niet prettig lezen. Bo­ vendien verbruik je veel kostbare inkt als je een afdruk maakt van zo’n document. Met Abbyy FineReader 11 kun je hier wat aan doen. Scan het document en klik in het ven­ ster Afbeelding op Afbeelding bewerken. In de Afbeeldingseditor klik je in de rechterko­ lom op Inverteren. Je kunt aangeven of je be­ werking wilt toepassen op de huidige, even, oneven of alle pagina’s. Klik op Afbeelding in­ verteren. Je zult zien dat de tekst bestaat uit zwarte letters op een lichte achtergrond.

Tip 10: DocumenT rechTTrekken Soms gebeurt het dat een document een beetje scheef op een flatbedscanner is ge­ legd. Als je het scanresultaat bekijkt, zul je zien dat het document schuin op het scherm staat. Moet je nu opnieuw scannen? Niet nodig. In het venster Afbeelding klik je op Afbeelding bewerken. In de Afbeeldingseditor klik je rechtsboven op Rechttrekken. Je kunt aangeven of je deze bewerking op alle, huidi­ ge, even of oneven pagina’s wilt toepassen. Klik op Rechtzetten. Je zult zien dat het scheve document plotseling loodrecht op je beeldscherm staat.

Tip 11: Delen uiTSluiTen Van TekSTherkenning Met Abbyy FineReader 11 is het doorzoek­ baar maken van teksten een relatief gemak­ kelijk klusje. Het is mogelijk dat je bepaalde onderdelen van een tekst juist niet doorzoek­ baar wilt maken. Dat is mogelijk. In het ven­ ster Beeld klik je op Analyseren. Abbyy Fine­ Reader 11 stelt dan automatisch de tekst­ delen vast en plaatst ze automatisch in een groen kader. Als je een bepaalde tekstpassa­ ge niet doorzoekbaar wilt maken, selecteer dan dit tekstgedeelte, rechtsklik en kies Gebied verwijderen. Als je vervolgens in het venster Afbeelding kiest voor Lezen, zullen de verwijderde tekstgedeelten niet door het ocr­proces worden gehaald. Om alle misver­ standen te voorkomen: als je het document hierna opslaat, zullen vanzelfsprekend wel alle tekstgedeelten uit het document worden afgedrukt. Tekst: Marc Boersma

Met dank aan Canon voor het ter beschikking stellen van de ImageFormula DR-C125. PCM februari 2012

117


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.