Bilde til tekst — OCR i nettleseren

Hent ut tekst fra bilder, skjermbilder og skannede dokumenter. Tesseract OCR kjører fullstendig i nettleseren — ingenting lastes opp.

Slipp bilder her eller

Slipp eller bla gjennom for ett eller flere bilder — JPG, PNG, WebP eller BMP.
Velg et språk hvis teksten din ikke er på engelsk — første kjøring på det språket laster ned modellen (3–14 MB) og bufrer den i nettleseren til neste gang.
Klikk Trekk ut alt. Første kjøring laster ned omtrent 8 MB med OCR-motor og språkdata fra dette nettstedet (bufres av nettleseren og gjenbrukes på tvers av hvert bilde i batchen).
Det første bildets gjenkjente tekst vises i forhåndsvisningen nedenfor. Last ned hvert bildes tekst individuelt fra raden, kopier alt til utklippstavlen, eller hent én kombinert .txt med hver fils resultat adskilt med overskrifter.

Hva gjør det?

OCR (Optical Character Recognition) gjør piksler som ser ut som tekst om til faktisk tekst. Dette verktøyet kjører Tesseract — den åpne OCR-motoren vedlikeholdt av Google — kompilert til WebAssembly. Fungerer best på trykt tekst; håndskriftgjenkjenning er svakere.

Tips for beste resultater

Høy kontrast mellom tekst og bakgrunn.
Ikke-skjeve skanninger — roter bildet først med Image Cropper hvis det ligger på siden eller er skeivt.
300 DPI eller høyere for skannede dokumenter.
Trykt tekst fungerer mye bedre enn håndskrift.
For en PDF med flere sider, konverter først til bilder med PDF to JPG / PNG og OCR hver side, eller bruk det dedikerte PDF to Text-verktøyet.

Eksempel

Inndata — et skjermbilde av en fraktetikett, engelsk, JPG. Output-tekstfelt:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

Vanlige feil og fallgruver

De fleste OCR-skuffelser kommer fra kildebildet, ikke motoren. Et dårlig bilde kan ikke reddes med en finere innstilling.

Forvrengt resultat på et bilde med lav oppløsning. Telefonskjermbilder og bitte små miniatyrer gir mishandlet tekst. Ta bildet på nytt tettere på, eller bruk originalfilen i full oppløsning hvis du har den.
Bildet er rotert 90° eller opp-ned. Tesseract roterer ikke automatisk. Rett opp orienteringen med Image Cropper først, og prøv deretter igjen.
Kolonner er flettet sammen i resultatet. OCR leser i naturlig skanne-rekkefølge og kan forvirres av flerkolonne-layouter. Beskjær bildet etter kolonne først, og OCR hver kolonne separat.
Håndskrift kommer ut feil. Tesseract er trent på trykt tekst og sliter med skråskrift eller rotete håndskrift. For leselig blokkbokstav-håndskrift er resultatene brukbare, men aldri gode — regn med å rette opp for hånd.
Ikke-engelsk tekst er tull. Å la språkvelgeren stå på engelsk mens du OCR-er koreansk, arabisk eller kinesisk gir tilfeldig-utseende resultat. Velg matchende språk fra rullegardinen før du trekker ut.
Fanen fryser på et enormt bilde. Bilder over 20 megapiksler kan tømme minnet under gjenkjenning. Beskjær til området du bryr deg om med Image Cropper, eller komprimer med Image Compress først.

Ofte stilte spørsmål

Hvilke bildeformater støttes?

JPG, PNG, WebP og BMP. Ethvert format nettleseren din kan dekode med standard Image API bør fungere. For HEIC-bilder fra iPhone, konverter til JPG først med HEIC to JPG-verktøyet.

Hvorfor er første kjøring treg?

Tesseract trenger omtrent 4 MB med kompilert motor-kode og 4 MB med språkmodell-data ved første bruk. Begge bufres av nettleseren, så påfølgende kjøringer starter på under ett sekund. Selve gjenkjenningen tar typisk 2–10 sekunder for et vanlig skjermbilde og skalerer omtrent med bildestørrelse.

Hvor nøyaktig er det?

På ren trykt tekst ved 300 DPI eller høyere er nøyaktigheten typisk 95 %+. På telefonskjermbilder av nettsteder er nøyaktigheten vanligvis god, men kan gå glipp av liten UI-krom. På bilder med lav oppløsning, skanninger med støy, eller håndskrift, faller nøyaktigheten betydelig. Vi bruker den raske Tesseract-språkdataen — en god balanse mellom hastighet og nøyaktighet.

Kan det håndtere ikke-engelsk tekst?

Ja — velg matchende språk fra velgeren. Første OCR-kjøring på det språket laster ned modellen (3–14 MB) og bufrer den etterpå. Støttede språk inkluderer koreansk, kinesisk (forenklet og tradisjonell), japansk, arabisk, hindi, spansk, fransk, tysk, portugisisk, italiensk, russisk og flere. Bilder med blandede språk fungerer best når du velger det dominerende språket.

Hva med håndskrift?

Håndskriftgjenkjenning er svak. Tesseract er trent på trykt tekst og sliter med skråskrift eller rotete skrift. Leselig blokkbokstav-håndskrift gir brukbare, men ufullkomne resultater; skråskrift fungerer vanligvis ikke i det hele tatt.

Lagrer dere bildene mine eller den uthentede teksten?

Nei. Vi lagrer ikke bildene du slipper inn eller teksten OCR produserer. Alt forkastes når du lukker eller oppdaterer fanen — ingen logger, ingen oppføring på vår side av hva du OCR-et. Du kan verifisere i nettleserens utviklerverktøy.