4 brezplačna spletna orodja za OCR, ki so na preizkusu

4 brezplačna spletna orodja za OCR, ki so na preizkusu

Če želite tiskano besedilo pretvoriti v digitalno besedilo, ki ga lahko kopirate, prilepite, urejate in iščete, morate uporabiti optične bralnike optičnega prepoznavanja znakov (OCR).





Ko se odločite za skeniranje ali fotografiranje dokumenta, bo ta shranjen v obliki, kot sta JPEG ali PDF. OCR programska oprema lahko nato prepozna črke in številke v teh dokumentih ter jih pretvori v PDF, ki ga je mogoče iskati, ali v datoteko, ki jo lahko urejate v programih, kot je Microsoft Word.





Težava je v tem, da nekateri optični bralniki OCR delujejo veliko bolje kot drugi, najboljši pa so precej težki v denarnici.





Omnipage18 na primer stane 150 USD, vendar je še posebej dober pri prepoznavanju različnih jezikov. Adobe Acrobat Pro DC stane 400 $, vendar ima neverjetno natančnost. ABBYY FineReader stane 150 USD, vendar je odličen pri pretvorbi dokumentov, kot so revije in brošure, v besedilo, ki ga je mogoče iskati. Kasneje v tem članku bomo testirali spletno ponudbo podjetja ABBYY.

Če pa iščete brezplačne alternative, lahko Prenesi in jih uporabljate v sistemu Windows ali OS X, morate preizkusiti ta OCR orodja. Če pa raje uporabite brezplačno, na spletu OCR orodje, nadaljujte z branjem, saj smo preizkusili nekaj najboljših z rezultati spodaj.



Preizkus

Zdi se, da večina ljudi zdaj uporablja svoje pametne telefone za njihovo skeniranje, zato sem se odločil za uporabo Evernoteova aplikacija, ki jo je mogoče skenirati (Brezplačno za iOS in Android). Prebral sem prvo stran Richarda Dawkina Plezanje na goro neverjetno , da vidimo, kakšne rezultate bi lahko dobili z zelo osnovnim oblikovanjem. Prebral sem tudi stran Tima Ferrissa 4-urni kuhar preizkusiti bralnike z nekoliko bolj zapletenim oblikovanjem. Vsako od teh datotek sem shranil kot PDF.

Ti dokumenti so bili nato pregledani skozi nekatera domnevno najboljša spletna orodja OCR, da bi ugotovili, kako dobro so se odrezali.





Brezplačni spletni OCR [ni več na voljo]

Na srečo za uporabo brezplačnega spletnega prepoznavanja znakov ni potrebna registracija. Dvojno sem bil navdušen, ko sem videl njihovo trditev, da ohranijo oblikovanje in postavitev mojega dokumenta.

Spletno mesto trdi, da lahko podpira vhodne datoteke PDF, GIF, BMP, JPEG, TIFF in PNG. Izhodi so lahko DOC, besedilni dokument PDF, RTF in TXT. Na žalost nisem mogel izvedeti, ali imajo omejitev velikosti datoteke.





Osnovni dokument v PDF

Konvertirano popolnoma. Ni veliko več za povedati! Gremo do a zelo dober začetek.

Osnovni dokument za DOC

Zdi se, da so se dejanske besede brezhibno pretvorile, razen 'ounta' iz 'Mount Rushmore', ki je nekako šel AWOL. Oblikovanje pa je druga zgodba. Mnoge vejice so bile nadomeščene s podčrtaji, na mestu v dokumentu pa so bili vstavljeni naključni presledki. Ko boste kasneje videli, kako se je v tem testu odrezala vrhunska programska oprema, to ni slab napor nasploh .

Zapleten dokument v PDF

Zapleten dokument za DOC

Tokrat je pretvorba trajala le 10 sekund, besedilo pa je bilo znova pretvorjeno s približno 95 -odstotno natančnostjo. Prišlo je do nekaj nenavadnih težav z razmikom in programska oprema je imela težave s pretvorbo pisave v zgornjem desnem kotu dokumenta in je tu in tam zgrešila nekaj znakov.

Sodba

i2OCR

i2OCR trdi nekaj impresivnih trditev. Orodje prepozna več kot 60 jezikov, lahko obravnava postavitve v več stolpcih (z odstranitvijo oblikovanja), nima omejitev velikosti datotek, lahko pretvori naložene datoteke in iz URL -jev. Tudi za uporabo tega orodja se vam ni treba registrirati.

Storitev deluje tako, da preprosto izvleče besedilo iz vaše slike in nato prikaže neoblikovano besedilo. Napake v vzporednem pogledu lahko hitro popravite, preden kopirate besedilo v druge programe ali naložite kot DOC, PDF ali HTML.

Opomba: ko sem poskušal naložiti svoje dokumente PDF, jih je i2OCR zavrnil, zato sem jih moral pretvoriti v JPEG (tako, da sem jih posnel in nato naložil datoteke).

Osnovni dokument v navadnem besedilu

Zapleten dokument v navadno besedilo

Večina besedila je bila preoblikovana brez preveč napak, razen naslova in recepta v zgornjem desnem kotu, ki za to orodje ni bil berljiv. Način pretvorbe stolpcev v navadno besedilo še zdaleč ni bil idealen. Če želite to pretvorbo izvesti, bi bilo potrebno veliko časa za preureditev vrstic v skladne stavke.

Sodba

Spletno OCR

Spletni OCR trenutno podpira 46 različnih jezikov in lahko pretvori PDF, JPG, BMP, TIFF in GIF v Word, Excel ali navadno besedilo. Spletno mesto trdi, da so „pretvorjeni dokumenti popolnoma podobni izvirniku - tabele, stolpci in grafike“.

Različica, ki jo lahko uporabljate brez registracije, vam omogoča pretvorbo do 15 slik na uro (omejitev 5 MB). Če se prijavite za račun, lahko poleg te omejitve kupite več strani, hkrati pa lahko pretvorite tudi večstranske dokumente in arhiv ZIP.

Osnovni dokument za DOC

Osnovni dokument se je brez napak pretvoril, razen rimske številke jaz ne prevzamejo. Kot je obljubilo spletno mesto, je bilo oblikovanje točno tako, kot je bilo v knjigi. Pohvala za to orodje.

Zapleten dokument za DOC

Potem ko sem bil razočaran nad prejšnjimi orodji OCR pri pretvorbi zapletenega dokumenta, sem bil nad spletnim OCR zelo navdušen. Postavitev je bila skoraj popolna, kot lahko vidite zgoraj. Tudi tokrat recept ni bil dobro izbran, vse druge manjše napake pa so bile zanemarljive.

Sodba

Popolnoma fantastični rezultati spletnega OCR. Edina pomanjkljivost, ki jo vidim, je, da pretvorjenih dokumentov ni mogoče prenesti kot PDF, saj omenjeni izhodni formati vključujejo samo DOCX, XLSX in TXT.

ABBYY FineReader Online (preskus na 10 straneh)

Kot smo že omenili, je ABBYY eden vodilnih na trgu programske opreme OCR, ki stane približno 150 USD za njihov celoten program, ki ga je mogoče prenesti. Ponujajo a 10-stranski brezplačni preizkus za njihovo spletno orodje (potrebna je registracija). Za naročnino v višini 5 USD vam njihovo spletno orodje omogoča pretvorbo 200 strani vsak mesec.

Sprejete datoteke so lahko do 100 MB v katerem koli od teh formatov: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP in PNG. ABBYY priznava tudi skoraj 200 jezikov. Izhodi so še posebej impresivni z izbiro med DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 in EPUB.

Med preizkusom lahko celo preizkusite nekaj funkcij BETA. Prva je možnost prevajanja dokumenta v drug jezik. Druga je izvoz izvoženega pretvorjenega dokumenta v vaš račun za shranjevanje v oblaku, pa naj bo to Dropbox, Google Drive, Evernote, Microsoft OneDrive ali Box.

Osnovni dokument za DOCX

Zapleten dokument v DOCX

Po pretvorbi je bilo v besedilu v dokumentu zelo malo napak (razen OCR, ki se je spet boril s pisavo tega recepta!), Vendar je oblikovanje pustilo veliko želenega.

Trije stolpci so nekako zavzeli dve strani, osrednji stolpec samo pojavlja na drugi strani. Če bi res želeli naredi karkoli s tem pretvorjenim dokumentom, bi si na koncu pustili lase.

Osnovni dokument v PDF

Zapleten dokument v PDF

Sodba

Končni rezultat

Če tako kot večina ljudi iščete le nekaj člankov v reviji in nekaj gospodinjskih računov, vam teh dokumentov ne bo treba urejati. Zato bo pretvorba neposredno v PDF primerna za vas, saj boste po teh dokumentih še vedno lahko iskali. Za to je bil brezplačni spletni OCR zagotovo najboljše brezplačno orodje, ki smo ga preizkusili. Če ste pripravljeni plačati 5 USD na mesec za skoraj popolnost, Spletni program FineReader podjetja ABBYY je bil nekoliko natančnejši.

Kar zadeva pretvorbo dokumentov v DOC, nam ni uspelo najti popolne rešitve, vendar so bili daleč najboljši rezultati Spletno OCR . Pretvorba ni bila popolna, vendar je bila celovitost oblikovanja v veliki meri ohranjena, napake pa zanemarljive. Ko te rezultate primerjamo s ponudbo 'premium' podjetja ABBYY, ne morete pomagati, ampak ste navdušeni.

V to objavo nismo vključili funkcij OCR za Google Drive; malo za Googlovo povsod, bolj pa za dejstvo, da smo želeli preizkusiti še nekaj drugih brezplačnih spletnih storitev OCR.

Za vas: Katera druga spletna orodja za OCR bi priporočili našim bralcem? In kaj ste poskusili in ga nikoli več ne bi uporabili?

Deliti Deliti Cvrkutati E-naslov Vodnik za začetnike po animaciji govora

Animacija govora je lahko izziv. Če ste pripravljeni na začetek dodajanja dialoga v svoj projekt, bomo za vas razčlenili postopek.

kako izbrisati stvari v koledarju
Preberite Naprej Sorodne teme
  • Internet
  • Produktivnost
  • Pretvorba datotek
  • OCR
O avtorju Rob Nightingale(272 objavljenih člankov)

Rob Nightingale je diplomiral iz filozofije na Univerzi v Yorku v Veliki Britaniji. Več kot pet let je delal kot vodja družbenih medijev in svetovalec, hkrati pa je imel delavnice v več državah. Zadnji dve leti je bil Rob tudi tehnološki pisec, vodja družbenih medijev MakeUseOf in urednik glasila. Običajno ga boste našli, ko potuje po svetu, se uči montaže videa in eksperimentira s fotografijo.

Več od Roba Nightingala

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e -knjige in ekskluzivne ponudbe!

Kliknite tukaj, da se naročite