Text recognition software

Bilang isang patakaran, pagdating sa mga programa para sa pagkilala sa na-scan na teksto (OCR, optical character recognition), ang karamihan sa mga gumagamit ay naaalaala ang tanging produkto - ABBYY FineReader, na walang alinlangan ang pinuno sa gayong software sa Russia at isa sa mga pinuno sa mundo.

Gayunpaman, ang FineReader ay hindi lamang ang solusyon sa ganitong uri: may mga libreng programa para sa pagkilala ng teksto, mga serbisyong online para sa parehong mga layunin at, bukod dito, ang mga naturang function ay naroroon din sa ilang pamilyar na mga programa na maaaring naka-install na sa iyong computer . Susubukan kong isulat ang lahat ng ito sa artikulong ito. Ang lahat ng mga itinuturing na programa ay gumagana sa Windows 7, 8 at XP.

Text Recognition Leader - ABBYY Finereader

Tungkol sa FineReader (binibigkas bilang Fine Reader) narinig, marahil, karamihan sa iyo. Ang program na ito ay ang pinakamahusay o isa sa mga pinakamahusay para sa mataas na kalidad na pagkilala ng teksto sa Russian. Ang programa ay binabayaran at ang presyo ng isang lisensya para sa paggamit ng bahay ay bahagyang mas mababa sa 2000 rubles. Posible ring i-download ang trial na bersyon ng FineReader o gamitin ang pagkilala ng online na teksto sa ABBYY Fine Reader Online (maaari mong makilala ang ilang pahina nang libre, pagkatapos - para sa isang bayad). Ang lahat ng ito ay magagamit sa opisyal na site ng nag-develop //www.abbyy.ru.

Ang pag-install ng trial na bersyon ng FineReader ay hindi naging sanhi ng anumang problema. Ang software ay maaaring maisama sa Microsoft Office at Windows Explorer upang mapadali ang pagpapatakbo. Ng mga limitasyon ng bersyon ng libreng pagsubok - 15 araw na paggamit at kakayahang makilala nang hindi hihigit sa 50 na pahina.

Screenshot para sa pagsubok ng software ng pagkilala

Dahil wala akong scanner, gumamit ako ng isang snapshot mula sa isang mababang kalidad na kamera ng telepono, kung saan ako ay bahagyang na-edit ang kaibahan, upang suriin. Ang kalidad ay hindi maganda, tingnan natin kung sino ang maaaring hawakan ito.

Menu FineReader

Ang FineReader ay maaaring makakuha ng isang graphic na imahe ng teksto nang direkta mula sa scanner, mula sa mga graphic file o camera. Sa aking kaso, ito ay sapat na upang buksan ang file ng imahe. Ako ay nasisiyahan sa resulta - lamang ng ilang mga pagkakamali. Sasabihin ko kaagad na ito ang pinakamahusay na resulta ng lahat ng sinubukan na mga programa kapag nagtatrabaho kasama ang halimbawang ito - isang katulad na kalidad ng pagkilala lamang sa libreng online na serbisyo Libreng Online OCR (ngunit sa pagsusuri na ito ay nagsasalita kami tungkol lamang sa software, hindi pagkilala sa online).

Ang resulta ng pagkilala ng teksto sa FineReader

Lantaran, ang FineReader ay malamang na walang kakumpitensiya para sa mga tekstong Cyrillic. Ang mga pakinabang ng programa ay hindi lamang ang kalidad ng pagkilala ng teksto, kundi pati na rin ang malawak na pag-andar, pag-format ng suporta, karampatang pag-export sa maraming mga format, kabilang ang Word docx, pdf at iba pang mga tampok. Kaya, kung ang gawain ng OCR ay isang bagay na patuloy mong nakatagpo, pagkatapos ay huwag ikinalulungkot ang medyo maliit na halaga ng pera at babayaran ito: magliligtas ka ng isang malaking halaga ng oras, mabilis na nakakakuha ng mga resulta ng kalidad sa FineReader. Sa pamamagitan ng paraan, hindi ako nag-advertise ng kahit ano - sa tingin ko talagang na ang mga taong kailangan upang makilala ang higit sa isang dosenang mga pahina ay dapat isipin ang tungkol sa pagbili ng ganoong software.

Ang CuneiForm ay isang libreng text recognition program.

Sa aking kuru-kuro, ang pangalawang pinakapopular na programa ng OCR sa Russia ay ang libreng CuneiForm, na maaaring ma-download mula sa opisyal na site //cognitiveforms.ru/products/cuneiform/.

Ang pag-install ng programa ay napaka-simple, hindi ito sinusubukan na mag-install ng anumang software ng third-party (tulad ng maraming libreng software). Ang interface ay maigsi at malinaw. Sa ilang mga kaso, ang pinakamadaling paraan upang gamitin ang wizard, na siyang una sa mga icon sa menu.

Gamit ang sample na ginamit ko sa FineReader, ang programa ay hindi nakayanan, o, mas tiyak, nagbigay ng isang bagay na hindi maayos na nababasa at mga fragment ng mga salita. Ang ikalawang pagtatangka ay ginawa gamit ang isang screenshot ng teksto mula sa site ng programang ito mismo, na kung saan, gayunpaman, ay dapat na tumaas (kailangan nito ang mga pag-scan na may resolusyon na 200dpi at mas mataas, hindi ito nagbabasa ng mga screenshot na may lapad na linya ng font na 1-2 pixel). Narito na rin siya (ang ilan sa mga teksto ay hindi nakilala, dahil pinili lamang ang Russian).

Pagkilala ng teksto ng CuneiForm

Kaya, maaari naming isipin na ang CuneiForm ay isang bagay na dapat mong subukan, lalo na kung mayroon kang mga naka-scan na pahina na may mataas na kalidad at nais mong makilala ang mga ito nang libre.

Microsoft OneNote - isang programa na maaaring mayroon ka

Sa Microsoft Office, na nagsisimula sa bersyon 2007 at nagtatapos sa kasalukuyang, 2013, mayroong isang programa para sa pagkuha ng mga tala - OneNote. Mayroon din itong mga tampok sa pagkilala ng teksto. Upang magamit ito, i-paste lamang ang na-scan o anumang iba pang imahen na teksto sa tala, i-right-click ito at gamitin ang menu ng konteksto. Tandaan ko na ang default para sa pagkilala ay nakatakda sa Ingles.

Pagkilala sa Microsoft OneNote

Hindi ko masasabi na ang teksto ay lubos na kinikilala, ngunit, hangga't masasabi ko, ito ay medyo mas mahusay kaysa sa CuneiForm. Plus ang programa, tulad ng nabanggit na, ay may malaking posibilidad na naka-install na ito sa iyong computer. Kahit na, siyempre, ang paggamit nito sa kaso ng pangangailangan upang gumana sa isang malaking bilang ng mga na-scan na mga dokumento ay malamang na hindi maginhawa, sa halip, ito ay angkop para sa mabilis na pagkilala ng mga business card.

Ang OmniPage Ultimate, OmniPage 18 - ay dapat na isang bagay na napaka-cool

Hindi ko alam kung gaano kahusay ang OmniPage text recognition software ay: walang mga trial na bersyon, hindi ko nais na i-download ito sa isang lugar. Ngunit, kung ang presyo nito ay nabigyang-katarungan, at ito ay nagkakahalaga ng tungkol sa 5,000 rubles sa bersyon para sa indibidwal na paggamit at hindi Ultimate, pagkatapos ito ay dapat na isang bagay na kahanga-hanga. Pahina ng Programa: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Ang presyo ng software ng OmniPage

Kung nabasa mo ang mga katangian at mga review, kabilang ang mga nasa Russian-language publication, nalaman nila na ang OmniPage ay talagang nagbibigay ng mataas na kalidad at tumpak na pagkilala, kabilang ang sa Russian, medyo madaling i-disassemble hindi ang pinakamataas na kalidad na pag-scan at nagbibigay ng isang hanay ng mga karagdagang tool. Ng mga drawbacks, hindi ito ang pinaka-maginhawa, lalo na para sa isang baguhan user, interface. Gayunpaman, sa Western market OmniPage ay isang direktang katunggali ng FineReader at sa mga rating ng wikang Ingles na nakikipaglaban sila nang tumpak sa kanilang sarili, at sa gayon, sa palagay ko, ang programa ay dapat maging karapat-dapat.

Ito ay hindi lahat ng mga programa ng ganitong uri, mayroon ding iba't ibang mga opsyon para sa mga maliliit na libreng programa, ngunit habang nakikipag-eksperimento sa kanila natagpuan ko ang dalawang pangunahing disadvantages na likas sa kanila: kakulangan ng Cyrillic suporta, o iba, hindi masyadong kapaki-pakinabang na software sa kit ng pag-install, at samakatuwid ay nagpasya na huwag banggitin dito

Panoorin ang video: How Does Optical Character Recognition OCR Work? (Mayo 2024).