Kilalanin ang teksto sa isang PDF file online.


Hindi laging posible na kunin ang teksto mula sa isang PDF file gamit ang maginoo pagkopya. Kadalasan ang mga pahina ng naturang mga dokumento ay ang na-scan na nilalaman ng kanilang mga bersyon ng papel. Upang i-convert ang mga naturang mga file sa ganap na mae-edit na data ng teksto, ang mga espesyal na programa sa paggamit ng Optical Character Recognition (OCR) ay ginagamit.

Ang mga ganitong solusyon ay napakahirap ipatupad at, samakatuwid, nagkakahalaga ng maraming pera. Kung kailangan mong kilalanin ang teksto na may regular na PDF, ipinapayong mabili ang naaangkop na programa. Para sa mga bihirang kaso, magiging mas lohikal na gamitin ang isa sa magagamit na mga serbisyong online na may katulad na mga pag-andar.

Paano makilala ang teksto mula sa PDF online

Siyempre, ang hanay ng tampok na serbisyo ng OCR sa online ay mas limitado kumpara sa buong mga solusyon sa desktop. Ngunit maaari kang gumana sa gayong mga mapagkukunan para sa libre, o para sa isang nominal na bayad. Ang pangunahing bagay ay na ang kaukulang mga aplikasyon sa web ay nakayanan ang kanilang pangunahing gawain, katulad ng pagkilala ng teksto, pati na rin.

Paraan 1: ABBYY FineReader Online

Ang serbisyo sa pagpapaunlad ng kumpanya ay isa sa mga lider sa larangan ng optical recognition ng dokumento. Ang ABBYY FineReader para sa Windows at Mac ay isang napakalakas na solusyon para sa pag-convert ng PDF sa text at nagtatrabaho dito.

Ang web counterpart ng programa, siyempre, ay mas mababa sa mga ito sa pag-andar. Gayunpaman, maaaring makilala ng serbisyo ang teksto mula sa mga pag-scan at mga larawan sa higit sa 190 mga wika. Sinusuportahan ang conversion ng mga PDF file sa mga dokumento Word, Excel, atbp.

ABBYY FineReader Online na online na serbisyo

  1. Bago ka magsimulang magtrabaho sa tool, lumikha ng isang account sa site o mag-log in gamit ang iyong Facebook, Google o Microsoft account.

    Upang pumunta sa window ng pag-login, mag-click sa pindutan. "Pag-login" sa tuktok na menu bar.
  2. Sa sandaling naka-log in, i-import ang nais na PDF na dokumento sa FineReader gamit ang pindutan "Mag-upload ng Mga File".

    Pagkatapos ay mag-click "Piliin ang mga numero ng pahina" at tukuyin ang nais na span para sa pagkilala ng teksto.
  3. Susunod, piliin ang mga wika na naroroon sa dokumento, ang format ng resultang file at mag-click sa pindutan "Kilalanin".
  4. Pagkatapos ng pagproseso, ang haba ng panahon ay nakasalalay sa kabuuan sa laki ng dokumento, maaari mong i-download ang natapos na file gamit ang data ng teksto sa pamamagitan lamang ng pag-click sa pangalan nito.

    O i-export ito sa isa sa mga magagamit na serbisyo ng ulap.

Ang serbisyo ay nakikilala, marahil, sa pamamagitan ng mga pinaka-tumpak na algorithm sa pagkilala ng teksto sa mga imahe at mga file na PDF. Ngunit, sa kasamaang-palad, ang libreng paggamit nito ay limitado sa limang pahina na naproseso bawat buwan. Upang gumana nang may mas maraming mga dokumento, kailangan mong bumili ng isang isang taon na subscription.

Gayunpaman, kung ang OCR function ay napaka-bihirang, ang ABBYY FineReader Online ay isang mahusay na pagpipilian para sa pagkuha ng teksto mula sa maliit na mga PDF file.

Paraan 2: Libreng Online na OCR

Simple at maginhawang serbisyo para sa pag-digitize ng teksto. Kung wala ang pangangailangan para sa pagpaparehistro, ang mapagkukunan ay nagbibigay-daan sa iyo upang makilala ang 15 buong PDF-pahina kada oras. Libreng Online OCR ganap na gumagana sa mga dokumento sa 46 wika at walang awtorisasyon sumusuporta sa tatlong mga format ng pag-export ng teksto - DOCX, XLSX at TXT.

Kapag nagrerehistro, ang user ay maaaring magproseso ng mga dokumento ng maraming pahina, ngunit ang libreng bilang ng mga pahinang ito ay limitado sa 50 unit.

Libreng Online OCR na serbisyong online

  1. Upang makilala ang teksto mula sa PDF bilang isang "guest", walang pahintulot sa mapagkukunan, gamitin ang naaangkop na form sa pangunahing pahina ng site.

    Piliin ang nais na dokumento gamit ang pindutan "File", tukuyin ang pangunahing wika ng teksto, format ng output, pagkatapos ay hintayin ang pag-load at pag-click ng file "I-convert".
  2. Sa dulo ng proseso ng pag-digitize, mag-click "I-download ang File ng Output" upang i-save ang natapos na dokumento gamit ang teksto sa computer.

Para sa mga awtorisadong gumagamit, ang pagkakasunod-sunod ng mga aksyon ay medyo naiiba.

  1. Gamitin ang pindutan "Pagpaparehistro" o "Pag-login" sa itaas na bar ng menu sa, ayon sa pagkakabanggit, lumikha ng isang account na Free Online OCR o pumasok dito.
  2. Pagkatapos ng awtorisasyon sa panel ng pagkilala, pindutin nang matagal ang key "CTRL", pumili ng hanggang sa dalawang wika ng pinagmulang dokumento mula sa listahan na ibinigay.
  3. Tukuyin ang karagdagang mga pagpipilian para sa pagkuha ng teksto mula sa PDF at i-click ang pindutan. "Piliin ang File" upang i-load ang dokumento sa serbisyo.

    Pagkatapos, upang simulan ang pagkilala, mag-click "I-convert".
  4. Pagkatapos maiproseso ang dokumento, mag-click sa link gamit ang pangalan ng output file sa nararapat na haligi.

    Ang resulta ng pagkilala ay kaagad na nakaimbak sa memorya ng iyong computer.

Kung kailangan mong kunin ang teksto mula sa isang maliit na dokumentong PDF, maaari mong ligtas na gamitin ang tool na inilarawan sa itaas. Upang gumana sa malalaking file, kailangan mong bumili ng karagdagang mga simbolo sa Free Online OCR o resort sa isa pang solusyon.

Paraan 3: NewOCR

Ganap na libreng OCR-service na nagbibigay-daan sa iyo upang kunin ang teksto mula sa halos anumang mga graphic at elektronikong mga dokumento tulad ng DjVu at PDF. Ang mapagkukunan ay hindi nagpapataw ng mga paghihigpit sa laki at bilang ng mga nakikilalang mga file, hindi nangangailangan ng pagpaparehistro, at nag-aalok ng malawak na hanay ng mga nauugnay na function.

Sinusuportahan ng NewOCR ang 106 na mga wika at nakakapag-ingat nang tama kahit ang mga pag-scan sa dokumento na may mababang kalidad. Posibleng manu-manong piliin ang lugar para sa pagkilala ng teksto sa pahina ng file.

Online na serbisyo NewOCR

  1. Kaya, maaari kang magsimulang magtrabaho agad sa mapagkukunan, nang walang pangangailangan na magsagawa ng mga hindi kinakailangang pagkilos.

    Direkta sa pangunahing pahina na may isang form para sa pag-import ng dokumento sa site. Upang mag-upload ng isang file sa NewOCR, gamitin ang pindutan "Pumili ng file" sa seksyon "Piliin ang iyong file". Pagkatapos ay sa patlang "(Mga) wika ng pagkilala" pumili ng isa o higit pang mga wika ng source document, pagkatapos ay i-click "Mag-upload ng + OCR".
  2. Itakda ang iyong mga ginustong mga setting ng pagkilala, piliin ang ninanais na pahina upang kunin ang teksto, at i-click ang pindutan. "OCR".
  3. Mag-scroll pababa nang kaunti at hanapin ang pindutan. I-download.

    Mag-click dito at sa listahan ng drop-down piliin ang kinakailangang format ng dokumento para sa pag-download. Pagkatapos nito, maa-download ang natapos na file sa nakuha na teksto sa iyong computer.

Ang tool ay maginhawa at kinikilala ang lahat ng mga character sa isang sapat na mataas na kalidad. Gayunpaman, ang pagproseso ng bawat pahina ng na-import na dokumentong PDF ay dapat na mailabas nang nakapag-iisa at ipinapakita sa isang hiwalay na file. Maaari mong, siyempre, agad na kopyahin ang mga resulta ng pagkilala sa clipboard at pagsamahin ang mga ito sa iba.

Gayunpaman, na binigyan ng pangalang nasa itaas, maraming teksto na gumagamit ng NewOCR ay napakahirap kunin. Gamit ang parehong maliit na mga file copes serbisyo "sa isang putok."

Paraan 4: OCR.Space

Ang isang simple at madaling maintindihan na mapagkukunan para sa pag-digitize ng teksto ay nagbibigay-daan sa iyo upang makilala ang mga dokumentong PDF at output ang resulta sa isang TXT file. Walang mga limitasyon sa bilang ng mga pahina. Ang tanging limitasyon ay ang laki ng dokumento ng input ay hindi dapat lumagpas sa 5 megabytes.

OCR.Space online service

  1. Hindi kinakailangan ang rehistro upang gumana sa tool.

    I-click lamang ang link sa itaas at i-upload ang PDF na dokumento sa website mula sa iyong computer gamit ang button "Pumili ng file" o mula sa network - sa pamamagitan ng sanggunian.
  2. Sa listahan ng dropdown "Piliin ang wika ng OCR" piliin ang wika ng na-import na dokumento.

    Pagkatapos ay simulan ang proseso ng pagkilala ng teksto sa pamamagitan ng pag-click sa pindutan. "Magsimula OCR!".
  3. Sa dulo ng pagpoproseso ng file, tingnan ang resulta sa "OCR'ed Result" at mag-click I-downloadupang i-download ang natapos na dokumentong TXT.

Kung kailangan mo lang kunin ang teksto mula sa PDF at ang pangwakas na pag-format ay hindi mahalaga sa lahat, OCR.Space ay isang mahusay na pagpipilian. Ang tanging dokumento ay dapat na "monolingual", dahil ang pagkilala ng dalawa o higit pang mga wika sa parehong oras sa serbisyo ay hindi ibinigay.

Tingnan din ang: Libreng analogues FineReader

Pag-evaluate ng mga online na tool na iniharap sa artikulo, dapat tandaan na ang FineReader Online mula sa ABBYY ang humahawak sa OCR function nang tumpak at tumpak. Kung ang pinakamataas na katumpakan ng pagkilala ng teksto ay mahalaga para sa iyo, pinakamahusay na partikular na isaalang-alang ang pagpipiliang ito. Ngunit upang bayaran ito, malamang, mayroon din.

Kung kailangan mong i-digitize ang maliliit na dokumento at handa ka nang iwasto ang mga pagkakamali sa serbisyo sa iyong sarili, ipinapayong gamitin NewOCR, OCR.Space o Free Online OCR.

Panoorin ang video: Top 25 Word 2016 Tips and Tricks (Mayo 2024).