Magandang araw.
Marahil, ang bawat PC user ay nakatagpo ng isang katulad na problema: binuksan mo ang isang web page o isang dokumentong Microsoft Word - at sa halip ng teksto na makikita mo ang mga hieroglyphs (iba't ibang mga "quercos", hindi kilalang mga titik, mga numero, atbp (tulad ng sa larawan sa kaliwa ...)).
Well, kung ikaw ang dokumentong ito (na may mga hieroglyphs) ay hindi partikular na mahalaga, at kung kailangan mong basahin ito! Kadalasan, ang mga naturang katanungan at mga kahilingan upang makatulong sa pagtuklas ng naturang mga teksto ay hiniling din sa akin. Sa ganitong maliit na artikulo nais kong isaalang-alang ang pinakasikat na mga kadahilanan para sa hitsura ng mga hieroglyph (siyempre, at alisin ang mga ito).
Mga Hieroglyph sa mga tekstong file (.txt)
Ang pinakasikat na problema. Ang katotohanan ay ang isang text file (kadalasan sa format ng txt, ngunit ang mga ito ay mga format din: php, css, info, atbp.) Ay maaaring i-save sa iba't ibang mga pag-encode.
Coding - Ito ay isang hanay ng mga character na kinakailangan upang lubos na matiyak na ang teksto ay nakasulat sa isang tiyak na alpabeto (kabilang ang mga numero at mga espesyal na character). Higit pa rito dito: //ru.wikipedia.org/wiki/Symbol_set
Kadalasan, isang bagay ang nangyayari: ang dokumento ay nagbubukas lamang sa maling pag-encode, na nagiging sanhi ng pagkalito, at sa halip na ang code ng ilang mga character, ang iba ay tatawagan. Ang iba't ibang mga hindi malirip na simbolo ay lumilitaw sa screen (tingnan ang fig 1) ...
Fig. 1. Notepad - isang problema sa pag-encode
Paano haharapin ito?
Sa palagay ko ang pinakamahusay na pagpipilian ay ang pag-install ng isang advanced na notepad, halimbawa, Notepad ++ o Bred 3. Tingnan natin ang bawat isa sa kanila.
Notepad ++
Opisyal na site: //notepad-plus-plus.org/
Isa sa mga pinakamahusay na notebook para sa parehong mga gumagamit ng baguhan at mga propesyonal. Mga pros: libreng programa, sumusuporta sa wikang Ruso, gumagana nang mabilis, highlight ang code, binubuksan ang lahat ng mga karaniwang mga format ng file, isang malaking bilang ng mga pagpipilian ay nagbibigay-daan sa iyo upang i-customize ito para sa iyong sarili.
Sa mga tuntunin ng mga encodings ay karaniwang isang kumpletong pagkakasunud-sunod: mayroong isang hiwalay na seksyon na "Encodings" (tingnan ang Larawan 2). Subukan lang ang pagpapalit ng ANSI sa UTF-8 (halimbawa).
Fig. 2. Baguhin ang coding sa Notepad ++
Pagkatapos ng pagbabago sa encoding, ang aking teksto ng dokumento ay naging normal at nababasa - ang mga hieroglyph ay nawala (tingnan ang Larawan 3)!
Fig. 3. Ang teksto ay naging nababasa ... Notepad ++
Kumuha ng 3
Opisyal na site: //www.astonshell.ru/freeware/bred3/
Isa pang mahusay na programa na dinisenyo upang ganap na palitan ang karaniwang notebook sa Windows. Gumagana rin ang "madali" na may maraming mga pag-encode, madaling binabago ang mga ito, sumusuporta sa isang malaking bilang ng mga format ng file, at sumusuporta sa bagong Windows OS (8, 10).
Sa pamamagitan ng paraan, ang Bred 3 ay tumutulong sa marami kapag nagtatrabaho sa "lumang" mga file na naka-save sa mga format ng MS DOS. Kapag ang ibang mga programa ay nagpapakita lamang ng mga hieroglyphs - Ang Bred 3 ay madaling bubukas ang mga ito at pinapayagan kang magtrabaho sa kanila nang mahinahon (tingnan ang Larawan 4).
Fig. 4. BRED3.0.3U
Kung sa halip ng mga teksto ng hieroglyphs sa Microsoft Word
Ang unang bagay na kailangan mong bigyang-pansin ay ang format ng file. Ang katotohanan ay dahil ang Word 2007 ay lumitaw ang isang bagong format - "docx" (ginamit itong "doc"). Karaniwan, sa "lumang" Salita hindi ka maaaring magbukas ng mga bagong format ng file, ngunit kung minsan ay nangyayari na ang mga bagong "file" na ito ay bukas sa lumang programa.
Buksan lamang ang mga katangian ng file at pagkatapos ay tumingin sa tab na Mga Detalye (tulad ng sa Figure 5). Kaya alam mo ang format ng file (sa Fig. 5 - ang format ng file ay "txt").
Kung ang format ng docx file ay ang iyong lumang Salita (sa ibaba ng 2007 na bersyon), pagkatapos ay i-upgrade ang Salita hanggang 2007 o mas mataas (2010, 2013, 2016).
Fig. 5. Mga katangian ng file
Bukod dito, kapag nagbukas ng isang file, bigyang pansin (sa pamamagitan ng default, ang pagpipiliang ito ay laging nasa, kung hindi mo kailangang maunawaan kung ano ang build), pagkatapos ay hihilingin sa iyo ng Word: sa anong pag-encode upang buksan ang file (lumilitaw ang mensaheng ito sa anumang pahiwatig) pagbubukas ng file, tingnan ang fig.5).
Fig. 6. Salita - file ng conversion
Kadalasan, ang Salita ay awtomatikong tinutukoy ang nais na encoding mismo, ngunit ang teksto ay hindi palaging nababasa. Kailangan mong itakda ang slider sa ninanais na pag-encode kapag nababasa ang teksto. Kung minsan, kailangan mong literal na hulaan kung paano nai-save ang file upang mabasa ito.
Fig. 7. Salita - ang file ay normal (ang encoding ay pinili nang tama)!
Baguhin ang encoding sa browser
Kapag mali ang browser na tumutukoy sa pag-encode ng isang web page, makikita mo nang eksakto ang parehong mga hieroglyph (tingnan ang Larawan 8).
Fig. 8. mali ang tinutukoy ng browser na encoding
Upang itama ang display ng site: baguhin ang encoding. Ginagawa ito sa mga setting ng browser:
- Google chrome: parameter (icon sa kanang itaas na sulok) / mga advanced na parameter / encoding / Windows-1251 (o UTF-8);
- Firefox: kaliwa pindutan ng ALT (kung naka-off ang tuktok panel), pagkatapos tingnan / pag-coding ng pahina / piliin ang nais na (pinaka-madalas na Windows-1251 o UTF-8);
- Opera: Opera (pula icon sa itaas na kaliwang sulok) / pahina / encoding / piliin ang nais na.
PS
Kaya, sa artikulong ito, ang mga madalas na mga kaso ng paglitaw ng mga hieroglyph na nauugnay sa hindi tamang tinukoy na pag-encode ay sinuri. Sa tulong ng mga pamamaraan sa itaas - maaari mong malutas ang lahat ng mga pangunahing problema sa maling pag-encode.
Gusto kong magpasalamat sa mga karagdagan sa paksa. Good luck 🙂