UTF8 kodeeringu kasutamine

Allikas: Kuutõrvaja
Redaktsioon seisuga 14. oktoober 2008, kell 07:44 kasutajalt Imre (arutelu | kaastöö) (Uus lehekülg: ===Faili kodeeringu kindlakstegemine=== Olgu tegemist failiga, mille sisuks on mingi tekst ning on tarvis kindlaks teha selle teksti kodeering, näiteks valideerida, kas tegu on UTF8...)
(erin) ←Vanem redaktsioon | Viimane redaktsiooni (erin) | Uuem redaktsioon→ (erin)

Faili kodeeringu kindlakstegemine

Olgu tegemist failiga, mille sisuks on mingi tekst ning on tarvis kindlaks teha selle teksti kodeering, näiteks valideerida, kas tegu on UTF8 kodeeringus tekstiga. Selleks sobib kasutada programmi od

 $ od -x utf8.txt
 0000000 c354 c3b6 74b6 0000
 0000007

Baidid failis esinemise järjekorras väljakirjutatuna on

54 c3 b6 c3 b6 74

Kust on näiteks tabeli http://www.utf8-chartable.de/ abil võimalik veenduda, et tegu on UTF8 kodeeringus sõnega 'Tööt.