Oznaka črkovanja v HTML5

Nastavitev kodiranja znakov v HTML5

Pred uvedbo HTML5, nastavite kodiranje znakov na dokumentu z elementom, ki ga potrebujete, da napišete nekoliko verbalno vrstico, prikazano spodaj. To so elementi Meta Charset, če ste na svoji spletni strani uporabljali HTML4:

V tej kodi je pomembno, da se oznake, ki jih vidite okoli atributa vsebine : content = " text / html; charset = iso-8859-1 " . Kot vsi atributi HTML, te narekovaje določajo vrednost atributa, kar pomeni, da je celoten niz besedila / html; charset = iso-8959-1 je vsebina tega elementa . To je pravilen HTML in kako naj bi bil ta niz napisan. Prav tako je gobec dolg in grd! Tudi to ne bi bilo, kar bi se verjetno spominjalo na vrh tvoje glave! V večini primerov bi spletni razvijalci morali kopirati in prilepiti to kodo z ene strani v katero koli novo, ki so jo razvijali, ker je to pisanje iz začetka zahtevalo veliko.

HTML5 izprazni ekstra & # 34; Stuff & # 34;

HTML5 ni dodal le številnih novih elementov v jezik, temveč je tudi močno poenostavil veliko sintakse HTML, vključno z elementom Meta Charset. S pomočjo HTML5 lahko dodate kodiranje znakov s precej lažjim snemanjem za element META, ki vidite spodaj:

Primerjaj to poenostavljeno skladnjo s tistim, kar smo napisali na začetku tega članka, staro sintakso, uporabljeno za HTML4, in videli boste, koliko je lažje pisati in se spomniti na različico HTML5. Namesto tega, da bi to morali kopirati in prilepiti iz obstoječe spletne strani v katero koli novo, na kateri ste delali, je to popolnoma nekaj, kar se lahko kot spletni razvijalec v spominu spomnite. Ta prihranek časa veliko ni veliko, toda ko razmislite o drugih sintaksnih področjih, ki jih je poenostavil HTML5, se prihranki ujemajo!

Vedno vključite kodiranje znakov

Vedno morate vključiti kodiranje znakov za svoje spletne strani, tudi če niste nikoli namenili nobenih posebnih znakov . Če ne vnesete kodiranja znakov, vaša spletna stran postane občutljiva na navzkrižni skriptni napad z uporabo UTF-7.

V tem scenariju anattacker vidi, da vašo spletno mesto nima določenega kodiranja znakov, zato brskalnik prebuja, da je kodiranje znakov dejansko UTF-7. Nato napadalec vnese skripte UTF-7 v spletno stran in vaše spletno mesto je hacked. To je očitno problematično za vse vpletene, od vašega podjetja do obiskovalcev. Dobra novica je, da se preprosto izognemo - preprosto dodajte kodiranje znakov na vse vaše spletne strani.

Kje dodati kodiranje znakov

Kodiranje znakov za spletno stran mora biti prva vrstica elementa elementa HTML. To zagotavlja, da brskalnik ve, kaj je kodiranje znakov, preden naredi kaj drugega na strani, razen da določi doktif in ugotovi, da je HTML stran. Vaš HTML bi se moral glasiti:

...

Uporaba zaganj HTTP za dodatno varnost

Določite lahko tudi kodiranje znakov v glavi HTTP. To je še bolj varno, kot ga dodate na stran HTML, vendar ste imeli dostop do konfiguracij strežnika ali .htaccess datotek, kar pomeni, da boste morda morali delati s ponudnikom spletnega gostovanja, da bi pridobili to vrsto dostopa ali pa jih boste naredili spremembe za vas. Dostop je res izziv tukaj. Sprememba je preprosta, zato mora vsak ponudnik gostovanja omogočiti to spremembo za vašo relativno enostavno.

Če uporabljateApache, lahko nastavite privzeti niz znakov za celotno spletno mesto tako, da dodate: AddDefaultCharset UTF-8 v vašo datoteko .htaccess . Apachejev privzeti niz znakov je ISO-8859-1 .