Kratek uvod v kodiranje URL-jev

URL spletnega mesta , znan tudi kot »naslov spletnega mesta«, je tisto, kar bi nekdo vstopil v spletni brskalnik, da bi dostopal do določenega spletnega mesta. Ko podatke prenašate prek URL-ja, se morate prepričati, da uporablja le določene znake. Ti dovoljeni znaki vključujejo abecedne znake, številke in nekaj posebnih znakov, ki imajo pomen v nizu URL-jev. Vsi drugi znaki, ki jih je treba dodati URL-ju, morajo biti kodirani tako, da med potovanjem brskalnika ne povzročajo težav pri iskanju strani in virov, ki jih iščete.

Kodiranje URL-ja

Najpogosteje kodirani znak v URL-ju je znak . Ta znak vidite, ko v URL-ju vidite znak plus (+). To predstavlja vesoljski značaj. Znak plus deluje kot poseben znak, ki predstavlja ta prostor v URL-ju. Najpogostejši način, ki ga boste videli, je povezava mailto, ki vključuje predmet. Če želite, da ima subjekt v njej presledke, jih lahko kodirate kot pluse:

mailto: email? subject = to + je + moj + predmet

Ta bit kodiranja besedila bi posredoval predmet »to je moj predmet«. Znak "+" v kodiranju bi bil nadomeščen z dejanskim , ko je prikazan v brskalniku.

Za kodiranje URL-ja preprosto zamenjate posebne znake s svojim kodirnim nizom. To se bo skoraj vedno začelo z znakom%.

Kodiranje URL-ja

Natančno gledano, vedno morate kodirati vse posebne znake, ki jih najdete v URL-ju. Ena pomembna opomba, če v tem govoru ali kodiranju počutite malo zastrašeno, je, da v URL-ju običajno ne najdete nobenih posebnih znakov zunaj običajnega konteksta, razen s podatki o obrazcu.

Večina URL-jev uporablja preproste znake, ki so vedno dovoljeni, zato sploh ni potrebno kodiranje.

Če pošljete podatke skriptam CGI z uporabo metode GET, morate podatke kodirati, ker bodo poslani po URL-ju. Če na primer pišete povezavo za promocijo RSS , bo vaš URL treba kodirati, da ga dodate v URL skripta, ki ga oglašujete.

Kaj bi morali kodirati?

Vsak znak, ki ni abecedni znak, številka ali poseben znak, ki se uporablja zunaj običajnega konteksta, bo moral biti kodiran na vaši strani. Spodaj je tabela skupnih znakov, ki jih lahko najdete v URL-ju in njihovem kodiranju.

URL kodiranje rezerviranih znakov

Znak Namen v URL-ju Kodiranje
: Ločeni protokol (http) iz naslova % 3B
/ Ločena domena in imeniki % 2F
# Ločite sidra % 23
? Ločeni niz poizvedb % 3F
& Ločeni elementi poizvedb % 24
@ Ločite uporabniško ime in geslo iz domene % 40
% Označuje kodiran znak % 25
+ Označuje prostor % 2B
Ni priporočljivo v URL-jih % 20 ali +

Upoštevajte, da so ti kodirani primeri drugačni od tistih, ki jih najdete s posebnimi znaki HTML . Če na primer potrebujete kodiranje URL z znakom ampersand (&), bi uporabili% 24, kar je prikazano v zgornji tabeli. Če ste zapisali HTML in ste želeli dodati ampersand v besedilo, ne morete uporabiti% 24. Namesto tega bi uporabili "& amp;"; ali "& # 38;", pri čemer bi oba napisala & na strani HTML pri prikazu. To se morda zdi zmedeno, vendar je v bistvu razlika med besedilom, ki se pojavi na sami strani, ki je del kode HTML in nizu URL-jev, ki je ločen subjekt in zato veljajo različna pravila.

Dejstvo, da se znak "&", kot tudi mnogi drugi znaki, lahko pojavijo v vsaki, ne bi smeli zamenjati z razlikami med obema.

Izvorni članek Jennifer Krynin. Uredil Jeremy Girard.