Кароткае ўвядзенне ў URL Encoding

Вэб - сайта URL , таксама вядомы як "адрас вэб - сайта», гэта тое , што хто - то ўвайсці ў вэб - браўзэр для таго , каб атрымаць доступ да пэўнага вэб - сайт. Пры перадачы інфармацыі праз URL, вам неабходна пераканацца, што ён выкарыстоўвае толькі пэўныя дапушчальныя сімвалы. Гэтыя дапушчальныя сімвалы ўключаюць у сябе літарныя сімвалы, лічбы і некалькі спецыяльных сімвалаў, якія маюць сэнс у радку URL. Любыя іншыя сімвалы, якія павінны быць дададзены ў URL павінны быць закадзіраваны такім чынам, што яны не выклікаюць праблемы падчас паездкі браўзэра, каб знайсці старонкі і рэсурсы, якія вы шукаеце.

кадаванне URL

Найбольш часта закадаваны знак у URL радка з'яўляецца <прабел> характар. Вы бачыце гэты знак кожны раз, калі вы бачыце знак плюс (+) ў URL. Гэта ўяўляе сабой прабел. Знак плюс дзейнічае як спецыяльны сімвал, які ўяўляе гэта прастора ў URL. Найбольш распаўсюджаны спосаб вы ўбачыце гэта ў спасылцы MailTo, якая ўключае ў сябе тэму. Калі вы хочаце, каб пры ўмове прабелы ў ім, вы можаце кадзіраваць іх як плюсы:

MAILTO: тэма паведамлення = гэта + будзе + мой + прадмет

Гэты біт кадавання тэксту будзе перадаваць прадмет «гэта мая тэма». «+» Сімвал ў кадоўцы будзе заменены фактычным <прабел> пры яго адмалёўцы ў браўзэры.

Для кадавання URL, вы проста замяніць спецыяльныя сімвалы з іх радкі кадавання. Гэта амаль заўсёды пачынаюцца з знака%.

кадаванне URL

Строга кажучы, вы заўсёды павінны кадзіраваць любыя спецыяльныя сімвалы, знойдзеныя ў URL. Яшчэ адна важная заўвага, у выпадку, калі вы адчуваеце сябе крыху запалохаць усе гэтыя размовы або кадавання, з'яўляецца тое, што вы ўвогуле не знойдзеце якіх-небудзь адмысловых знакаў у URL за межамі іх звычайнага кантэксту, акрамя як з дадзенымі формы.

Большасць спасылак выкарыстоўваюць простыя сімвалы, якія заўсёды дазволеныя, таму без кадавання не патрабуецца наогул.

Калі ўявіць дадзеныя ў CGI скрыптоў з выкарыстаннем метаду GET, вы павінны кадзіраваць дадзеныя , як яна будзе адпраўлена па URL. Напрыклад, калі вы пішаце спасылку для прасоўвання ў RSS - канал , ваш URL трэба будзе кадавацца , каб дадаць да URL сцэнара вы рэкламуеце яго.

Што павінна быць закадзіраваны?

Любы сімвал, які не з'яўляецца літарны сімвал, лік або спецыяльны сімвал, які выкарыстоўваецца за межамі яе нармальнага кантэксту будзе трэба быць закадзіраваны на вашай старонцы. Ніжэй прыведзена табліца агульных сімвалаў, якія можна знайсці ў URL і іх кадавання.

Зарэзерваваныя сімвалы Кадыроўка URL

характар Мэта ў URL кадаваньне
: Асобны пратакол (HTTP) ад адраса % 3B
/ Асобны дамен і каталогі % 2F
# асобныя анкеры % 23
? Асобны радок запыту % 3F
& Асобныя элементы запыту % 24
@ Паасобнае імя карыстальніка і пароль ад дамена % 40
% Паказвае, закадаваны сімвал % 25
+ паказвае месца % 2B
<Прабел> Не рэкамендуецца ў URL-адрасоў % 20 ці +

Звярніце ўвагу , што гэтыя кадаваныя прыклады адрозніваюцца ад таго, што вы знойдзеце з адмысловымі знакамі HTML . Напрыклад, калі вам трэба кадзіраваць URL з Ампэрсанд (&) характар, вы павінны выкарыстоўваць% 24, што і паказана ў табліцы вышэй. Калі вы пішаце з HTML і вы хочаце дадаць Ампэрсанд да тэксту, вы не можаце выкарыстоўваць% 24. Замест гэтага вы будзеце выкарыстоўваць або «& амп;»; або «& # 38;», абодва з якіх будуць выпісваць і на старонцы HTML пры візуалізацыі. Гэта можа здацца заблытаным на першы, але гэта ў асноўным розніца паміж тэкстам, які з'яўляецца на самай старонцы, якая з'яўляецца часткай HTML-кода і радкі URL, які з'яўляецца асобным юрыдычнай асобай і, такім чынам, схільныя розных правілах.

Той факт, што «і» характар, а таксама мноства іншых сімвалаў, можа з'явіцца ў кожным не павінен вас бянтэжыць адрозненні паміж імі.

Арыгінал артыкула Джэніфер Krynin. Пад рэдакцыяй Джэрэмі Girard.