HTML Кодировка URL
URL — это другое название веб‑адреса.
URL может состоять из слов (например, htmlclub.ru) или из IP‑адреса (интернет‑протокола, например, 192.68.20.50).
Большинство пользователей при сёрфинге в интернете вводят имя сайта, поскольку имена легче запомнить, чем числа.
URL — Uniform Resource Locator (Единый указатель ресурса)
Веб‑браузеры запрашивают страницы с веб‑серверов с помощью URL.
Единый указатель ресурса (URL) используется для адресации документа (или других данных) в интернете.
Веб‑адрес вроде https://www.htmlclub.ru/docs/html подчиняется следующим правилам синтаксиса:
scheme://prefix.domain:port/path/filename
Пояснение:
- scheme — определяет тип интернет‑сервиса (наиболее распространённые варианты — http или https);
- prefix — определяет префикс домена (по умолчанию для http это www);
- domain — определяет доменное имя в интернете (например, htmlclub.ru);
- port — определяет номер порта на хосте (по умолчанию для http это 80);
- path — определяет путь на сервере (если опущен — используется корневая директория сайта);
- filename — определяет имя документа или ресурса.
Распространённые схемы URL
В таблице ниже перечислены некоторые распространённые схемы:
| Схема | Расшифровка | Используется для |
|---|---|---|
| http | HyperText Transfer Protocol (протокол передачи гипертекста) | Обычные веб‑страницы. Не зашифрованы |
| https | Secure HyperText Transfer Protocol (защищённый протокол передачи гипертекста) | Защищённые веб‑страницы. Зашифрованы |
| ftp | File Transfer Protocol (протокол передачи файлов) | Скачивания или загрузки файлов |
| file | Файл на вашем компьютере |
Кодирование URL
URL можно передавать через интернет только с использованием набора символов ASCII. Если URL содержит символы за пределами набора ASCII, его нужно преобразовать.
Кодирование URL преобразует не‑ASCII‑символы в формат, пригодный для передачи через интернет.
При кодировании URL не‑ASCII‑символы заменяются на знак «%», за которым следуют шестнадцатеричные цифры.
В URL не могут содержаться пробелы. Обычно при кодировании URL пробел заменяется на знак плюс (+) либо на %20.
Примеры кодирования ASCII
Ваш браузер будет кодировать ввод в соответствии с набором символов, используемым на вашей странице.
Набор символов по умолчанию в HTML5 — UTF‑8.
| Символ | Из Windows‑1252 | Из UTF‑8 |
|---|---|---|
| € | %80 | %E2%82%AC |
| £ | %A3 | %C2%A3 |
| © | %A9 | %C2%A9 |
| ® | %AE | %C2%AE |
| À | %C0 | %C3%80 |
| Á | %C1 | %C3%81 |
| Â | %C2 | %C3%82 |
| Ã | %C3 | %C3%83 |
| Ä | %C4 | %C3%84 |
| Å | %C5 | %C3%85 |