Question 1

В чем разница между encodeURI и encodeURIComponent?

Accepted Answer

encodeURIComponent экранирует все, что не является буквой, цифрой или одним из -_.!~*'(), поэтому безопасен для отдельных значений запроса и сегментов пути. encodeURI оставляет URL-зарезервированные символы вроде :/?#&= нетронутыми, поэтому подходит для кодирования целого URL, который уже имеет структуру. Используйте Компонент 95% времени; используйте Полный URL, только когда у вас в основном валидный URL с случайными пробелами или Unicode.

Question 2

Какие символы действительно нуждаются в кодировании в строке запроса?

Accepted Answer

Разделители строки запроса & и = должны быть закодированы внутри значения (иначе они выглядят как разделители). Пробел становится %20 или +. Маркер фрагмента # должен быть закодирован. Плюс: /, ?, все не-ASCII и управляющие символы. encodeURIComponent обрабатывает все это; encodeURI оставляет &, =, /, ?, # не закодированными, потому что они URL-структурные.

Question 3

Почему мой URL получается двойным кодированием?

Accepted Answer

Двойное кодирование происходит, когда вы кодируете значение, которое уже закодировано. Пробел становится %20, затем сам % становится %25, давая %2520. Обычно вызвано передачей уже закодированного URL через encodeURIComponent снова, или фреймворком, который автоматически кодирует поверх вашего ручного кодирования. Декодируйте один раз и перекодируйте чисто, или пропустите один слой.

Question 4

Как это обрабатывает не-ASCII символы вроде эмодзи или букв с акцентами?

Accepted Answer

Кодировщики JavaScript сначала преобразуют не-ASCII символы в UTF-8 байты, затем процент-кодируют каждый байт. Так é становится %C3%A9 (два байта), а эмодзи вроде 😀 становится %F0%9F%98%80 (четыре байта). Декодирование обращает процесс. Это стандартное поведение RFC 3986 и работает с каждым современным сервером.

Question 5

Почему декодирование завершается с "URI malformed"?

Accepted Answer

decodeURIComponent выбрасывает, когда видит недопустимую процентную последовательность — одиночный %, за которым не следуют две hex-цифры (например, %ZZ или просто %), или UTF-8 байтовые последовательности, которые недействительны (например, %C3 без допустимого байта продолжения). Обычные причины: буквальный % во вводе, который никогда не был закодирован, или строка, которая уже была однажды декодирована и все еще имеет знаки процента.

Question 6

Должны ли пробелы становиться + или %20?

Accepted Answer

Оба встречаются на практике. %20 правилен везде — в путях, строках запроса и фрагментах. Сокращение + означает только "пробел" внутри формата application/x-www-form-urlencoded, используемого при отправке HTML-форм. Этот инструмент использует %20, потому что это делает encodeURIComponent. Если вам конкретно нужен +, замените %20 на + после кодирования.

URL-кодировщик и декодер

Пример

Частые ошибки и подводные камни