Question 1

encodeURI와 encodeURIComponent의 차이는 무엇인가요?

Accepted Answer

encodeURIComponent는 문자·숫자와 -_.!~*'() 외의 모든 문자를 이스케이프하기 때문에 개별 쿼리 값이나 경로 세그먼트에 안전합니다. encodeURI는 :/?#&= 처럼 URL에 예약된 문자는 그대로 두므로, 이미 구조를 갖춘 URL 전체를 인코딩할 때 씁니다. 실무에서는 95%의 경우 Component를 쓰고, 공백이나 유니코드만 살짝 섞인 거의 완성된 URL에만 전체 URL을 쓰세요.

Question 2

쿼리 문자열에서 실제로 인코딩해야 하는 문자는 무엇인가요?

Accepted Answer

값 안에서는 쿼리 구분자인 &와 =를 반드시 인코딩해야 합니다(그렇지 않으면 구분자처럼 보여요). 공백은 %20 또는 +가 되고, 프래그먼트 구분자 #도 인코딩해야 합니다. 그 외에 /, ?, ASCII가 아닌 모든 문자, 제어 문자도 포함돼요. encodeURIComponent는 이 모두를 처리하고, encodeURI는 &, =, /, ?, #는 URL 구조 문자라서 그대로 둡니다.

Question 3

왜 URL이 이중으로 인코딩되나요?

Accepted Answer

이중 인코딩은 이미 인코딩된 값을 한 번 더 인코딩할 때 생겨요. 공백이 %20이 된 다음, 그 %가 다시 %25가 되어 %2520이 됩니다. 보통은 이미 인코딩된 URL을 encodeURIComponent에 또 넣거나, 여러분의 수동 인코딩 위에 프레임워크가 자동으로 한 번 더 인코딩할 때 발생해요. 한 번 디코딩하고 깔끔하게 다시 인코딩하거나, 한 단계를 건너뛰세요.

Question 4

이모지나 악센트가 있는 글자 같은 비-ASCII 문자는 어떻게 처리되나요?

Accepted Answer

JavaScript의 인코더는 비-ASCII 문자를 먼저 UTF-8 바이트로 바꾸고, 각 바이트를 퍼센트 인코딩합니다. 그래서 é는 %C3%A9(2바이트)가 되고, 😀 같은 이모지는 %F0%9F%98%80(4바이트)가 됩니다. 디코딩은 그 반대로 동작해요. 이것은 RFC 3986 표준 동작이고, 최신 서버라면 어디서든 잘 작동합니다.

Question 5

왜 디코딩이 "URI malformed" 오류로 실패하나요?

Accepted Answer

decodeURIComponent는 잘못된 퍼센트 시퀀스를 만나면 예외를 던집니다 — 두 자리 16진수가 따라붙지 않은 % 하나(예: %ZZ나 그냥 %)이거나, 유효하지 않은 UTF-8 바이트 시퀀스(예: 이어지는 바이트 없이 %C3만 있는 경우)일 때예요. 흔한 원인은 인코딩되지 않은 %가 입력에 그대로 들어가 있거나, 이미 한 번 디코딩된 문자열에 아직 % 기호가 남아 있는 경우입니다.

Question 6

공백은 +로, 아니면 %20으로 바꿔야 하나요?

Accepted Answer

실제로는 둘 다 쓰입니다. %20은 경로·쿼리·프래그먼트 어디에서나 안전해요. +를 공백으로 해석하는 단축 표기는 HTML 폼이 보낼 때 쓰는 application/x-www-form-urlencoded 형식에서만 통합니다. 이 도구는 encodeURIComponent를 따르기 때문에 %20을 사용해요. 꼭 +가 필요하다면, 인코딩한 뒤에 %20을 +로 바꾸면 됩니다.

URL 인코더 / 디코더

예시

자주 겪는 문제와 해결법