Question 1

encodeURIとencodeURIComponentの違いは何ですか?

Accepted Answer

encodeURIComponentは文字、数字、または-_.!~*'()のいずれかではないものをエスケープするので、個々のクエリ値やパスセグメントに安全です。encodeURIは:/?#&=のようなURL予約文字を放置するので、すでに構造を持つ全URLをエンコードするためのものです。95%の時間はコンポーネントを使用。完全URLは、散発的なスペースやUnicodeを持つほぼ有効なURLがあるときのみ使用。

Question 2

クエリ文字列で実際にエンコードが必要な文字は?

Accepted Answer

クエリ文字列の区切り文字&と=は値内でエンコードする必要があります (そうしないと区切り文字のように見える)。スペースは%20または+になります。#フラグメントマーカーはエンコードする必要があります。加えて: /、?、非ASCIIのもの、制御文字。encodeURIComponentはこれらすべてを処理します; encodeURIは&、=、/、?、#をエンコードせず放置します、それらがURL構造的だから。

Question 3

なぜ私のURLがダブルエンコードされているのか?

Accepted Answer

ダブルエンコーディングは、すでにエンコードされた値をエンコードすると発生します。スペースが%20になり、次に%自体が%25になり、%2520を与えます。通常、すでにエンコードされたURLをencodeURIComponentに再度渡すか、手動エンコードの上に自動エンコードするフレームワークによって引き起こされます。一度デコードしてクリーンに再エンコードするか、1つのレイヤーをスキップ。

Question 4

絵文字やアクセント付き文字のような非ASCII文字をどう処理しますか?

Accepted Answer

JavaScriptのエンコーダーは非ASCII文字を最初にUTF-8バイトに変換し、次に各バイトをパーセントエンコードします。そのためéは%C3%A9 (2バイト) になり、😀のような絵文字は%F0%9F%98%80 (4バイト) になります。デコーディングはプロセスを逆にします。これは標準RFC 3986の動作で、すべての現代のサーバーで動作します。

Question 5

なぜデコードが「URI malformed」で失敗するのか?

Accepted Answer

decodeURIComponentは無効なパーセントシーケンスを見るとスローします — 2つのhex桁が続かない単独の% (例えば%ZZや単に%)、または有効でないUTF-8バイトシーケンス (例えば有効な継続バイトなしの%C3)。一般的な原因: 入力中のエンコードされなかったリテラル%、またはすでに一度デコードされていてまだパーセント記号を持つ文字列。

Question 6

スペースは+になるべきか%20か?

Accepted Answer

両方が実際に見られます。%20はどこでも正しい — パス、クエリ文字列、フラグメントで。+ショートカットはHTMLフォーム送信で使用されるapplication/x-www-form-urlencoded形式内でのみ「スペース」を意味します。このツールは%20を使用します、encodeURIComponentがそうするから。具体的に+が必要な場合、エンコード後に%20を+に置き換えてください。

URLエンコーダー＆デコーダー

例

よくあるエラーと落とし穴