Base64で変換して間違った文字を返すと、文字列の末尾に無効な文字が表示されるのはなぜですか？

Question

HelloWorld==デコードできず、通常0パディングする必要があるため、技術的に有効なBase64以外の情報が含まれています。 .を使用すると、1その中に含まれる追加のsは無視され失われますecho "HelloWorld==" | base64 -d。

説明する...

Base64は4文字のグループで動作します。各文字は6ビットを表すため、4つのグループはそれぞれ3バイト（それぞれ8ビット）にデコードされます。唯一の例外は、シンボルの数に依存する最後の4文字です=。 Base64 文字列は常に 4 に分割されます。

0は3バイトにデコードされています
1 = 2バイトでデコード
2 == 1バイトでデコード

あなたの例ではHellと両方がoWor有効です。しかしld==それは真実ではない。理由を理解するには、次のルックアップテーブルを参照してください。 https://en.wikipedia.org/wiki/Base64

ld===最後に2バイトがあるので、1バイトだけでデコードする必要があります。ただし、ld次のようにデコードされます 100101 011101。 1バイトには8つの8ビットしかありません。したがって、文字列復号化を使用するとbase64 -dバイト100101 01にのみ変換され、終了は1101完全に無視されます。

で終わるすべてのBase 64文字列は、==最後の文字の最初の2文字のみを使用する必要があります。唯一の利用できる結末==はQ== A== w== g==

Answer 1

HelloWorld==デコードできず、通常0パディングする必要があるため、技術的に有効なBase64以外の情報が含まれています。 .を使用すると、1その中に含まれる追加のsは無視され失われますecho "HelloWorld==" | base64 -d。