Base64 で文字列をエンコードするにはなぜ「b」が必要なのでしょうか? 質問する

Question

A-Zbase64 エンコーディングは 8 ビットのバイナリバイトデータを受け取り、、、、 *の文字のみを使用してエンコードするため、電子メールなど、8 ビットのデータをa-zすべて保持しないチャネル経由で送信できます。0-9+/

したがって、8 ビットバイトの文字列が必要です。Python 3 では、構文を使用してこれを作成しますb''。

を削除するとb、文字列になります。文字列は Unicode 文字のシーケンスです。base64 は Unicode データをどう処理すればよいかわかりません。Unicode データは 8 ビットではありません。実際、ビットはありません。:-)

2番目の例では:

>>> encoded = base64.b64encode('data to be encoded')

すべての文字はASCII文字セットにきちんと収まるため、base64エンコードは実際にはあまり意味がありません。代わりに、次のようにしてASCIIに変換することができます。

>>> encoded = 'data to be encoded'.encode('ascii')

あるいはもっと簡単に言うと:

>>> encoded = b'data to be encoded'

この場合も同じことになります。

* ほとんどのbase64の種類では、=末尾にパディングとしてが含まれる場合があります。さらに、base64の種類によっては、と以外の文字が使用される場合があり+ます/。バリアント概要表概要についてはWikipediaをご覧ください。

Answer 1