マルチバイト文字を読み込む際のInputStreamとInputStreamReaderの違い質問する

Question

は、InputStream生のオクテット (8 ビット) データを読み取ります。Java では、このbyte型は C の型と同等ですchar。C では、この型を使用して文字データまたはバイナリデータを表すことができます。Java では、このchar型は C のwchar_t型と多くの類似点があります。

はInputStreamReader、データをあるエンコーディングから UTF-16 に変換します。「a你们」がディスク上で UTF-8 としてエンコードされている場合、バイトシーケンスになります。UTF-8 エンコーディングでを61 E4 BD A0 E4 BB AC渡すと、文字シーケンスとして読み取られます。InputStreamInputStreamReader0061 4F60 4EEC

Javaの文字エンコーディングAPIには、この変換を実行するアルゴリズムが含まれています。Oracle JREでサポートされているエンコーディングのリストは、ここ。ICUプロジェクトこれが実際にどのように機能するかの内部を理解したい場合、ここから始めるのが良いでしょう。

アレクサンダー・ポグレブニャク指摘しているほとんどの場合、エンコーディングを明示的に指定する必要があります。エンコーディングを指定しないbyte-to-メソッドは、charJRE デフォルトこれは、オペレーティングシステムとユーザー設定に依存します。

Answer 1

は、InputStream生のオクテット (8 ビット) データを読み取ります。Java では、このbyte型は C の型と同等ですchar。C では、この型を使用して文字データまたはバイナリデータを表すことができます。Java では、このchar型は C のwchar_t型と多くの類似点があります。

はInputStreamReader、データをあるエンコーディングから UTF-16 に変換します。「a你们」がディスク上で UTF-8 としてエンコードされている場合、バイトシーケンスになります。UTF-8 エンコーディングでを61 E4 BD A0 E4 BB AC渡すと、文字シーケンスとして読み取られます。InputStreamInputStreamReader0061 4F60 4EEC

Javaの文字エンコーディングAPIには、この変換を実行するアルゴリズムが含まれています。Oracle JREでサポートされているエンコーディングのリストは、ここ。ICUプロジェクトこれが実際にどのように機能するかの内部を理解したい場合、ここから始めるのが良いでしょう。

アレクサンダー・ポグレブニャク指摘しているほとんどの場合、エンコーディングを明示的に指定する必要があります。エンコーディングを指定しないbyte-to-メソッドは、charJRE デフォルトこれは、オペレーティングシステムとユーザー設定に依存します。

マルチバイト文字を読み込む際のInputStreamとInputStreamReaderの違い質問する

ベストアンサー1

おすすめ記事