wgetは3バイト引用符を出力します。

wgetは3バイト引用符を出力します。

wget -bログから正常にダウンロードされたファイルのリストを取得しようとしましたが、成功しませんgrep saved wget-log | awk -F '"' '{print $2}'でした。追加の調査では、ファイル名が通常の二重引用符(0x22)ではなく、3バイトの左右の二重引用符(0xE2 0x80 0x9D)で囲まれていることがわかりました。

これがwgetの正常な動作ですか、それとも私の環境変数ですか? wgetで一重引用符を使用することができますか、またはロギングに標準のASCIIバイトを使用できますか?私はバイトをsedに置き換えるなどの問題を解決する別の方法を知っています。私はこれに非常に興味があります。私はこれに関するコメントを見つけるためにGoogleから数分を費やしましたが、何も見つかりませんでした。まるで以前誰もこれに気づかなかったようです。

ベストアンサー1

Unicodeロケールで設計されているようです。これに対するコメントがありますwgetメーリングリスト。言語翻訳ファイルには引用文の翻訳も含まれているため、使用している言語に応じて「正しい」引用文を取得できます。

Unicodeではなくロケールを使用して、一重引用符を使用することができます。

LC_ALL=C wget ...

または

LC_CTYPE=C wget ...

おすすめ記事