小さなファイルに対していくつかのバグ修正を実行するには、長いテキストファイルの最初の行を取得する必要があります(Pythonスクリプトは予想どおり大きなテキストファイルを消化しません)。ただし、バグ修正を意味するには、行が基本的にバイト単位で完全なコピーである必要があり、文字エンコード、行末文字、見えない文字、または見えない文字に関連する潜在的な問題を特定する必要があります。存在しません。次の簡単なソリューションでこれを達成できますか?それとも私が使用している出力に何かがありませんかhead
?
head infile.txt > output.txt
現在head
、またはelseを使用したバイナリコピーに関するより一般的な質問が投稿されました。dd
ここ。
ベストアンサー1
POSIX は入力を意味します。head
はテキストファイルと定義テキストファイル:
3.397 テキストファイル
ゼロ行以上の文字を含むファイル。この行にはNUL文字は含まれておらず、
{LINE_MAX}
この文字を含むどの行もバイトより長くすることはできません<newline>
。 POSIX.1-2008はテキストファイルとバイナリファイルを区別しませんが(ISO C標準を参照)、多くのユーティリティはテキストファイルを操作するときに予測可能または意味のある出力のみを生成します。これらの制限を持つ標準ユーティリティは、常にSTDINまたはINPUT FILESセクションに「テキストファイル」を指定します。
その結果、情報が失われる可能性があります。