ストリームの最初のNバイトを効率的にスキップします。

Question

ファイルを入力する前にファイルの最初のバイトをスキップするにshasumはzsh：time

time cat /dev/zero | head -c 100000000 |
   (LC_ALL=C read -u0 -k1 && shasum -a 256)

これは追加のプロセスがなく、最初のバイトがパイプから読み取られることを意味します。read始める前にshasum。

それはLC_ALL=C read -u0 -k1まさにreading1文字です（kここでは鍵最初は、read -kキー入力が端末から読み取られます。ここでの文字は、LC_ALL=Cファイル記述子のuニット番号0（stdin;ここでは端末ではなくストリームから読み取ることを明確にするため）のおかげでシングルバイトです。

シェルを使用すると、bash次のようになります。readコマンドはですLC_ALL=C IFS= read -rd '' -n1。

zshに対応するのはread -k一般的ですが、read -NNULバイトを含む入力には機能せず、bash単にreadストライピングにすぎません（また、-Nksh93からコピーしたものは比較的新しい追加エントリであり、macosの古代バージョンのbashでは使用できません）。区切り文字をNULバイト（ここでは空の文字列で示されている）に設定することでdこれを防ぐことができます。最初のNULで区切られたレコードから1文字を読み取ります-n1（再バイトを生成することによって）。LC_ALL=Cただし、これは他のバイト数に適応しないことを意味します-rd '' -n2。最初のバイトが0の場合、バイトをスキップします。

他のシェルの場合は、readコマンドをdd bs=1 count=1 > /dev/null 2>&1（change、1バイト以上スキップしないcountでください）に置き換えることができます。また、一緒に動作しますbshead -c 1 > /dev/null一部head非標準オプションをサポートしていますが、-cすべてではありませんが（特にFreeBSDではないため、おそらくmacOSではない可能性があります）、一部はより少ないバイトの出力が要求されても、固定サイズのチャンクで入力を読み取ります。ただし、上記とは異なり、対応するread1バイトを読み取ることができない場合は、失敗した終了ステータスを報告しないため、いずれにせよshasum実行されます。

チェックサムがパイプの代わりに通常のファイルである場合は、次のことができます。綱渡りより効率的です（複数バイトをスキップする必要があると仮定）。救うファイルからスキップした部分を読み取って削除するのではなく（静止zsh構文）：

zmodload zsh/system
{ sysseek 1234567 && shasum -a 256; } < some-big-file

最初の1234567バイトをスキップします。

またはksh93を使用してください。

shasum -a 256 < some-big-file <#((1234567))

他の殻と一部dd（私はmacOSの実装を知りません）次のことができます。

{ dd bs=1 skip=1234567 count=0 2> /dev/null; shasum -a 256; } < some-big-file

ただし、count=0ポータブルで使用することはできません。 countが0の場合、すべてのdd実装がここで作業を実行するわけではありません。一部ではこのように解釈することもあります。lseek()count=infinity

Answer 1