バイトオフセットから行番号を取得する

Question

あなたの例では

0バイト番号8は、次の行ではなく2番目の改行文字です。

$b以下は、バイトの後の完全な行番号を提供します。

$ dd if=data.in bs=1 count="$b" | wc -l

2レポートはb8に設定され、レポートは71に設定されますb。

ここで使用されているユーティリティddはファイルから読み込み、1バイトサイズのブロックをdata.in読み込みます。$b

"icarus"は、以下のコメントで正しく指摘したように、bs=1使用するのに非常に非効率的です。この特別なケースでは、合計を変更する方がbs効率的ですcount。

$ dd if=data.in bs="$b" count=1 | wc -l

これは最初のコマンドと同じ効果を持ちますが、バイトブロックのみをdd読み込みます。$b

このwcユーティリティは、Unixで「行」が常に終了する改行文字を計算します。したがって、12より低い値（改行文字の下）に2設定すると、上記のコマンドは引き続き表示されます。bしたがって、探している結果は、上記のパイプラインが報告する数値に1を加えたものです。

明らかに、これはASCIIテキストの前にあるファイルのバイナリブロブ部分にある任意の改行文字も計算します。 ASCIIビットの開始位置がわかっている場合は、ファイルに移動するバイト数をコマンドskip="$offset"に追加できます。dd$offset

Answer 1