このファイルをどのように切り取って、特定の部分の固有の単語を見つけるのかわかりません。

Question

以下はあなたが提供した例の練習です。

awk指定できる列と行を印刷します。manその他の参考資料については、このページとGoogleを確認することをお勧めします。あなたの場合、区切り文字は各列を区切るスペースです。これまでに提供した内容によって、各行に異なるテキストが含まれているため、列の位置が異なるため、異なる場合がありますが、最初の3行の場合は次のように開始できます。

cat access_log | awk 'NR==1,NR==3 {print $7}' | sort -u

NR==1,NR==31〜3行を印刷してください。

{print $7}必要なファイル名である7番目の列を印刷します。各行のテキストが異なる場合があるため、常に7番目の列になるわけではありません。

sort -u一意の値を出力

出力は次のとおりです

/robots.txt
/~robert/class2.cgi
/~robert/class3.cgi

最後の部分はsort冗長性がないため、例に違いはありませんが、ファイルの残りの部分がそうである場合は、その特定の列の固有値のみを印刷します。

ファイル名のみを印刷するには、次のコマンドでパラメータを使用できますsubstr。awk

cat access_log | awk 'NR==1 {print substr($7,2,10)} NR==2,NR==3 {print substr($7,10,10)}'

出力は次のとおりです。

robots.txt
class2.cgi
class3.cgi

説明する：

NR==1 {print substr($7,2,10)}フィールド 7 の最初の行の場合、位置 2 から始まり、10 文字が印刷されます。

NR==2,NR==3 {print substr($7,10,10)}フィールド7の2番目から3番目の行は10番目の位置から始まり、10文字が印刷されます。

ファイルの残りの部分は異なる場合があり、常に同じ位置にソートされていないため、列と値を変更する必要があるかもしれませんが、これは開始されます。時間がかかるように見えるかもしれませんが、調査すると正しい方向に行くことができます。

Answer 1