正規表現を使用して行から特定の部分を抽出する

Question

少なくともこの特定のデータ^（*）については、次のようになります。

を使用して、cutスペースで区切られた最初の8つのフィールドを取得します。

$ cut -d' ' -f1-8 < someinputfile 
50.57.61.8 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"
50.57.61.9 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"

sed、使用法、正規表現を使用して、s///最初の二重引用符、スペース、およびその後のすべての項目を削除し、引用符を再挿入します。

$ sed -e 's/" .*/"/' < someinputfile 
50.57.61.8 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"
50.57.61.9 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"

_{（*これはApacheログファイルのように見えますが、正確な形式のすべてのバリエーションを覚えていないので、おそらく仮定をしているようです。）}

Answer 1

少なくともこの特定のデータ^（*）については、次のようになります。

を使用して、cutスペースで区切られた最初の8つのフィールドを取得します。

$ cut -d' ' -f1-8 < someinputfile 
50.57.61.8 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"
50.57.61.9 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"

sed、使用法、正規表現を使用して、s///最初の二重引用符、スペース、およびその後のすべての項目を削除し、引用符を再挿入します。

$ sed -e 's/" .*/"/' < someinputfile 
50.57.61.8 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"
50.57.61.9 - - [04/Apr/2019:09:52:01 -0400] "GET /tracker.php?q=1&p=2 HTTP/1.1"

_{（*これはApacheログファイルのように見えますが、正確な形式のすべてのバリエーションを覚えていないので、おそらく仮定をしているようです。）}

正規表現を使用して行から特定の部分を抽出する

ベストアンサー1

おすすめ記事