ログファイルから日付を抽出し、一意の日付を含むファイルを作成する

Question

sed コマンドが機能しない理由は、各行に日付があると仮定するためです。いくつかの行が複数行のエラーメッセージから出た場合はそうではありません。置換パターンに一致する項目がない場合、sed は置換を実行せず、表示される呼び出しスタックのリストは出力に残ります。

先頭に日付を含む行からのみ日付を取得するには、次のオプションがあります。

グレブ：

grep -Eo '^[0-9.]+' fac.log

-oはgrepに完全な行ではなく一致する部分のみを印刷するように指示し、-Eは「拡張」正規表現を有効にします。

奇妙な：

awk '/^[0-9.]+/ {print $1}' fac.log

awk コマンドの最初の部分は正規表現マッチングで、残りはマッチング行を処理する方法です。ここでは、行の最初の単語を印刷します。

真珠：

perl -lne 'print $1 if /^([0-9]+)/' fac.log

-l：各行に新しい行を印刷しますprint。 -n：各行に実行コマンド（例：awk）を入力します。 -e: ファイルではなくコマンドラインから提供されたことをプログラムに通知します。

すべての場合に一致する各入力行に対して1つの出力行（繰り返し日付）を取得します。結果をパイプする| sort | uniqことは、おそらく重複を排除する最も簡単な方法です。

私は怠惰で、^[0-9.]+より長く正確なパターンを使用しなかったことに注意してください。これは私がsed、awk、友人よりもPerlを使用することを好む理由に関連しています。 Perl正規表現は何をしても常に同じです。また、Perlでは、どの修飾子がデフォルトでサポートされているのか、どの修飾子が-Eなどを設定するのかを覚えておく必要はありません。その後、バージョン間に違いがあります。明らかに、私のDebianシステムはGNU awkの代わりにmawkにデフォルト設定されており、{N}修飾子をサポートしていないため、より正確なモードは機能しません。こんな。

GNU awkのマニュアル：「間隔式は伝統的にawkでは使用できません。これは、awkとegrepが互いに一貫性を持たせるようにPOSIX標準の一部として追加されました。」https://www.gnu.org/software/gawk/manual/html_node/Regexp-Operators.html#Regexp-Operators)

Answer 1