各行の順序付きサブストリングに基づいてファイルを確実にソートします。

Question

スコアシステムが欲しいようです。出力でその行をどのくらい頻繁に表示したいかを示すスコアを各行に割り当てるスクリプトを作成します。 awkその仕事にぴったりなようです。あなたの例：

#!/bin/sh
awk '{score=0}
    /usb/ {score=1}
    /Plantronics/ {score=2}
    {print score, NR, $0}' "$@"

デフォルトでは、これは各行にスコア0を割り当て、行に含まれている場合は1で上書きされ、行に含まれている場合はusb 2で上書きされますPlantronics。usbステートメントをこの順序で配置したので、Plantronics1行に2つの文字列が含まれている場合、最終値は2になります。それから

./score file.txt | sort -k1nr -k2n | cut -d" " -f3-

（scoreスクリプト名はどこにありますか？）最初のフィールド（スコア）に sort -k1nr基づいてソートを意味します。これは数値として処理され、より高い値が最初にソートされます（スクリプトが最も興味のあるscore行に高いスコアを割り当てるため）。 -k2nつまり、最初のフィールドに同じ値がある行の場合、2番目のフィールドに基づいて通常の昇順でソートされます。 2番目のフィールドはNRレコード番号（行番号とも呼ばれます）です。これにより、スコアが同じ行（たとえば、usb含まれているが含まれていない行Plantronics）が元の順序で表示されます。これを気にしない場合は、NR,ステートメントから削除し、コマンドから削除してからprint次のように変更します。（実際には、これらの順序はデフォルトで維持される可能性があるため、まったく必要ないかもしれません。）もちろん、これはスクリプトがデータの前に追加する番号を削除します。-k2nsort-f3--f2-sortcut -d" " -f3-score

これがどのように機能するかを完全に理解していない場合は、以下を実行してみてください。

./score file.txt

そして

./score file.txt | sort -k1nr -k2n

このアプローチは非常に柔軟です。たとえば、上記のコードは次のように生成します。

以下を含むすべてのPlantronics行
usb含めるが含まないすべてのPlantronics行と
上記を含まないすべての行、

各グループは、入力ファイルの発生順序に従ってソートされます。ただし、scoreスクリプトを次のように変更すると、

#!/bin/sh
awk '{score=0}
    /usb/ {score+=1}
    /Plantronics/ {score+=2}
    {print score, NR, $0}' "$@"

2つの文字列を含む線に3つの点を割り当てることができるので、

以下を含むすべての行Plantronics そして usb、続いて
Plantronics次を含むが含まないすべてのusb行の後に
次を含むusbが含まないすべての行Plantronics
上記を含まないすべての行。

Answer 1