Linuxのソートの問題

Question

Cyb5 157.426最初のソートステップでは、ロケールスペースは無視されるため、最初にソートして最後にソートするので、Cyb561 0.425933順序Cyb5 64.074は英語の辞書の順序に近いです。Cyb561 7.11003

たとえば、辞書では、との間に見つけることa prioriができます。apiaryArrival

ここではCyb5 157.426最初のパスと比較します。なぜなら、Cyb561 0.425933最初のパスと最初のパスを比較するCyb5157.426からです。Cyb5610.425933重量スペース文字は無視する。

この特殊な処理を回避するには、C文字コードポイント値のみに基づく順序でロケールを変更できます。

LC_ALL=C sort -d file

または@Swissが言ったように、最初のフィールドだけをソートします。

sort -d -k1,1 file

ただし、フィールド区切り文字は空白ではなく空白から空白への遷移であり、空白は空白です。はいフィールドに含まれます。

だから：

 b x
a x

sort -d -k1,1それでも次のようにソートされます。

a x
 b x

あなたのロケールではスペースが無視されるので、次のようになります。

 b x
a x

Cロケールでは、スペース文字が最初に続きますa。

-bロケールに関係なく、先行スペースが常に無視されるようにオプションを追加できます。または、スペースで始まる行を最初に並べ替えるには、ロケールをCに変更します。

Answer 1