CSVファイルから重複エントリを削除する

CSVファイルから重複エントリを削除する

重複したデータが再印刷される[csv]ファイルがあります。つまり、同じデータが2回印刷されます。使ってみました。ソートの一意性 しかし、sort myfile.csv | uniq -u何も変わりませんでしたmyfile.csv。私も試してみましたが、sudo sort myfile.csv | uniq -u違いはありませんでした。

現在私のCSVファイルは次のとおりです。

a
a
a
b
b
c
c
c
c
c

私もそう見たい

a
b
c

ベストアンサー1

myfile.csv変更がない理由は-uオプションuniqですただ一意の行を印刷します。このファイルではすべての行が繰り返されるので、いいえ印刷されます。

しかし、もっと重要なのは、出力が保存されないことです。デフォルトではコンソールにのみ印刷されるmyfile.csvためです。uniqstdout

次のようにする必要があります。

$ sort -u myfile.csv -o myfile.csv

オプションの意味は次のとおりです。

  • -u- 一意の行だけを維持
  • -o- 代わりにこのファイルに出力stdout

詳細を確認する必要がありますman sort

おすすめ記事