特定の基準より大きい特定の列を選択し、ファイルに記載されているgrep単語を選択してください。

特定の基準より大きい特定の列を選択し、ファイルに記載されているgrep単語を選択してください。

21列のみを含むFB_Dataset.csvファイルがあり、FB_Dataset.csvはカンマ区切りファイルです。 FB_Dataset.csvの全体的な構成は次のとおりです。

ここに画像の説明を入力してください。

ファイルから「Trump」という単語への言及(大文字と小文字を無視する)と100より大きい数(列10)を抽出する必要があります。最後に、like_count(列10)でソートされたpost_id(列2)を含む新しいファイルを作成し、名前を「trump.txt」として指定します。

私はUnixに初めて触れ、2つの条件を別々に抽出する方法を見つけました。コードは次のとおりです。grep -i -o 'トランプ' FB_Dataset.csv最初の条件とawk '$10 > 100{print}' FB_Dataset.csv2番目の条件について。次は何をすべきですか?

ありがとう

ベストアンサー1

私が正しく理解したら、あなたは必要です

awk -F, '/[tT]rump/ && $3>100' FB_Dataset.csv | sort -t, -k 3,3n > trump.txt

「ace」と100より大きい数字を検索し、最後に3番目の列の数字()に基づいてawkソートします。カンマを区切り文字として使用するには、スイッチとを使用する必要があります。sort-k 3,3n-F,-t,

おすすめ記事