先頭に文字列があり、末尾に文字列を含む行をテキストファイルから削除し、1つを保持します。

Question

質問1： アイデア：

2回繰り返す
最初のループからインデックス（最初と最後の列）を抽出します。
インデックス発生回数の計算
2番目のループはすべての行を再度繰り返します（最初のループ内に保存されます）。
現在の行からインデックスを再抽出します。
インデックス数> 1の場合印刷

以下は、次のように保存された例ですexample.awk。

#!/usr/bin/awk -f
BEGIN {
  # field separator
  FS="-";
}
{
  # remember row for second loop
  allRows[rowCount++]=$0;

  # relevant columns
  colFirst=$1;
  colLast=$NF;

  # create combined index: first column, space, last column
  # count occurences of combined index
  indexes[colFirst" "colLast]++;
}
END {

  # loop through all input rows
  for(currentRow in allRows) {

    # extract combined index from current row
    arrLen = split(allRows[currentRow],splitted,"-");
    colFirst=splitted[1];
    colLast=splitted[arrLen];

    # output row  if index count of current row > 1
    if (indexes[colFirst" "colLast] > 1) {
    # index count > 1, so print
      print allRows[currentRow];
    }
  }
}

入力ファイル名が次の場合input.txt:

awk -f example.awk < input.txt

私の結果：

AAAAA-tjhut-ghyut-FILE1.txt
AAAAA-ghtujukr-hgute7gr-xhyutt-FILE1.txt
AAAAA-VGYT-4d7tt-xhyutt-FILE1.txt

質問2： 私が理解したのは、最初の行だけを維持したいと思います。

awk -f example.awk < input.txt | head -n 1

head: 出力ファイルの最初の部分

-n 1：最初のNUM行を印刷するため、1行だけ印刷されます。

Answer 1

質問1： アイデア：

2回繰り返す
最初のループからインデックス（最初と最後の列）を抽出します。
インデックス発生回数の計算
2番目のループはすべての行を再度繰り返します（最初のループ内に保存されます）。
現在の行からインデックスを再抽出します。
インデックス数> 1の場合印刷

以下は、次のように保存された例ですexample.awk。

#!/usr/bin/awk -f
BEGIN {
  # field separator
  FS="-";
}
{
  # remember row for second loop
  allRows[rowCount++]=$0;

  # relevant columns
  colFirst=$1;
  colLast=$NF;

  # create combined index: first column, space, last column
  # count occurences of combined index
  indexes[colFirst" "colLast]++;
}
END {

  # loop through all input rows
  for(currentRow in allRows) {

    # extract combined index from current row
    arrLen = split(allRows[currentRow],splitted,"-");
    colFirst=splitted[1];
    colLast=splitted[arrLen];

    # output row  if index count of current row > 1
    if (indexes[colFirst" "colLast] > 1) {
    # index count > 1, so print
      print allRows[currentRow];
    }
  }
}

入力ファイル名が次の場合input.txt:

awk -f example.awk < input.txt

私の結果：

AAAAA-tjhut-ghyut-FILE1.txt
AAAAA-ghtujukr-hgute7gr-xhyutt-FILE1.txt
AAAAA-VGYT-4d7tt-xhyutt-FILE1.txt

質問2： 私が理解したのは、最初の行だけを維持したいと思います。

awk -f example.awk < input.txt | head -n 1

head: 出力ファイルの最初の部分

-n 1：最初のNUM行を印刷するため、1行だけ印刷されます。

先頭に文字列があり、末尾に文字列を含む行をテキストファイルから削除し、1つを保持します。

ベストアンサー1

おすすめ記事