URLを含むCSVファイルを処理して、無効な「デフォルト」ポートを明示的に指定されたポートに置き換えます。

Question

次の事項を適用する必要がありますawk。

awk -F',' -v OFS=',' '/^http:/ {$2=80} /^https:/ {$2=443} \
$1~/:[0-9]+$/ {n=split($1,f,":"); $2=f[n]; sub(/:[0-9]+$/,"",$1);} !already[$0]++' input.txt

これは、ファイルをカンマ区切りの入力（-F','）と出力（-v OFS=','）として解釈します。

行がで始まる場合、http:2番目の列は80に設定されます。
行がで始まる場合、https:2番目の列は443に設定されます。
すべての行（以前の規則によってすでに処理されている行を含む）の最初のフィールドが:数字以上で終わっている場合は、最後の部分を抽出して2番目の列の内容に設定し、削除から変更します。 1列。
各行の発生回数は配列に書き込まれますalready。現在の行がゼロの場合にのみ、行の内容が印刷されます。これは速記表記法を使用します。つまり、ルールの外に現れるawk（または実際にはゼロより大きい数字）は、「これまでに行われたすべての変換を含む行を印刷します」を意味し、「対応する行を印刷しない」を意味し、後続演算子は増加しますします。発生回数10++後ろに論理「NOT」と評価されます。

GNUとawk。mawknawk

パイプ構造にグループ化することはawkほとんど必要ありません。sedgrep

Answer 1

次の事項を適用する必要がありますawk。

awk -F',' -v OFS=',' '/^http:/ {$2=80} /^https:/ {$2=443} \
$1~/:[0-9]+$/ {n=split($1,f,":"); $2=f[n]; sub(/:[0-9]+$/,"",$1);} !already[$0]++' input.txt

これは、ファイルをカンマ区切りの入力（-F','）と出力（-v OFS=','）として解釈します。

行がで始まる場合、http:2番目の列は80に設定されます。
行がで始まる場合、https:2番目の列は443に設定されます。
すべての行（以前の規則によってすでに処理されている行を含む）の最初のフィールドが:数字以上で終わっている場合は、最後の部分を抽出して2番目の列の内容に設定し、削除から変更します。 1列。
各行の発生回数は配列に書き込まれますalready。現在の行がゼロの場合にのみ、行の内容が印刷されます。これは速記表記法を使用します。つまり、ルールの外に現れるawk（または実際にはゼロより大きい数字）は、「これまでに行われたすべての変換を含む行を印刷します」を意味し、「対応する行を印刷しない」を意味し、後続演算子は増加しますします。発生回数10++後ろに論理「NOT」と評価されます。

GNUとawk。mawknawk

パイプ構造にグループ化することはawkほとんど必要ありません。sedgrep

URLを含むCSVファイルを処理して、無効な「デフォルト」ポートを明示的に指定されたポートに置き換えます。

ベストアンサー1

おすすめ記事