Diffコマンドを使用して行のテキストを無視し、条件に応じて一致しないデータを取得する方法

Question

ユーティリティにはdiffフィールドをスキップするオプションはありません。

カット＆uniqで動作しようとしています。以下のアプローチがうまくいくと思いますが、出力に列2がありません。

$ cut -d/ -f1,3 file1 file2 |sort |uniq -u  #column 2 is skipped

より正確な解決策として、次のawkを提案します。

awk -F" |/" '{a=$1$2$4$5;seen[a]++;out[a]=$0}END{for (i in seen) if (seen[i]==1) print out[i]}' file1 file2

与えられた入力データの各行の末尾に余分なスペースが含まれているため、フィールド区切り文字のスペースまたはスラッシュ/を使用します。

実際のデータに余分なスペースがなくても、上記の解決策はまだうまく機能します。

awkの論理は次のとおりです。中間列（/d_4/）をスキップしてuniq -uをシミュレートします。
file1とfile2の間のすべての一意の行（awkで連結）のみを印刷します。

テスト（オンラインテストもご覧ください)

cat file1 
cat file2 
echo "awk start:"
awk -F" |/" '{a=$1$2$4$5;seen[a]++;out[a]=$0}END{for (i in seen) if (seen[i]==1) print out[i]}' file1 file2
echo "awk end"

#Output
#file1            
abc abc/d_4.1/efg 35
xyz abc/d_4.1/efg 36 
mno abc/d_4.1/efg 38
#file2
abc abc/d_4/efg 35
xyz abc/d_4/efg 36 
mno abc/d_4/efg 40

awk start:      
mno abc/d_4/efg 40
mno abc/d_4.1/efg 38
awk end

Answer 1