awk 動的文字列の一致

Question

配列の配列にGNU awkを使用する：

$ cat tst.awk
NR==FNR {
    file = $NF
    name = $1 (NF>2 ? " " $2 : "")
    if ( !(file in file2names) && ((getline line < file) > 0) ) {
        close(file)
        ARGV[ARGC++] = file
    }
    file2names[file][name]
    next
}
{
    $0 = " " $0 " "
    for (name in file2names[FILENAME]) {
        if ( pos = index($0," "name" ") ) {
            split(substr($0,1,pos),bef)
            split(substr($0,pos+length(name)+1),aft)
            print name, bef[1], bef[2], aft[1], aft[2]
        }
    }
}

$ awk -f tst.awk file
Ito path of etmlmbimiiit tlmmgli

最初の1つまたは2つ（以下の説明を参照）だけでなく、「file」のすべてのファイル名以前の文字列を名前の一部として含めるには、次のように変更します。

name = $1 (NF>2 ? " " $2 : "")

これに対してゴークはこう述べた。

name = gensub(/\s+\S+$/,"",1)

またはいずれにせよ：

name = $0
sub(/ +[^ ]+$/,"",name)

他のawkと同様に、ファイル名をスペースで区切られた文字列として保存します。たとえば、次の手順file2names[file][name]を実行するfile2names[file] = (file in file2names ? file2names[file] FS : "") nameのではなく、ループを実行する前に分割します。for (name in file2names[file])split(file2names[FILENAME],names); for (name in names)

上記の入力はfile例の最初のファイルにすぎません。

Answer 1