列番号が正しくない制御ファイルに基づいて列を選択するには?

列番号が正しくない制御ファイルに基づいて列を選択するには?

次の制御ファイルに基づいてソースファイルからファイルを動的に生成する必要があります。

control_file.txt 
1,3,5,-1,8,-1,4

制御ファイルには、ソースファイル内の必要な列の場所が含まれています。

例:1列、3列、5列、空欄(-1は空欄を意味)など

制御ファイルから場所を1つずつ読み取り、複数のファイルを生成するシェルを作成しました。次に、-1の値でタッチファイルを生成する場合は、最後に貼り付けコマンドを使用して新しいファイルを生成します。ファイルの順序に従ってオプションで貼り付けますls-v

したがって、私の既存のシェルは次のようになります。

if [ position != -1 ]
then
cut -d, -f$position > file_$var.csv 
else
touch file_$var.csv
fi
paste -d, $(ls -v file_*.csv) > newe_file.csv

ファイルへのI / Oを最小限に抑える方法があることを願っています。

cut -d, -f1,3,5 > file1.csv
touch file2.csv
cut -d, -f8 > file3.csv
touch file4.csv
cut -d, -f4 > file5.csv

あるいは、より良い解決策が良いでしょう。

ソースファイルの列数は何百もの列になります。

予想される結果:

input-file is sample.csv

col1,col2,col3,col4,col5,col6,col7,col8
1,2,3,4,5,6,7,8
9,10,11,12,13,14,15,16

出力.csv:

col1,col3,col5,-1,col8,-1,col4
1,3,5,,8,,4
9,11,13,,16,,12

.csvベースの出力controlfile.txt

ベストアンサー1

他の答えよりも少し簡単な別の答えは次のとおりです。

#!/bin/bash
fields=$(sed -r -e 's/-1/ /g' -e 's/,/ FS /g' \
  -e 's/([0-9]+)/\$\1/g' control_file.txt)
awk -F, "{print ${fields}}" $1

control_file.txt最初のコマンドは適切なコマンドに変換されますawk

$1 FS $3 FS $5 FS FS $8 FS FS $4

実行してください:

$ ./script.sh input.csv
col1,col3,col5,,col8,,col4
1,3,5,,8,,4
9,11,13,,16,,12

他のサンプルから:

$ ./script.sh sample.csv
BP ID,CurrentMonetary balance ,Provider contract id,,End Date,,charge Plan names 
1100001538,251,00000000000000000141,,18-Oct-12,,[B2] R2 LTE CHARGE PLAN 
1100003404,45.22,00000000000000009349,,23-Nov-13,,B0.3 ECS_CHARGE_PLAN DROP1 V3

おすすめ記事