ファイルの読み取り日を1行ずつ完了します。

ファイルの読み取り日を1行ずつ完了します。

2つの列を持つテキストファイルがあります。最初の項目には日付(DD/MM/YYYY)が含まれ、2番目の項目には数値が含まれます。次のようになります。

15/01/1945 105.0
16/01/1945   4.2
17/01/1945   3.0
31/01/1945  12.0
01/02/1945   3.0
02/02/1945 125.0
05/02/1945   0.3

次の条件でファイルを入力する必要があります。

  1. 最初の日付1945年1月1日
  2. 最終日2021年12月31日
  3. 日付は連続する必要があり、行間には1日が必要です。
  4. 日付が欠落している場合は、正しい日付と数字(99.0)で行を完成させる必要があります。

したがって、最終ファイルは次のようになります。

01/01/1945 -99.0
02/01/1945 -99.0
03/01/1945 -99.0
04/01/1945 -99.0
05/01/1945 -99.0
06/01/1945 -99.0
07/01/1945 -99.0
08/01/1945 -99.0
09/01/1945 -99.0
10/01/1945 -99.0
11/01/1945 -99.0
12/01/1945 -99.0
13/01/1945 -99.0
14/01/1945 -99.0
15/01/1945 105.0
16/01/1945   4.2
17/01/1945   3.0
18/01/1945 -99.0
19/01/1945 -99.0
20/01/1945 -99.0
21/01/1945 -99.0
22/01/1945 -99.0
23/01/1945 -99.0
24/01/1945 -99.0
25/01/1945 -99.0
26/01/1945 -99.0
27/01/1945 -99.0
28/01/1945 -99.0
29/01/1945 -99.0
30/01/1945 -99.0
31/01/1945  12.0
01/02/1945   3.0
02/02/1945 125.0
03/02/1945 -99.0
04/02/1945 -99.0
05/02/1945   0.3
06/02/1945 -99.0
07/02/1945 -99.0
...
30/12/2021 -99.0
31/12/2021 -99.0

Fortranプログラムを試しましたが、うまくいきません。 awkやsed、またはその両方を使用することが可能だと思います。

Edのスクリプトを読んだときに得たものは次のとおりです。

meteo@poniente:/datos$ cat awk.script
#!/bin/bash
cat tst.awk
awk { dates2vals[$1] = $2 }
END {
    begDate = "01/01/1945"
    endDate = "31/12/2000"
    begSecs = mktime(gensub("(.*)/(.*)/(.*)","\\3 \\2 \\1 12 00 00",1,begDate))
    daySecs = 24 * 60 * 60
    for (curSecs=begSecs; curDate!=endDate; curSecs+=daySecs) {
        curDate = strftime("%d/%m/%Y",curSecs)
        print curDate, (curDate in dates2vals ? dates2vals[curDate] : "-99.0")
    }
}

Edのスクリプトを実行すると、次のような結果が得られます。

meteo@poniente:/datos$ ./tst.awk
01/01/1946   3.0
02/01/1946  14.2
...
14/11/2021   0.0
15/11/2021   0.0
16/11/2021   0.0
17/11/2021   0.0
18/11/2021   0.0
19/11/2021   0.0
20/11/2021   0.0
21/11/2021   0.0
22/11/2021  54.1
23/11/2021 -99.0
24/11/2021  27.4
25/11/2021   0.0
29/11/2021   0.0
30/11/2021   0.0
awk: li­ne ord.:1: {
awk: line ord.:1:  ^ unexpected newline or end of string
./awk.script: li­ne 4: END: command not found
./awk.script: li­ne 5: begDate: command not found
./awk.script: li­ne 6: endDate: command not found
./awk.script: li­ne 7: syntax error near unexpected element `('
./awk.script: li­ne 7: `    begSecs = mktime(gensub("(.*)/(.*)/(.*)","\\3 \\2 \\1 12 00 00",1,begDate))'
meteo@poniente:/datos$

ベストアンサー1

seq(epoch秒単位:start、delta = 1day、end)とdateデフォルト値-fを使用-99.0し、可能であれば次のように置き換えて長いリストを作成しますawk

seq -f"@%.0f" -- -788878800 86400 1640905200 | date -uf- +"%d/%m/%Y -99.0" | awk 'FNR==NR {A[$1] = $2; next} $1 in A {$2 = A[$1]} 1' file - 
01/01/1945 -99.0
02/01/1945 -99.0
.
.
.

14/01/1945 -99.0
15/01/1945 105.0
16/01/1945 4.2
17/01/1945 3.0
18/01/1945 -99.0
19/01/1945 -99.0
20/01/1945 -99.0
21/01/1945 -99.0
22/01/1945 -99.0
23/01/1945 -99.0
24/01/1945 -99.0
25/01/1945 -99.0
26/01/1945 -99.0
27/01/1945 -99.0
28/01/1945 -99.0
29/01/1945 -99.0
30/01/1945 -99.0
31/01/1945 12.0
01/02/1945 3.0
02/02/1945 125.0
03/02/1945 -99.0
04/02/1945 -99.0
05/02/1945 0.3
06/02/1945 -99.0
07/02/1945 -99.0
08/02/1945 -99.0
09/02/1945 -99.0
10/02/1945 -99.0
.
.
.
28/12/2021 -99.0
29/12/2021 -99.0
30/12/2021 -99.0

おすすめ記事