約100のクライアントで実行されるバックアップスクリプトがあり、通常はうまく機能します。これで、通常、問題のない1人の顧客に問題が発生しました。
この行は一般的にうまく機能します。
rsync -z --partial --times -vvvvv --recursive --log-file="/backup/clientx/clientx.debug-star2.log" --rsync-path="nice -n19 ionice -c3 rsync" --timeout=3600 --delete-after --bwlimit=500 --rsh "nice -n19 ionice -c3 ssh -o StrictHostKeyChecking=no -i /root/.ssh/clientx_rsync_id_rsa" /backup/clientx/dir1/ backup@remote-server:/backup/clientx/dir1
正常に起動し、ファイルリストの作成が開始されます。
note: iconv_open("UTF-8", "UTF-8") succeeded.
(Client) Protocol versions: remote=30, negotiated=30
building file list ...
[sender] change_dir(/backup/clinetx/dir1)
[sender] make_file(.,*,0)
[sender] make_file(inc,*,2)
[sender] make_file(clientx.log,*,2)
[sender] make_file(full,*,2)
[sender] make_file(inc/2015,*,2)
[sender] make_file(inc/2007,*,2)
[sender] make_file(inc/2012,*,2)
ただし、ファイルリストを作成せずに停止して終了します。
rsync: connection unexpectedly closed (9 bytes received so far) [sender]
[sender] _exit_cleanup(code=12, file=io.c, line=601): entered
rsync error: unexplained error (code 255) at io.c(601) [sender=3.0.7]
[sender] _exit_cleanup(code=12, file=io.c, line=601): about to call exit(255)
しかし、別のディレクトリで同じことを試しても大丈夫です。唯一の違いは、dir2
約1600個のファイルと約4300個のファイルがあることですdir1
。
私が言ったように、同じ数のファイルを持つ他のすべてのクライアントでうまくいきます。
ls -ld
dir1 - drwxrwx--- 4 root nagios 4096 May 23 20:59 .
dir2 - drwxrwx--- 7 root nagios 4096 Feb 22 2016 .
何が間違っているのか知っている人はいますか?
ベストアンサー1
ここでも同じ状況が発生します。 ISPがモデムにArrisを搭載したAT&T Fiberが提供する単一のリモートサイトのホストであることを除いて、古代のバックアップスクリプトはどこでも機能します。常に短い時間(2秒未満)動作し、突然接続が終了します。
ああ、私の最も暗い疑いは本当であることが証明されました。 rsync "--bwlimit"パラメーターに異なる値を使用して試行錯誤を経て、 "--bwlimit=56"以下では接続が切断されないことがわかりました。いつも"--bwlimit=57" 以上で中止します。
遠隔地でArrisモデム(192.168.1.254)のユーザーインターフェースを調べましたが、調整が必要な部分は見えませんでした。すべてのポートはそれを介してOpenWRT 18.06ルーター(「DMZplusモード」)に転送されます。このルータは、非常に似た設定を持つ他の複数のサイトの他の複数のルータと同じルータですが、どちらも接続を切断する問題はありません。
通信を56KB /秒に制限するのは恐ろしい解決策ですが、少なくともうまくいくようです。確かに衝撃的だ。 AT&Tに注意してください。 (この特定の孤立した地域を独占しています。)