NFSファイルの移動/削除操作が失敗する原因は何ですか？

Question

短い答え：ローカルNFSはファイルやディレクトリが存在しないと思います。（はい、少し懐疑的でした）

NFSは古い技術です。トラフィックが多く、急速に変化するファイルには適していません。動的共有ファイルシステムでは、OCFS2（私のお気に入り）やGluster（まあ、ダークサイド）などのクラスタソリューションを試してください。

数年前、私たちは共通のNFSインストールを備えた4つのサーバーを持っていました。これら4つのサーバーはWebアプリケーションサーバーです。ユーザーはサーバーでパッケージを作成し、ファイルが完了したらファイルへのNFSパスを使用してデータベースの行を更新することを開始します。ユーザーのブラウザは、操作が完了したこと、ファイルをダウンロードする必要があることを確認するために10秒ごとに確認します。問題が発生していることがわかります。サーバーはファイルを含むデータベースの行を更新しますが、他のサーバーはユーザーのブラウザから要求を受け取ります。つまり、ファイルを読み込んで「ファイルが見つかりません」というエラーが発生します。

あなたが言ったように、ファイルは管理者が見るときにそこにあります。複数のエンジニアが問題を見つけるのに数週間かかりました。デフォルトでは、データベースに表示される最後に生成されたファイルパスを取得し、そのファイルをログに書き込む10秒のスリープループを実行します。ファイルはそのファイルを作成したシステムでは常に表示できますが、他のシステムでは一定期間はそのファイルを表示できません。サーバー負荷が増加すると、時間間隔が長くなります。

先のとがった上司は、デフォルトのNFSをクラスタファイルシステムに変更したくないので、ワーカーサーバーに「彼」がデータベースにファイルを作成した人であることを保存するようにしました。ユーザーの要求は、ジョブが完了してファイルが生成されたサーバーに要求が届くまで再試行されるため、常にファイルを読み取ることができます。はい、わかりました。決定的な時期。しかし、それは古い技術を維持することを決めたときに得ることができるものです。仕事がうまくいくためには一緒になる必要があります。古い技術は最初のパッチワークでした。 Max HeadroomのFS選択で80年代に戻ったことを歓迎します。

NFS では、すべてのクライアントがすべての変更をリアルタイムで同期することはできません。したがって、あるクライアントがファイル/ディレクトリを作成し、別のクライアントがそれを見ることができない、またはあるクライアントがファイル/ディレクトリを削除しても、別のクライアントがそれがまだ存在していると思う状況が引き続き発生します（使用しようとするまで -申し訳ありません）。

我々は、ファイルを読み取ろうとする前に、システムがクライアントキャッシュを再同期するために様々なトリックを試みた。起こりませんでした。

私の助言: あなたのFSを今世紀に持って来なさい。（磁束コンデンサ@88mphをお試しください）

Answer 1