systemdを使用したマルチキューアーキテクチャ

Question

ここでの最初の言及は、「コピー」、「同期化」（rsync？）、および「--delete」（これはrsyncについてさらに考える）という用語を使用することを見たことです。一方、キューの正しい実装はサービスです。説明することは問題になるはずです原子性各キューのファイル数。

キュープロセッサによって管理されるIN、PROCESSINGおよびがあると仮定すると、アトミックシステムコールを使用する必要があります。OUT名前変更(2)そしてリンク(2)（例：「ハードリンク」）複数のキュー間でファイルを移動またはコピー/コピーします。

別の問題は、ファイルをキューに収集することです。キューに書き込むプロセスは、作業がIN完了した後にのみディレクトリに入れるようにしてください。そうしないと、アトミック問題が再発生します（キュープロセッサがエントリを書き込むプロセスよりも速い場合は空のファイルが見つかります）。作成者がコンテンツを埋める時間があるまで）。

TMPこの問題に対する解決策は、キューシステムによって監視されないが、作成者が新しいエントリを保持するために使用する追加のディレクトリ（たとえば）を持つことです。作成者はそこに新しいファイルを作成し、内容を入力し、ファイルを閉じて使用します。名前変更(2)またはリンク(2)INこれをキューに移動し、キュープロセッサからピックアップできるようにします。

2つの別々のキューが欲しいことはよくわかりませんIN。QUEUEおそらく私が言及したのと同じアイデアでしょうTMP。しかし、2つのキュー間でアイテムを移動するバックグラウンドサービスについて話しましたが、焦点はTMPプロセスと同期してアイテムを送信することです。これは解決すべき原子性問題であるからです。

INsystemdサービスに関してキュー全体を実行し、その中の項目を選択し、一時的にここに移動し、タスクが完了すると最終的にダンプする単一のPROCESSINGsystemdサービスでタスクを実行できるようです。OUT

キュージョブの処理時間とジョブを開始できる速度に応じて（待機時間にまったく気にする場合）、キュープロセッサがアイドル状態のときにディレクトリを定期的にポーリングするなど、非常に簡単なジョブで開始するINだけで十分です。あります。キューが空の場合は、5秒または60秒ごとにポーリングし、操作が完了するとすぐにポーリングを開始できます。したがって、キューが使用されている場合、ジョブは引き続き実行されます。

はい、次のようなものを使用してくださいinotifyより効率的ですが、実際にはキューが空の場合にのみ可能です。キューがいっぱいになると、ジョブは継続して実行されるためです。タスクが完了した後、そこから新しいタスクを選択するためにディレクトリを再検索することになるからです（inotifyは実際にはできません）。

inotifyを使用することを決定した場合は、デーモン自体で実装することができ、引き続き実行できますが、キューが空の場合はinotifyを登録し、エントリが配置されるとスリープモードになります。キューから目覚めます。またはあなたは使用することができますシステムパス単位、この場合、キューが空のときにサービスを終了し、処理する項目がある場合にのみsystemdにサービスを開始させることができます。

どちらにもinotifyを使用すると、潜在的な競争条件があります。キューをスキャンして空いていることを発見し、眠りにつくことにした場合はどうなりますか？ただし、これを実行する直前に新しいジョブがキューに追加され、通知がトリガーされます。しかし、あなたが眠りに落ちる前に通知が到着するので、それはまだキューウォークモードなので、通知は必要ないと仮定して無視しますか？これにより、キューに項目がある間にプロセスがスリープ状態になり、他の項目がキューに入るまで（または場合）実際には目が覚めません。

したがって、inotifyを画像にインポートすることを2回考えてください（直接またはシステムパス単位を介して）。これはかなりの複雑さをもたらし、かなり大きな間隔のクエリで実行できる場合は必ずしも処理する必要はありません。。

この指示が役に立つことを願っています！

Answer 1