fsync() が最初に呼び出されると rename() が長くかかるのはなぜですか?

Question

コミットの説明によれば、 rename() の遅延が次のために発生すると予想しました。Btrfs：新しい名前を記録した後のログ同期。これはカーネルv4.19に追加されました。

ハードリンクが作成されたとき、または名前が変更されたときに発生した新しいファイル名の履歴がログに残ります。

このアプローチはより簡単なだけでなく、[...] ext4、xfs、およびf2fs（および他のファイルシステム）と同じ動作を提供します。

2番目の文章が正しいとは思わない！

公平に言えば、dpkgパッケージが正しくインストールされていると記録する前に、ファイルを含むディレクトリをfsync（）することを忘れてしまったことを指摘する必要があります。ただし、このbtrfsの動作は、残りのLinuxとまったく一致しません。

私はXFSがrename（）で新しいディレクトリエントリを同期するとは信じていません（つまり、意図的にそれが続くのを待ちます）。 XFS rename() 内の同期書き込みに関する私の前提は、部分的に次のスレッドに基づいています。https://marc.info/?l=linux-xfs&m=139863577410237&w=2

ext4の場合、私が言及した証拠は次のとおりです。fsync()新しいディレクトリエントリが返される前に同期することができます。しかし、私はext4の rename() がこれを行うとは思いません。

最近の議論につながります。AIO fsync() 操作そして、メタデータ更新の効率的なバッチ処理を可能にする方法について説明します。通常、 rename() は同期操作ではないと仮定するため、仮想 AIO rename() については多くの議論はありません。

（通常、btrfsは私に少し不思議に思えます。つまり、ここ数回のリリースでこのデータ整合性のバグ修正が行われたのを見ましたが、ひどく聞こえる唯一のものではありません）。変更ログこのバージョンの場合）。

私は rename() 遅延がBTRFS_NEED_LOG_SYNC最後の行から返されるべきだと思います。btrfs_log_new_name()。

私が見つけた方法は次のとおりです。CPU時間オフ。スタックトレースで待ち時間を集計します。スタックトレースは次のとおりです。

io_schedule_timeout
wait_for_completion_io
write_all_supers
btrfs_sync_log
btrfs_sync_file
do_fsync
__x64_sys_fsync
do_syscall_64
entry_SYSCALL_64_after_hwframe
-                dpkg (23528)
    9735954

io_schedule_timeout
wait_for_completion_io
write_all_supers
btrfs_sync_log
btrfs_rename2
vfs_rename
do_renameat2
__x64_sys_rename
do_syscall_64
entry_SYSCALL_64_after_hwframe
-                dpkg (23528)
    9147785

io_schedule
bit_wait_io
__wait_on_bit
out_of_line_wait_on_bit
write_all_supers
btrfs_sync_log
btrfs_sync_file
do_fsync
__x64_sys_fsync
do_syscall_64
entry_SYSCALL_64_after_hwframe
-                dpkg (23528)
    4478158

io_schedule
bit_wait_io
__wait_on_bit
out_of_line_wait_on_bit
write_all_supers
btrfs_sync_log
btrfs_rename2
vfs_rename
do_renameat2
__x64_sys_rename
do_syscall_64
entry_SYSCALL_64_after_hwframe
-                dpkg (23528)
    4376109

Answer 1