直接Linuxカーネル呼び出しとPOSIX指定関数呼び出しのパフォーマンス

直接Linuxカーネル呼び出しとPOSIX指定関数呼び出しのパフォーマンス

スタックオーバーフローに対する回答、質問に記載されているいくつかの小さなタスクを実行するためのコード例を提供しました。元の質問は、どのスキルが最も速く実行されるかに関するものでした(したがって、ここではパフォーマンス基準が適用されます)。

別のコメント提示者/回答では、POSIX定義システムAPI呼び出し(この場合readdir)を作成する代わりに提案しました。直接システムはカーネル(syscall(SYS_getdents,...))を呼び出し、パフォーマンスの差が25%の範囲にあると主張します。 (実装もベンチマークもしませんでした。実際にパフォーマンスが良くなると思います。)

私の質問は、提案されたシステムコールベースのソリューションのパフォーマンス特性についてです。なぜより速いかもしれません。パフォーマンスが良いいくつかの理由を考えてみましょう。

  1. POSIXはreaddir本質的にsyscall(SYS_getdents,...)/より複雑です。getdents()
  2. readdir(おそらく呼び出しはsyscall(SYS_getdents,...)間接的なオーバーヘッドを追加するだけです。
  3. readdir(カーネル呼び出しごとに)1つのレコードのみを返しますが、syscall(SYS_getdents,...)/getdents()`は(おそらく)カーネル呼び出しごとに複数のレコードを返します。

上記の#1は本当とは想像できません。 glibcの実装は、directよりも「実際の」システムコールを呼び出すことができないほど似ていますreaddirgetdentsreaddirsyscall(SYS_getdents,...)getdents()

readdirまた、呼び出しがラップされ、呼び出しgetdentsも可能であるため、#2は真であると想像することはできません(提案された答えは直接呼び出すのではなく具体的​​に使用されます)。 Linuxのglibcのすべては、おそらくこの場合#2になります。syscall(SYS_getdents,...)getdentssyscall(SYS_getdents,...)getdentssyscall(syscallid, args)はい本当。

私の考えでは、最後の可能性が最高の説明です。カーネル呼び出しが少ないほどパフォーマンスが向上します。

「直接カーネル呼び出し」がPOSIX定義関数を呼び出すよりもはるかに速い理由の具体的な説明はありますか?

ベストアンサー1

PLTこれがLinuxで最も高価な呼び出しの1つであることを考えると、間接参照や可変引数(レジスタはメモリに保存する必要があります)などの要因はsyscall()'sほとんど影響しません。getdents

私のコンピュータでは、空のディレクトリを完全に読み取るのに約5μsかかります。

fdopendir+readdir効果は、getdentsバッファ割り当て/使用可能(0.1μs)を追加し、stat提供されたfdがディレクトリタイプ(0.4μs)であることを確認することです。readdir次に、各ディレクトリエントリに対して簡単な呼び出しを実行します(バッファ内の1つの場所を移動して再入力できます)。

したがって、ワンタイムオーバーヘッドは0.5μsです。これは空のディレクトリのディレクトリスキャン時間の10%ですが、100エントリディレクトリの場合は1%にすぎず、大きなディレクトリではほとんど無視できます。 fdopenが必要ない場合、このオーバーヘッドは5倍になります(割り当て/無料コストのみ)。 (diropen直接使用できない場合はfdopenのみが必要です(例: 'ted)、ファイルディスクリプタを別途入手する必要がありますopenat。)

したがって、カスタムワンタイム割り当てバッファを使用するgetdents場合ディレクトリであり、大きなディレクトリではほとんど無視できます。

呼び出しの場合、readdirPLT間接コストは最新のハードウェアでは通常1ns未満で、関数呼び出しのオーバーヘッドは約1〜2nsです。ディレクトリスキャン時間がマイクロ秒程度であることを考慮すると、readdirこれらの要素を単一のμsに変換するには少なくとも1000回の呼び出しが必要ですが、スキャンコストは340μsで、累積された1μsはそのうち約0.3%です。影響は次のとおりです。無視できる。これをインライン化するとreaddir(したがってコールオーバーヘッドとPLTオーバーヘッドを削除する)、コード拡張にのみ役立ちますが、getdentsボトルネックが発生するため、パフォーマンスは大幅に向上しません。

(追加のロックによりコストが高くなりますが、通常の呼び出しは通常スレッドセーフなので、readdir_r必要はありません。readdir_rreaddir〜しない限りあなたはそれらを呼び出すいくつかのスレッドを持っています同じディレクトリストリーム。 POSIXはまだこれを明示的に明らかにしていないかもしれませんが、glibcがもう使用されていないことを考えると、この保証はすぐに標準化されるべきだと思いますreaddir_r。 )

おすすめ記事