コールスタックは具体的にどのように機能しますか? 質問する

Question

コールスタックはフレームスタックとも呼ばれます。
物事は積み重ねられたLIFO原則の後には、ローカル変数ではなく、呼び出される関数のスタックフレーム全体（「呼び出し」）があります。ローカル変数は、いわゆる関数プロローグそしてエピローグ、それぞれ。

フレーム内では変数の順序は完全に指定されていません。コンパイラフレーム内のローカル変数の位置を「並べ替える」プロセッサが可能な限り速くフェッチできるように、それらの配置を適切に最適化します。重要な事実は、固定アドレスに対する変数のオフセットはフレームの存続期間中一定である- つまり、フレーム自体のアドレスなどのアンカーアドレスを取得し、そのアドレスの変数へのオフセットを操作するだけで十分です。このようなアンカーアドレスは、実際にはいわゆるベースまたはフレームポインタこれは EBP レジスタに格納されます。一方、オフセットはコンパイル時に明確にわかっているため、マシンコードにハードコードされます。

このグラフィックはウィキペディア典型的なコールスタックの構造を示します¹ :

スタックの画像

アクセスしたい変数のオフセットをフレームポインターに含まれるアドレスに追加すると、変数のアドレスが取得されます。簡単に言うと、コードはベースポインターからの一定のコンパイル時オフセットを介して直接アクセスするだけです。これは単純なポインター演算です。

例

#include <iostream>

int main()
{
    char c = std::cin.get();
    std::cout << c;
}

gcc.godbolt.org私たちに与える

main:
    pushq   %rbp
    movq    %rsp, %rbp
    subq    $16, %rsp

    movl    std::cin, %edi
    call    std::basic_istream<char, std::char_traits<char> >::get()
    movb    %al, -1(%rbp)
    movsbl  -1(%rbp), %eax
    movl    %eax, %esi
    movl    std::cout, %edi
    call    [... the insertion operator for char, long thing... ]

    movl    $0, %eax
    leave
    ret

.. for main. コードを 3 つのサブセクションに分割しました。関数のプロローグは、最初の 3 つの操作で構成されます。

ベースポインタがスタックにプッシュされます。
スタックポインタはベースポインタに保存されます
ローカル変数のためのスペースを確保するためにスタックポインタが減算されます。

次に、cinEDI レジスタ²に移動され、get呼び出されます。戻り値は EAX にあります。

ここまでは順調です。ここで興味深いことが起こります。

8ビットレジスタALで指定されたEAXの下位バイトが取得され、ベースポインタの直後のバイトに格納される: つまり-1(%rbp)、ベースポインタのオフセットはです-1。このバイトは変数ですcオフセットは負です。x86 ではスタックが下向きに大きくなるためです。次の操作はcEAX に格納されます。EAX は ESI に移動され、coutEDI に移動され、挿入演算子が引数としてcoutおよびで呼び出されます。c

ついに、

の戻り値はmainEAX: 0 に格納されます。これは暗黙のreturnステートメントのためです。xorl rax raxの代わりにが表示される場合もありますmovl。
出発して呼び出しサイトに戻る。leaveこのエピローグを省略し、暗黙的に
- スタックポインタをベースポインタに置き換え、
- ベースポインタをポップします。

この操作とがret実行された後、フレームは事実上ポップされますが、cdecl 呼び出し規約を使用しているため、呼び出し元は引数をクリーンアップする必要があります。stdcall などの他の規約では、呼び出し先が、たとえばバイト数をに渡すことによって、クリーンアップする必要がありますret。

フレームポインタ省略

ベース/フレームポインターからのオフセットではなく、スタックポインター（ESB）からのオフセットを使用することもできます。これにより、フレームポインター値を格納するEBPレジスターが任意の用途に使用できるようになりますが、一部のマシンではデバッグが不可能、そして一部の機能では暗黙的にオフになっていますこれは、x86 などのレジスタが少ないプロセッサ用にコンパイルする場合に特に便利です。

この最適化はFPO（フレームポインタ省略）として知られており、-fomit-frame-pointerGCCと-OyClangではによって設定されます。デバッグが可能な場合にのみ、最適化レベルが0を超えるたびに暗黙的にトリガーされることに注意してください。それ以外のコストはかかりません。詳細については、ここそしてここ。

¹コメントで指摘されているように、フレームポインターはおそらく戻りアドレスの後のアドレスを指すことを意図しています。

² R で始まるレジスタは、E で始まるレジスタの 64 ビット版であることに注意してください。EAX は、RAX の下位 4 バイトを表します。わかりやすくするために、32 ビットレジスタの名前を使用しました。

Answer 1

コールスタックはフレームスタックとも呼ばれます。
物事は積み重ねられたLIFO原則の後には、ローカル変数ではなく、呼び出される関数のスタックフレーム全体（「呼び出し」）があります。ローカル変数は、いわゆる関数プロローグそしてエピローグ、それぞれ。

フレーム内では変数の順序は完全に指定されていません。コンパイラフレーム内のローカル変数の位置を「並べ替える」プロセッサが可能な限り速くフェッチできるように、それらの配置を適切に最適化します。重要な事実は、固定アドレスに対する変数のオフセットはフレームの存続期間中一定である- つまり、フレーム自体のアドレスなどのアンカーアドレスを取得し、そのアドレスの変数へのオフセットを操作するだけで十分です。このようなアンカーアドレスは、実際にはいわゆるベースまたはフレームポインタこれは EBP レジスタに格納されます。一方、オフセットはコンパイル時に明確にわかっているため、マシンコードにハードコードされます。

このグラフィックはウィキペディア典型的なコールスタックの構造を示します¹ :

スタックの画像

アクセスしたい変数のオフセットをフレームポインターに含まれるアドレスに追加すると、変数のアドレスが取得されます。簡単に言うと、コードはベースポインターからの一定のコンパイル時オフセットを介して直接アクセスするだけです。これは単純なポインター演算です。

例

#include <iostream>

int main()
{
    char c = std::cin.get();
    std::cout << c;
}

gcc.godbolt.org私たちに与える

main:
    pushq   %rbp
    movq    %rsp, %rbp
    subq    $16, %rsp

    movl    std::cin, %edi
    call    std::basic_istream<char, std::char_traits<char> >::get()
    movb    %al, -1(%rbp)
    movsbl  -1(%rbp), %eax
    movl    %eax, %esi
    movl    std::cout, %edi
    call    [... the insertion operator for char, long thing... ]

    movl    $0, %eax
    leave
    ret

.. for main. コードを 3 つのサブセクションに分割しました。関数のプロローグは、最初の 3 つの操作で構成されます。

ベースポインタがスタックにプッシュされます。
スタックポインタはベースポインタに保存されます
ローカル変数のためのスペースを確保するためにスタックポインタが減算されます。

次に、cinEDI レジスタ²に移動され、get呼び出されます。戻り値は EAX にあります。

ここまでは順調です。ここで興味深いことが起こります。

8ビットレジスタALで指定されたEAXの下位バイトが取得され、ベースポインタの直後のバイトに格納される: つまり-1(%rbp)、ベースポインタのオフセットはです-1。このバイトは変数ですcオフセットは負です。x86 ではスタックが下向きに大きくなるためです。次の操作はcEAX に格納されます。EAX は ESI に移動され、coutEDI に移動され、挿入演算子が引数としてcoutおよびで呼び出されます。c

ついに、

の戻り値はmainEAX: 0 に格納されます。これは暗黙のreturnステートメントのためです。xorl rax raxの代わりにが表示される場合もありますmovl。
出発して呼び出しサイトに戻る。leaveこのエピローグを省略し、暗黙的に
- スタックポインタをベースポインタに置き換え、
- ベースポインタをポップします。

この操作とがret実行された後、フレームは事実上ポップされますが、cdecl 呼び出し規約を使用しているため、呼び出し元は引数をクリーンアップする必要があります。stdcall などの他の規約では、呼び出し先が、たとえばバイト数をに渡すことによって、クリーンアップする必要がありますret。

フレームポインタ省略

ベース/フレームポインターからのオフセットではなく、スタックポインター（ESB）からのオフセットを使用することもできます。これにより、フレームポインター値を格納するEBPレジスターが任意の用途に使用できるようになりますが、一部のマシンではデバッグが不可能、そして一部の機能では暗黙的にオフになっていますこれは、x86 などのレジスタが少ないプロセッサ用にコンパイルする場合に特に便利です。

この最適化はFPO（フレームポインタ省略）として知られており、-fomit-frame-pointerGCCと-OyClangではによって設定されます。デバッグが可能な場合にのみ、最適化レベルが0を超えるたびに暗黙的にトリガーされることに注意してください。それ以外のコストはかかりません。詳細については、ここそしてここ。

¹コメントで指摘されているように、フレームポインターはおそらく戻りアドレスの後のアドレスを指すことを意図しています。

² R で始まるレジスタは、E で始まるレジスタの 64 ビット版であることに注意してください。EAX は、RAX の下位 4 バイトを表します。わかりやすくするために、32 ビットレジスタの名前を使用しました。

コールスタックは具体的にどのように機能しますか? 質問する

ベストアンサー1

例

フレームポインタ省略

おすすめ記事