λ計算の最適評価器が式なしで大きなモジュラー指数を計算できるのはなぜですか? 質問する

Question

この現象は、共有されるベータ削減ステップの量から生じます。これは、Haskell スタイルの遅延評価 (または、この点ではそれほど遠くない通常の値渡し) と、Vuillemin-Lévy-Lamping-Kathail-Asperti-Guerrini (その他) の「最適な」評価では大幅に異なる可能性があります。これは一般的な機能であり、この特定の例で使用できる算術式とはまったく無関係です。

共有とは、ラムダ項の表現を持ち、1つの「ノード」が、表現する実際のラムダ項の複数の類似部分を記述できることを意味します。たとえば、次の項を表現できます。

\x. x ((\y.y)a) ((\y.y)a)

を表すサブグラフが 1 つだけ出現し、そのサブグラフをターゲットとする 2 つのエッジがある (有向非巡回) グラフを使用します(\y.y)a。Haskell の用語では、1 回だけ評価する 1 つのサンクと、このサンクへの 2 つのポインターがあります。

Haskell スタイルのメモ化は、完全なサブタームの共有を実装します。このレベルの共有は、有向非巡回グラフで表すことができます。最適な共有にはこの制限はありません。グラフ表現に循環を意味する可能性のある「部分的な」サブタームも共有できます。

これら2つのレベルの共有の違いを理解するには、次の用語を考えてみましょう。

\x. (\z.z) ((\z.z) x)

Haskell の場合のように共有が完全な部分項に制限されている場合、は 1 つしか出現しない可能性があります\z.zが、ここでの 2 つのベータリデックスは別個になります。1 つはで(\z.z) x、もう 1 つはであり(\z.z) ((\z.z) x)、これらは等しい項ではないため共有できません。部分的な部分項の共有が許可されている場合は、部分項(\z.z) [](関数だけでなく、「に適用された\z.z関数」)を共有できるようになります。\z.z何か）、これは1ステップで評価され、何か、この引数が何であれ。したがって、1 つのノードだけが\z.z2 つの異なる引数への 2 つの適用を表し、これらの 2 つの適用を 1 つのステップで簡約できるグラフを作成できます。このノードにはサイクルがあることに注目してください。これは、「最初の発生」の引数がまさに「2 番目の発生」であるためです。最後に、最適な共有により、ベータ削減の 1 つのステップ (およびいくつかのブックキーピング) で、 (表すグラフ)\x. (\z.z) ((\z.z) x))から (表すグラフ) の結果に移行でき\x.xます。これは基本的に、最適な評価で発生することです (また、グラフ表現はスペース爆発を防ぐものでもあります)。

もう少し詳しい説明については、論文をご覧ください。弱い最適性と共有の意味(あなたが興味を持っているのは、序論とセクション 4.1、そしておそらく最後の参考文献のポインターの一部です)。

あなたの例に戻ると、チャーチ整数で動作する算術関数のコーディングは、最適評価器が主流の言語よりも優れたパフォーマンスを発揮できる「よく知られた」例の宝庫の1つです（この文でよく知られているというのは、実際には少数の専門家がこれらの例を知っているという意味です）。そのような例をもっと知りたい場合は、論文をご覧ください。安全なオペレーター: 括弧は永久に閉じるAsperti と Chroboczek による (ちなみに、ここでは EAL 型付けできない興味深いラムダ項が見つかります。そのため、この Asperti/Chroboczek の論文から始めて、オラクルを調べることをお勧めします)。

あなた自身が言ったように、この種のエンコードはまったく実用的ではありませんが、それでも何が起こっているかを理解するための優れた方法です。そして、さらなる調査のための課題で締めくくりたいと思います。これらの悪いと思われるエンコードの最適評価が、合理的なデータ表現の従来の評価と実際に同等である例を見つけることができるでしょうか? (私の知る限り、これは本当に未解決の問題です)。

Answer 1

この現象は、共有されるベータ削減ステップの量から生じます。これは、Haskell スタイルの遅延評価 (または、この点ではそれほど遠くない通常の値渡し) と、Vuillemin-Lévy-Lamping-Kathail-Asperti-Guerrini (その他) の「最適な」評価では大幅に異なる可能性があります。これは一般的な機能であり、この特定の例で使用できる算術式とはまったく無関係です。

共有とは、ラムダ項の表現を持ち、1つの「ノード」が、表現する実際のラムダ項の複数の類似部分を記述できることを意味します。たとえば、次の項を表現できます。

\x. x ((\y.y)a) ((\y.y)a)

を表すサブグラフが 1 つだけ出現し、そのサブグラフをターゲットとする 2 つのエッジがある (有向非巡回) グラフを使用します(\y.y)a。Haskell の用語では、1 回だけ評価する 1 つのサンクと、このサンクへの 2 つのポインターがあります。

Haskell スタイルのメモ化は、完全なサブタームの共有を実装します。このレベルの共有は、有向非巡回グラフで表すことができます。最適な共有にはこの制限はありません。グラフ表現に循環を意味する可能性のある「部分的な」サブタームも共有できます。

これら2つのレベルの共有の違いを理解するには、次の用語を考えてみましょう。

\x. (\z.z) ((\z.z) x)

Haskell の場合のように共有が完全な部分項に制限されている場合、は 1 つしか出現しない可能性があります\z.zが、ここでの 2 つのベータリデックスは別個になります。1 つはで(\z.z) x、もう 1 つはであり(\z.z) ((\z.z) x)、これらは等しい項ではないため共有できません。部分的な部分項の共有が許可されている場合は、部分項(\z.z) [](関数だけでなく、「に適用された\z.z関数」)を共有できるようになります。\z.z何か）、これは1ステップで評価され、何か、この引数が何であれ。したがって、1 つのノードだけが\z.z2 つの異なる引数への 2 つの適用を表し、これらの 2 つの適用を 1 つのステップで簡約できるグラフを作成できます。このノードにはサイクルがあることに注目してください。これは、「最初の発生」の引数がまさに「2 番目の発生」であるためです。最後に、最適な共有により、ベータ削減の 1 つのステップ (およびいくつかのブックキーピング) で、 (表すグラフ)\x. (\z.z) ((\z.z) x))から (表すグラフ) の結果に移行でき\x.xます。これは基本的に、最適な評価で発生することです (また、グラフ表現はスペース爆発を防ぐものでもあります)。

もう少し詳しい説明については、論文をご覧ください。弱い最適性と共有の意味(あなたが興味を持っているのは、序論とセクション 4.1、そしておそらく最後の参考文献のポインターの一部です)。

あなたの例に戻ると、チャーチ整数で動作する算術関数のコーディングは、最適評価器が主流の言語よりも優れたパフォーマンスを発揮できる「よく知られた」例の宝庫の1つです（この文でよく知られているというのは、実際には少数の専門家がこれらの例を知っているという意味です）。そのような例をもっと知りたい場合は、論文をご覧ください。安全なオペレーター: 括弧は永久に閉じるAsperti と Chroboczek による (ちなみに、ここでは EAL 型付けできない興味深いラムダ項が見つかります。そのため、この Asperti/Chroboczek の論文から始めて、オラクルを調べることをお勧めします)。

あなた自身が言ったように、この種のエンコードはまったく実用的ではありませんが、それでも何が起こっているかを理解するための優れた方法です。そして、さらなる調査のための課題で締めくくりたいと思います。これらの悪いと思われるエンコードの最適評価が、合理的なデータ表現の従来の評価と実際に同等である例を見つけることができるでしょうか? (私の知る限り、これは本当に未解決の問題です)。

λ計算の最適評価器が式なしで大きなモジュラー指数を計算できるのはなぜですか? 質問する

ベストアンサー1

おすすめ記事