弱頭部正規形とは何ですか? 質問する

Question

簡単に説明してみます。他の人が指摘しているように、頭部正規形は Haskell には適用されないので、ここでは考慮しません。

正規形

通常形式の式は完全に評価され、サブ式はそれ以上評価できません (つまり、評価されていないサンクは含まれません)。

これらの式はすべて正規形です。

42
(2, "hello")
\x -> (x + 1)

これらの式は正規形ではありません:

1 + 2                 -- we could evaluate this to 3
(\x -> x + 1) 2       -- we could apply the function
"he" ++ "llo"         -- we could apply the (++)
(1 + 1, 2 + 2)        -- we could evaluate 1 + 1 and 2 + 2

弱頭部正規形

弱頭部正規形の式は、最も外側のデータコンストラクタまたはラムダ抽象化 (頭部)まで評価されています。部分式は評価されている場合もされていない場合もあります。したがって、すべての正規形式は弱頭部正規形でもありますが、その逆は一般には当てはまりません。

式が弱頭部正規形であるかどうかを判断するには、式の最も外側の部分を見るだけで済みます。データコンストラクターまたはラムダの場合は、弱頭部正規形です。関数適用の場合は、そうではありません。

これらの式は弱頭部正規形です:

(1 + 1, 2 + 2)       -- the outermost part is the data constructor (,)
\x -> 2 + 2          -- the outermost part is a lambda abstraction
'h' : ("e" ++ "llo") -- the outermost part is the data constructor (:)

前述のように、上にリストしたすべての正規形式は、弱ヘッド正規形でもあります。

これらの式は弱頭部正規形ではありません:

1 + 2                -- the outermost part here is an application of (+)
(\x -> x + 1) 2      -- the outermost part is an application of (\x -> x + 1)
"he" ++ "llo"        -- the outermost part is an application of (++)

スタックオーバーフロー

式を弱頭部正規形に評価するには、まず他の式を WHNF に評価する必要がある場合があります。たとえば、1 + (2 + 3)WHNF に評価するには、まずを評価する必要があります2 + 3。単一の式を評価することでこのようなネストされた評価が多すぎると、スタックオーバーフローが発生します。

これは、式の大部分が評価されるまでデータコンストラクターやラムダを生成しない大きな式を構築した場合に発生します。これは、次のようなの使用によって発生することがよくありますfoldl。

foldl (+) 0 [1, 2, 3, 4, 5, 6]
 = foldl (+) (0 + 1) [2, 3, 4, 5, 6]
 = foldl (+) ((0 + 1) + 2) [3, 4, 5, 6]
 = foldl (+) (((0 + 1) + 2) + 3) [4, 5, 6]
 = foldl (+) ((((0 + 1) + 2) + 3) + 4) [5, 6]
 = foldl (+) (((((0 + 1) + 2) + 3) + 4) + 5) [6]
 = foldl (+) ((((((0 + 1) + 2) + 3) + 4) + 5) + 6) []
 = (((((0 + 1) + 2) + 3) + 4) + 5) + 6
 = ((((1 + 2) + 3) + 4) + 5) + 6
 = (((3 + 3) + 4) + 5) + 6
 = ((6 + 4) + 5) + 6
 = (10 + 5) + 6
 = 15 + 6
 = 21

式を弱ヘッド正規形にする前に、かなり深くまで進む必要があることに注意してください。

なぜ Haskell は内部の式を事前に縮約しないのかと疑問に思うかもしれません。これは Haskell の遅延によるものです。一般にすべての部分式が必要になるとは想定できないため、式は外側から内側に評価されます。

(GHC には、部分式が常に必要な状況を検出し、事前に評価できる厳密性アナライザーがあります。ただし、これは最適化に過ぎず、オーバーフローを回避するためにこれに頼るべきではありません)。

一方、次のような表現は完全に安全です。

data List a = Cons a (List a) | Nil
foldr Cons Nil [1, 2, 3, 4, 5, 6]
 = Cons 1 (foldr Cons Nil [2, 3, 4, 5, 6])  -- Cons is a constructor, stop.

すべての部分式を評価する必要があることがわかっている場合に、このような大きな式を構築することを避けるために、内部部分を事前に強制的に評価する必要があります。

`seq`

seqは、式を強制的に評価するために使用される特別な関数です。その意味は、が弱頭部正規形に評価されるたびに、も弱頭部正規形に評価されるseq x yことを意味します。yx

foldl'これは、の厳密な変形であるの定義でも使用されていますfoldl。

foldl' f a []     = a
foldl' f a (x:xs) = let a' = f a x in a' `seq` foldl' f a' xs

の各反復は、foldl'アキュムレータを WHNF に強制します。したがって、大きな式の構築が回避され、スタックのオーバーフローが回避されます。

foldl' (+) 0 [1, 2, 3, 4, 5, 6]
 = foldl' (+) 1 [2, 3, 4, 5, 6]
 = foldl' (+) 3 [3, 4, 5, 6]
 = foldl' (+) 6 [4, 5, 6]
 = foldl' (+) 10 [5, 6]
 = foldl' (+) 15 [6]
 = foldl' (+) 21 []
 = 21                           -- 21 is a data constructor, stop.

しかし、HaskellWiki の例で述べられているように、アキュムレータは WHNF にのみ評価されるため、これはすべてのケースで役立つわけではありません。以下の例では、アキュムレータはタプルであるため、タプルコンストラクターの評価のみが強制され、accorは強制されませんlen。

f (acc, len) x = (acc + x, len + 1)

foldl' f (0, 0) [1, 2, 3]
 = foldl' f (0 + 1, 0 + 1) [2, 3]
 = foldl' f ((0 + 1) + 2, (0 + 1) + 1) [3]
 = foldl' f (((0 + 1) + 2) + 3, ((0 + 1) + 1) + 1) []
 = (((0 + 1) + 2) + 3, ((0 + 1) + 1) + 1)  -- tuple constructor, stop.

accこれを回避するには、タプルコンストラクターを評価すると、との評価が強制されるようにする必要がありますlen。これはを使用することで実現しますseq。

f' (acc, len) x = let acc' = acc + x
                      len' = len + 1
                  in  acc' `seq` len' `seq` (acc', len')

foldl' f' (0, 0) [1, 2, 3]
 = foldl' f' (1, 1) [2, 3]
 = foldl' f' (3, 2) [3]
 = foldl' f' (6, 3) []
 = (6, 3)                    -- tuple constructor, stop.

Answer 1

簡単に説明してみます。他の人が指摘しているように、頭部正規形は Haskell には適用されないので、ここでは考慮しません。

正規形

通常形式の式は完全に評価され、サブ式はそれ以上評価できません (つまり、評価されていないサンクは含まれません)。

これらの式はすべて正規形です。

42
(2, "hello")
\x -> (x + 1)

これらの式は正規形ではありません:

1 + 2                 -- we could evaluate this to 3
(\x -> x + 1) 2       -- we could apply the function
"he" ++ "llo"         -- we could apply the (++)
(1 + 1, 2 + 2)        -- we could evaluate 1 + 1 and 2 + 2

弱頭部正規形

弱頭部正規形の式は、最も外側のデータコンストラクタまたはラムダ抽象化 (頭部)まで評価されています。部分式は評価されている場合もされていない場合もあります。したがって、すべての正規形式は弱頭部正規形でもありますが、その逆は一般には当てはまりません。

式が弱頭部正規形であるかどうかを判断するには、式の最も外側の部分を見るだけで済みます。データコンストラクターまたはラムダの場合は、弱頭部正規形です。関数適用の場合は、そうではありません。

これらの式は弱頭部正規形です:

(1 + 1, 2 + 2)       -- the outermost part is the data constructor (,)
\x -> 2 + 2          -- the outermost part is a lambda abstraction
'h' : ("e" ++ "llo") -- the outermost part is the data constructor (:)

前述のように、上にリストしたすべての正規形式は、弱ヘッド正規形でもあります。

これらの式は弱頭部正規形ではありません:

1 + 2                -- the outermost part here is an application of (+)
(\x -> x + 1) 2      -- the outermost part is an application of (\x -> x + 1)
"he" ++ "llo"        -- the outermost part is an application of (++)

スタックオーバーフロー

式を弱頭部正規形に評価するには、まず他の式を WHNF に評価する必要がある場合があります。たとえば、1 + (2 + 3)WHNF に評価するには、まずを評価する必要があります2 + 3。単一の式を評価することでこのようなネストされた評価が多すぎると、スタックオーバーフローが発生します。

これは、式の大部分が評価されるまでデータコンストラクターやラムダを生成しない大きな式を構築した場合に発生します。これは、次のようなの使用によって発生することがよくありますfoldl。

foldl (+) 0 [1, 2, 3, 4, 5, 6]
 = foldl (+) (0 + 1) [2, 3, 4, 5, 6]
 = foldl (+) ((0 + 1) + 2) [3, 4, 5, 6]
 = foldl (+) (((0 + 1) + 2) + 3) [4, 5, 6]
 = foldl (+) ((((0 + 1) + 2) + 3) + 4) [5, 6]
 = foldl (+) (((((0 + 1) + 2) + 3) + 4) + 5) [6]
 = foldl (+) ((((((0 + 1) + 2) + 3) + 4) + 5) + 6) []
 = (((((0 + 1) + 2) + 3) + 4) + 5) + 6
 = ((((1 + 2) + 3) + 4) + 5) + 6
 = (((3 + 3) + 4) + 5) + 6
 = ((6 + 4) + 5) + 6
 = (10 + 5) + 6
 = 15 + 6
 = 21

式を弱ヘッド正規形にする前に、かなり深くまで進む必要があることに注意してください。

なぜ Haskell は内部の式を事前に縮約しないのかと疑問に思うかもしれません。これは Haskell の遅延によるものです。一般にすべての部分式が必要になるとは想定できないため、式は外側から内側に評価されます。

(GHC には、部分式が常に必要な状況を検出し、事前に評価できる厳密性アナライザーがあります。ただし、これは最適化に過ぎず、オーバーフローを回避するためにこれに頼るべきではありません)。

一方、次のような表現は完全に安全です。

data List a = Cons a (List a) | Nil
foldr Cons Nil [1, 2, 3, 4, 5, 6]
 = Cons 1 (foldr Cons Nil [2, 3, 4, 5, 6])  -- Cons is a constructor, stop.

すべての部分式を評価する必要があることがわかっている場合に、このような大きな式を構築することを避けるために、内部部分を事前に強制的に評価する必要があります。

`seq`

seqは、式を強制的に評価するために使用される特別な関数です。その意味は、が弱頭部正規形に評価されるたびに、も弱頭部正規形に評価されるseq x yことを意味します。yx

foldl'これは、の厳密な変形であるの定義でも使用されていますfoldl。

foldl' f a []     = a
foldl' f a (x:xs) = let a' = f a x in a' `seq` foldl' f a' xs

の各反復は、foldl'アキュムレータを WHNF に強制します。したがって、大きな式の構築が回避され、スタックのオーバーフローが回避されます。

foldl' (+) 0 [1, 2, 3, 4, 5, 6]
 = foldl' (+) 1 [2, 3, 4, 5, 6]
 = foldl' (+) 3 [3, 4, 5, 6]
 = foldl' (+) 6 [4, 5, 6]
 = foldl' (+) 10 [5, 6]
 = foldl' (+) 15 [6]
 = foldl' (+) 21 []
 = 21                           -- 21 is a data constructor, stop.

しかし、HaskellWiki の例で述べられているように、アキュムレータは WHNF にのみ評価されるため、これはすべてのケースで役立つわけではありません。以下の例では、アキュムレータはタプルであるため、タプルコンストラクターの評価のみが強制され、accorは強制されませんlen。

f (acc, len) x = (acc + x, len + 1)

foldl' f (0, 0) [1, 2, 3]
 = foldl' f (0 + 1, 0 + 1) [2, 3]
 = foldl' f ((0 + 1) + 2, (0 + 1) + 1) [3]
 = foldl' f (((0 + 1) + 2) + 3, ((0 + 1) + 1) + 1) []
 = (((0 + 1) + 2) + 3, ((0 + 1) + 1) + 1)  -- tuple constructor, stop.

accこれを回避するには、タプルコンストラクターを評価すると、との評価が強制されるようにする必要がありますlen。これはを使用することで実現しますseq。

f' (acc, len) x = let acc' = acc + x
                      len' = len + 1
                  in  acc' `seq` len' `seq` (acc', len')

foldl' f' (0, 0) [1, 2, 3]
 = foldl' f' (1, 1) [2, 3]
 = foldl' f' (3, 2) [3]
 = foldl' f' (6, 3) []
 = (6, 3)                    -- tuple constructor, stop.

弱頭部正規形とは何ですか? 質問する

アップデート

ベストアンサー1

正規形

弱頭部正規形

スタックオーバーフロー

`seq`

おすすめ記事