貪欲で怠惰な正規表現（理解力の質問）

Question

最も短いゲームではなく、単に短いゲームです。貪欲モードは可能な最後の一致を見つけようとし、怠惰なモードは最初の可能な一致を見つけようとします。しかし、可能な最初の一致は必ずしも最短ではありません。

入力文字列foobarbazと正規表現o.*a（欲求）またはo.*?a（怠惰）を取得します。

この入力文字列の可能な最短一致はですoba。

しかし、正規表現は左から右に一致する項目を探すので、o最初の項目を探します。残りのパターンが一致する場合、そのパターンはそのまま残ります。ofoobarbaz

最初のo（.*greedy）はobarbaz（文字列全体）を食べてから、残りのパターン（a）と一致するように逆追跡します。だから最後のaを探してbaz最終的に一致しますoobarba。

最初の項目の後、o文字.*?列全体を（ゆっくりと）食べるのではなく、残りのパターンが最初に表示される項目を探します。したがって、最初にo一致しない2番目のものを見てから、一致しないものを見てから、一致するものを見て怠惰なので、停止aします。（と判明したがそうではない）baaaoobaoba

だから、最も短いバージョンではありませんが、貪欲なバージョンよりも短いです。

Answer 1

最も短いゲームではなく、単に短いゲームです。貪欲モードは可能な最後の一致を見つけようとし、怠惰なモードは最初の可能な一致を見つけようとします。しかし、可能な最初の一致は必ずしも最短ではありません。