正規表現を使用して XML と HTML を解析するのが難しい理由の例をいくつか挙げてもらえますか? [closed] 質問する

Question

ここに、楽しい有効な XML をいくつか示します。

<!DOCTYPE x [ <!ENTITY y "a]>b"> ]>
<x>
    <a b="&y;>" />
    <![CDATA[[a>b <a>b <a]]>
    <?x <a> <!-- <b> ?> c --> d
</x>

そして、この小さな喜びの束は有効な HTML です。

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" [
    <!ENTITY % e "href='hello'">
    <!ENTITY e "<a %e;>">
]>
    <title>x</TITLE>
</head>
    <p id  =  a:b center>
    <span / hello </span>
    &amp<br left>
    <!---- >t<!---> < -->
    &e link </a>
</body>

無効な構造に対するブラウザ固有の解析は言うまでもありません。

正規表現を使って挑戦してみてください!

編集 (Jörg W Mittag): ここに、整形式で有効な HTML 4.01 の別の優れた例を示します。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
  "http://www.w3.org/TR/html4/strict.dtd"> 
<HTML/
  <HEAD/
    <TITLE/>/
    <P/>

Answer 1

ここに、楽しい有効な XML をいくつか示します。

<!DOCTYPE x [ <!ENTITY y "a]>b"> ]>
<x>
    <a b="&y;>" />
    <![CDATA[[a>b <a>b <a]]>
    <?x <a> <!-- <b> ?> c --> d
</x>

そして、この小さな喜びの束は有効な HTML です。

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" [
    <!ENTITY % e "href='hello'">
    <!ENTITY e "<a %e;>">
]>
    <title>x</TITLE>
</head>
    <p id  =  a:b center>
    <span / hello </span>
    &amp<br left>
    <!---- >t<!---> < -->
    &e link </a>
</body>

無効な構造に対するブラウザ固有の解析は言うまでもありません。

正規表現を使って挑戦してみてください!

編集 (Jörg W Mittag): ここに、整形式で有効な HTML 4.01 の別の優れた例を示します。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
  "http://www.w3.org/TR/html4/strict.dtd"> 
<HTML/
  <HEAD/
    <TITLE/>/
    <P/>

正規表現を使用して XML と HTML を解析するのが難しい理由の例をいくつか挙げてもらえますか? [closed] 質問する

ベストアンサー1

おすすめ記事