文字列の生文字を使用したJSON変換

Question

Perlを使用して、すべてのC0コントロールを16進エスケープに置き換えることができます。

perl -pe 's/([\x01-\x1f])/sprintf("\\u%04x", ord($1))/eg' < test.json

これ

プログラムをループとして実行し、最後に結果をsedスタイルで印刷します（perl -pe）。
01-1fの範囲内のすべてのバイトと一致（s/([\x01-\x1f])/... g）
バイトの序数値の計算( ord($1))
sprintf("\\u%04x", ord($1))/e一致するバイトを（）の結果に置き換えます

これにより、一致するバイト位置に\u0001、、\u0002...が挿入されます。\u001f

それ〜するすべての改行は同じ方法でエスケープされているため、ファイルに引用されていない改行があると中断されます（テキストファイルには少なくとも1つの終了改行がありますが、これは機械的に前後に削除できます）。この場合は[\x01-\x09\x0b-\x1f]スキップしても失敗します。はい引用符の中に実際の改行文字があります。

ファイルに引用符付き改行文字と引用符付き改行文字の両方が含まれている場合、これらの文脈のない置換は機能しません。ファイルをそのまま受け入れる無料のJSONパーサーが必要なので、エスケープする必要があるファイルとそうでないファイルがわかります。そのうちの1つについてはよくわかりません。

Answer 1

Perlを使用して、すべてのC0コントロールを16進エスケープに置き換えることができます。

perl -pe 's/([\x01-\x1f])/sprintf("\\u%04x", ord($1))/eg' < test.json

これ

プログラムをループとして実行し、最後に結果をsedスタイルで印刷します（perl -pe）。
01-1fの範囲内のすべてのバイトと一致（s/([\x01-\x1f])/... g）
バイトの序数値の計算( ord($1))
sprintf("\\u%04x", ord($1))/e一致するバイトを（）の結果に置き換えます

これにより、一致するバイト位置に\u0001、、\u0002...が挿入されます。\u001f

それ〜するすべての改行は同じ方法でエスケープされているため、ファイルに引用されていない改行があると中断されます（テキストファイルには少なくとも1つの終了改行がありますが、これは機械的に前後に削除できます）。この場合は[\x01-\x09\x0b-\x1f]スキップしても失敗します。はい引用符の中に実際の改行文字があります。

ファイルに引用符付き改行文字と引用符付き改行文字の両方が含まれている場合、これらの文脈のない置換は機能しません。ファイルをそのまま受け入れる無料のJSONパーサーが必要なので、エスケープする必要があるファイルとそうでないファイルがわかります。そのうちの1つについてはよくわかりません。

文字列の生文字を使用したJSON変換

ベストアンサー1

おすすめ記事