Webページのこのコードを例にしてみましょう。
<html><body>
<script language="javascript">
document.write("The cat");
document.write(" sat on the mat");
</script>
</body></html>
CURLまたはWGETを介してこのページを検索すると、Javascriptがまだ処理されていないため、そのテキストを取得します。
しかし、このページを検索したいので、Javascriptで出力された結果を得ます。それから私はただ受け取ります...
The cat sat on the mat
このテキストをhtmlで処理できるLinux Javascriptサンドボックス/エミュレータ/プリプロセッサ、またはこれに似たものはありますか?私はJavascriptが複雑で100%の変換を期待していないことを知っています。しかし、いくつかの基本的な遷移を得ることさえ役に立つかもしれません。
私はこれが可能であることを知っています。これは、GoogleがWebページをインデックス化するときにインデックスを作成するWebページの最良の結果を得るためにこれを行うと確信しているからです。
ベストアンサー1
「Javascript-HTMLコンバータ」のようなものはありません。 JavaScriptはマークアップ言語ではなくプログラミング言語です。ブラウザは、JavascriptをHTMLに変換するのではなく、HTMLを変更するJavascriptコードを実行します。あなたが必要とするのは、HTML文書を処理できるJavaScriptインタプリタです。
これを達成する1つの方法は、後でブラウザエンジンを使用することです。セレンそしてバティエ(2つのWebアプリケーションテストエンジン)は、Webブラウザを呼び出してスクリプトで駆動するために広く使用されている選択です。SeleniumRCに加えて、JavaScriptを描いた後にコンテンツを含むWebページを取得するための良いツールはありますか?。
最近、さまざまなプログラミング言語のためのJavascriptおよびDOMインタフェースもあります。Jswebkit存在するPython(はい)。
もう一つの可能性は実行することですnode.js、これはスタンドアロンのJavaScriptインタプリタです(はい)。