大容量ファイルからXMLタグを削除する

Question

私はあなたがそれを試すことをお勧めしますxml_grep、速度は遅いですが、メモリ効率が非常に高いです。perl-XML-Twig（またはxml-twig-tools） - ツリーモードで大容量のXml文書を処理するためのPerlモジュールの一部です。名前で除外ノードを使用できます-v。を参照して、man xml_grep小さな入力でコマンドをテストします。

例:

xml_grep --nowrap -v 'text' input.xml > output.xml

または時間がかかりますので、進行状況バーを使って視聴してください。

pv input.xml | xml_grep --nowrap -v 'text' > output.xml

一般的なケースでは、いくつかのsax / streamモジュールと一緒にPython、Perl、Java、Ruby（nokogiri）などの言語を使用できます。

Answer 1

私はあなたがそれを試すことをお勧めしますxml_grep、速度は遅いですが、メモリ効率が非常に高いです。perl-XML-Twig（またはxml-twig-tools） - ツリーモードで大容量のXml文書を処理するためのPerlモジュールの一部です。名前で除外ノードを使用できます-v。を参照して、man xml_grep小さな入力でコマンドをテストします。

例:

xml_grep --nowrap -v 'text' input.xml > output.xml

または時間がかかりますので、進行状況バーを使って視聴してください。

pv input.xml | xml_grep --nowrap -v 'text' > output.xml

一般的なケースでは、いくつかのsax / streamモジュールと一緒にPython、Perl、Java、Ruby（nokogiri）などの言語を使用できます。

大容量ファイルからXMLタグを削除する

ベストアンサー1

おすすめ記事