単語リストを見つけて単語に置き換える

単語リストを見つけて単語に置き換える

.epub小さな子供たちが読めるように編集したい本のファイルがいくつかあります。私はsedこれが仕事に適したツールであることを読みましたが(他の解決策も開いています)、これに初めて触れました。

原文の例

ant bat cat
dog eagle fish

修正されたテキスト(sed以降)

ant XXX cat
XXX eagle XXX

私はMacを使用しており、次のように動作しました。

LC_ALL=C sed -E 's/bat|dog|fish/XXX/ig' temp1.txt > temp2.txt

ant XXX cat
XXX eagle XXX

しかし、.epubファイル形式では機能しません。
LC_ALL=C sed -E 's/bat|dog|fish/XXX/ig' file1.epub > file2.epub

これは協会サンプル.epubファイルに。

ベストアンサー1

そう: (あなたは必要ですインストール予定):

pandoc -f epub -t plain -o test1.txt test1.epub
sed -i'' -E 's/bat|dog|fish/XXX/ig' test1.txt
pandoc -f plain -t epub -o test1.epub test1.txt

別の不完全なアプローチ:

unzip test1.epub
cd OPS
lynx -dump ./html/chapter*.html  | less
xmlstarlet edit # on the proper HTML files
cd -
zip -r test1.epub OPS

おすすめ記事