スクリプトでバイリンガルテキストを編集するには？

2024-06-18 • tag-icon

shell-script scripting

次のように、中国語の単語に英語の単語が付いている単語列があります。

軽蔑感********

嫌いな**********

（星は漢字を表します。）

英語の単語を分離して別のファイルに入れるスクリプトを作成したいと思います。スクリプトでこのようなことを達成できますか？

どんな提案でも歓迎します。

もちろん、英語の単語はラテン文字を使用し、中国語の単語はそうではないので、最初のビラテン語の記号で始まる行の終わりを削除するだけです。

sed 's/[^a-zA-Z ].*//' < source-file >  result-file

おすすめ記事