スクリプトでバイリンガルテキストを編集するには?

スクリプトでバイリンガルテキストを編集するには?

次のように、中国語の単語に英語の単語が付いている単語列があります。

軽蔑感********

嫌いな**********

(星は漢字を表します。)

英語の単語を分離して別のファイルに入れるスクリプトを作成したいと思います。スクリプトでこのようなことを達成できますか?

どんな提案でも歓迎します。

ベストアンサー1

もちろん、英語の単語はラテン文字を使用し、中国語の単語はそうではないので、最初のビラテン語の記号で始まる行の終わりを削除するだけです。

sed 's/[^a-zA-Z ].*//' < source-file >  result-file

おすすめ記事