私が作業しているテキスト唐市300編、残念ながら中国語と英語を含む単一のファイルです。私は英語を「抽出」することに興味があるので、ラテン文字を含むすべての行を使用するか、sed, grep,
単に返したいと思います。tr
たとえば、次のテキストは次のようになります。
051
七言古詩
李頎
聽安萬善吹觱篥歌
南山截竹為觱篥, 此樂本自龜茲出。
流傳漢地曲轉奇, 涼州胡人為我吹;
傍鄰聞者多歎息, 遠客思鄉皆淚垂。
世人解聽不解賞, 長飆風中自來往。
枯桑老柏寒颼飀, 九雛鳴鳳亂啾啾。
龍吟虎嘯一時發, 萬籟百泉相與秋。
忽然更作漁陽摻, 黃雲蕭條白日暗。
變調如聞楊柳春, 上林繁花照眼新。
歲夜高堂列明燭, 美酒一杯聲一曲。
Seven-character-ancient-verse
Li Qi
ON HEARING AN WANSHAN PLAY THE REED-PIPE
Bamboo from the southern hills was used to make this pipe.
And its music, that was introduced from Persia first of all,
Has taken on new magic through later use in China.
And now the Tartar from Liangzhou, blowing it for me,
Drawing a sigh from whosoever hears it,
Is bringing to a wanderer's eyes homesick tears....
Many like to listen; but few understand.
To and fro at will there's a long wind flying,
Dry mulberry-trees, old cypresses, trembling in its chill.
There are nine baby phoenixes, outcrying one another;
A dragon and a tiger spring up at the same moment;
Then in a hundred waterfalls ten thousand songs of autumn
Are suddenly changing to The Yuyang Lament;
And when yellow clouds grow thin and the white sun darkens,
They are changing still again to Spring in the Willow Trees.
Like Imperial Garden flowers, brightening the eye with beauty,
Are the high-hall candles we have lighted this cold night,
And with every cup of wine goes another round of music.
私は中国語をスキップして051行だけを返し、「7文字の古代時」行とそれ以降のすべての項目を返すコマンドが欲しいです。
ベストアンサー1
次のPerlコマンドは、中国語文字を含まない行を印刷します(Hanスクリプト)。-CIO
Perlに入力と出力の両方をUTF-8でエンコードするように指示します。
perl -CIO -lne '/\p{Han}/ or print'