字幕の:コードはどういう意味ですか?

字幕の:<i>コードはどういう意味ですか?

サブシーンから字幕をダウンロードしました。http://subscene.com/subtitles/the-5th-wave/english/1298314これには、私のプレーヤーmpvでデコードされていない:&lt;i&gt;などのいくつかのエンコーディングが含まれています。&lt;/i&gt;ご覧のとおり、字幕は.srt(Subrip Text)形式です。

https://matroska.org/technical/specs/subtitles/srt.html

以下は、理解できるように完全な会話です。

28
00:03:37,080 --> 00:03:39,280
CASSIE:&lt;i&gt; I miss the Cassie I was.&lt;/i&gt;

ゲームプレイ中にコードが見えないように修正したいのですが、どのように修正するのかわかりません。誰でも助けることができますか? Debian でテストしており、mpv を使用しています。

[$] mpv --version                                                                                                               
(null) requires an argument
mpv 0.14.0 (C) 2000-2015 mpv/MPlayer/mplayer2 projects
 built on UNKNOWN
ffmpeg library versions:
   libavutil       54.31.100
   libavcodec      56.60.100
   libavformat     56.40.101
   libswscale      3.1.101
   libavfilter     5.40.101
   libswresample   1.2.101
ffmpeg version: 2.8.6-1+b2

この問題が解決されることを期待しています。このコードは.srtファイル全体に広がっているので、せいぜい少し混乱しています。

ベストアンサー1

誰かが字幕にHTMLタグを使用してフォントを作成しようとしていたようです。イタリック体。 HTMLに関する私の限られた知識で&lt;表現記号は、less thanすなわち表現です。だから<&gt;>

CASSIE:&lt;i&gt; I miss the Cassie I was.&lt;/i&gt;

次のように可視化できます。

CASSIE:<i> I miss the Cassie I was.</i>

イタリック体のコードであることが簡単にわかります。ビデオプレーヤーはhtmlタグを認識しません。私はそれらが選択されたsed / awkの組み合わせで削除できると確信しています。

sed 's/\&lt\;i\&gt\;//; s+\&lt\;/i\&gt\;++' somefile.srt >somefile-nohtml.srt

おすすめ記事