文書をUTF-8でエンコードされたテキストに変換

文書をUTF-8でエンコードされたテキストに変換

ウノフLibreOfficeを使用すると、LibreOfficeが変換できるすべてのファイルを変換できます。

これでテキストとしてエクスポートする必要があります。UTF-8文字エンコーディング。

次のコマンドを使用します。

unoconv -f txt -e FilterOptions=76 Foo.docx

Foo.txtファイルが生成されますが、エンコードは次のようになります。アメリカ式アスキーそして、文字が正しく表示されません。

私の言葉が正しい場合は、エクスポート-eフィルタリングオプションを次のように設定するオプションがあります。マニュアルページに記載されています。。私の選択に問題があるのでしょうか?

入出力ファイルの例:

ベストアンサー1

努力する:

unoconv -f txt -e FilterOptions=UTF8,LF Foo.docx

これはバグのように見え、報告されました。ここ

それでも機能しない場合は、LibreOfficeがdocxそのファイルをサポートしていない可能性があります。詳細を見るここ

おすすめ記事