ランダムソースのPDFが与えられたら、Linuxで次のことをどのように実行しますか?
- あることを確認してくださいPDF/Aすでにフォーマットされていますか?
- PDF/A形式ではない場合、忠実度の損失を最小限に抑えながらPDF/Aに変換されますか?
変換によってドキュメントの外部要素が失われる可能性があることを理解していますが、比較的遠い将来にドキュメントを開く機能がこのクールな機能よりも重要であると仮定します(この場合は利用可能/読めない可能性があります)。それでも)。元のファイルを開くことができないリスクを取るのではなく、文書を並べて見ることができるときに変換の正確性を視覚的に確認する方がよいでしょう。
ベストアンサー1
識別する
PDF / Aファイルを識別するために使用できるように見えるこのツールを見つけました。知られているDROID(デジタル録音とオブジェクト識別)。 Javaに基づいており、GUIまたはコマンドラインから実行できます。
抜粋
DROIDは、ファイル形式の自動バッチ識別のために国立文書アーカイブによって開発されたソフトウェアツールです。広範なデジタル保存活動の一環として、デジタル保存部門によって開発されたDROIDは、すべてのデジタルストレージの基本要件を満たし、保存されているすべてのデジタルオブジェクトの正確な形式を識別し、そのIDを中央レジストリにリンクできるように設計されています。形式とその依存関係に関する技術情報。
National Archivesのスポンサーを受けることを考えると、PDF / A形式の意図された目的を考慮するときにこれを行うのに適したツールだと思います。このプロジェクトはオープンソースでもあります。コードはGithubにありますバイナリ形式でパッケージ化されています。国立文書保管所のウェブサイト。
検証と変換
検証と変換を実行するツールを探している場合PDFボックスこれは可能です。 PDFBoxは、WebサイトのホームページにPDF / A検証を一覧表示します。これは別のJavaアプリケーションです。 8-)。
ホームページから抜粋
PDF/A
検証 PDF/A ISO 標準に従って PDF を検証します。
下にコマンドラインツールセクションホームページの左側には、ツールの次の目的が表示されます。
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
ベラPDFPDF / Aを検証するためのもう1つのツールは、Open Conservation Foundationのリファレンスツールセットの一部です。また、Javaアプリケーションでもあります。
切り替える
変換するには、次のタイトルのブログ投稿でこの方法を見つけました。既存のPDFをPDF / Aに無料で変換する方法、次のツールを使用します。
- Ghostscript 8.64 専用です。
- PDFボックス0.7.3
- pdfmarks(追加のメタデータを提供するファイル)
- PDFA_def.ps
- USWebCoatedSWOP.icc
上記の作業が完了したら、次のコマンドを使用できます。
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
欠陥がないわけではありません。この資料ではそのうちの1つについて説明します。ハイパーリンクの印刷フラグを変更することもその1つです。この資料では、これらの問題を解決するために使用できるJavaアプリケーションについて説明します。
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
きれいではありませんが、うまくいくようです。より記事詳細については。
カップを通してPDF/Aとして保存
cupsでは「pdfファイルとして印刷」が可能です。使用されるコマンドはにあります。ここでは、pdfファイルを生成するためにバイナリを呼び出すためのパラメータを含む/etc/cups/cups.conf
変数を見つけることができます。パラメータの前に追加すると、Linux上のすべてのアプリケーションにあるすべての「PDFで印刷」ファイルが魔法のようにPDF / Aに変換されます。GSCall
gs
-dPDFA
-dNOPAUSE