電子書籍とその形式:PDFについて-その歴史、長所と短所

ブログでは、 DjVuFB2、およびFB3標準の詳細について既に説明しました。 今日は、「ペーパーレスオフィス」の夢の具現化となったPDF形式についてお話します。





/ Flickr / Kim Siever / PD



フォーマットの簡単な歴史



PDF(Portable Document Format)の作成者は、Adobeの創設者の1人であるJohn Warnockによって作成されました。JohnWarnockは、コンピューターからテキストと画像を印刷するプロセスを促進したいと考えていました。 1984年に、Warnock PostScriptページ記述言語を 導入しました



ウィキペディアは、いくつかのウィキペディアの単語を円で描くPostScriptコードを例として使用しています。



%!PS-Adobe-1.0 %  ,     1 =1/72 , %    . 72 25.4 div % 1  = 72/25.4  dup %      scale %         100 100 translate %     (100 , 100 ) /Times-Roman findfont %   Times-Roman 10 scalefont %    10 (  - !) setfont %    0 30 330 { %     0  330   30 gsave %     rotate %    (      ) 15 0 moveto %    (15 , 0 ) (Wikipedia) show %     grestore %    } for %   for showpage %  
      
      





当初、PostScriptはプリンターでドキュメントを印刷するためのツールとして開発されましたが、後にWarnockは新しい言語の助けを借りてドキュメントを印刷できるだけでなく、ワークフローシステムを完全に「デジタル化」することもできると判断しました。



このビジョンの一部として、Adobe(Warnockが設立)はIPS形式(Interchange PostScriptの略)を作成しました。 これを使用するために、Adobe Illustratorが作成されました。これは、WindowsおよびMac用のクロスプラットフォームグラフィックエディターです。



IPSは、1991年にサンノゼで開催されたSeybold会議で初めて公開されましたが、この名前で2年続きました。1993年にPDFに名前が変更されました。 その後、Acrobat DistillerとAcrobat Reader(後にAdobe Readerと改名)が登場しました。



最初は、PDFは一般的ではありませんでした。 欠点は、ソフトウェアの高価格でした:個人使用の場合はAcrobat Distillerは700 ドル 、企業使用の場合は2,500ドルです。 Acrobat Readerの場合、彼らはさらに50ドルを要求した。 時間の経過とともに、アドビは価格を引き下げ、PDFの人気が勢いを増し始めました。



ゼロの初めまでに、Acrobat Reader 4.0は1億人によってダウンロードされ 、MicrosoftやAppleなどの大規模IT企業はPDF形式を使用し始めました。



PDFはどのように機能しますか?



グラフィックスとテキストをPDFで表現する基本的なアプローチは PostScriptで使用されるものと非常に似ています。 いわゆるテキスト要素は、ページにテキストを表示する役割を果たします。 文字をどこに描画するかを示します。 ウィキペディアは、Hello Worldを記述するためのコードを提供しています



 /Courier %   20 selectfont %     72 500 moveto %     72, 500 (Hello world!) show %     showpage %    
      
      





PDFでベクターグラフィックスを描画するには、直線または3次ベジェ曲線のパスが使用されます 。 アウトラインを使用して構築された図形は、色で塗りつぶしたり、陰影を付けたりできます。 ラスター画像に関しては、それらは辞書ストリームの形で表示されます 。 辞書はプロパティを記述し、ストリームには画像に関するバイナリ情報が含まれます。



PDFファイルのサイズは、写真の解像度、フォント設定、ハイパーリンクの使用、ビデオなどによって異なります。 2000年代まで、ほとんどのドキュメントはJPEG画像で構成されていたため、PDFファイルのサイズはメガバイト単位で測定されていました。 この問題を解決するために、アドビは圧縮MRC( Mixed Raster Content )の技術を提案しました。



MRC 、スキャンされたファイルをレイヤーに分割します:背景レイヤー、テキストレイヤー、カラーマスク。 各レイヤーで利用可能な情報の圧縮には、独自のコーデックが責任を負います。 たとえば、 JBIG2はテキストに使用できます。テキストは、類似した文字のグループを形成し、それらから辞書を作成します。 したがって、同じ文字が一度エンコードされ、他の場所ではそれらへの参照のみが使用されます。



JPEG、JPEG2000、またはZIPコーデックは、他のコンテンツを圧縮するために使用されます。 それらの助けを借りて、画像の背景、テキストの色の割り当て、写真、写真が保存されます。 このアプローチにより、各ページのサイズは半分以上縮小されます。 PDF圧縮の実例は、AbbyyのHabréのブログで提供されています



PDFの利点



PDFファイルの主な利点の1つは、すべてのページがドキュメントの作成者が意図したとおりに正確に見えるという事実です。 この形式では、デバイスやオペレーティングシステムに関係なく元の背景、フォント、画像が元の形式で保持されます。 同時に、PDFではインタラクティブな要素、つまり脚注をナビゲートするためのハイパーリンクを操作できます。 またメディアファイルドキュメントに追加されます:音楽、GIF、さらにはビデオ。



同時に、PDFファイルを読み取り専用にすることができます。これにより、ドキュメントの内容がコピーおよび変更されないように保護できます。 さらに保護するために、パスワードまたは電子署名を付けることができます


この形式のもう1つの利点は、そのアクセシビリティです。 今日、PDFドキュメントAdobe Acrobat Readerを読むためのプログラムは、ネットワーク上で無料でアクセスできます。 電子書籍でPDFを開くことができます。 それらのほとんどは、デフォルトでこの形式を使用できます。 FBreaderやNEO Readerなど、多くのリーダーアプリケーションでサポートされています。



フォーマットの短所



PDF形式の不変性は、その利点ではありますが、大きな欠点でもあります。 このようなファイル(特に大きな図やチャート、メモ、大きなフォーマットのドキュメント)は、小さな画面のデバイス(スマートフォンやコンパクトな電子リーダー)で読むのが困難です。 ページが単にデバイス画面に収まらないか、テキストが小さすぎて表示されます。



市場には13.3または10.3インチのディスプレイ解像度を備えた電子リーダーがあり、A4シートのPDFで快適に作業できます。 そのようなガジェットの例には、 ONYX BOOX MAX 2ブログで準備たレビュー)、 ONYX BOOX Note、またはONYX BOOX Gulliverレビューありますがあります 。 図面やイラストのすべての詳細を元のサイズで検討する機会を提供し、技術文献を頻繁に読む必要がある人に適しています。 ただし、このようなガジェットのコストは非常に高くなります。



ドキュメントページの表示には別の問題があります。 JBIG2形式に関連付けられています。 コーデックではテキストを数回圧縮できますが、yin問題の影響を受けます(これについてはDjVuに関する資料で書きま​​した)。 テキストを圧縮して辞書をコンパイルすると、一部の文字が類似した文字に置き換えられ(たとえば、「and」が「n」に変わる)、テキストの本質がゆがみます。



また、頻繁に支払われる特別なプログラム( Acrobat DCなど )をインストールする必要があるため、PDFファイルの編集にも問題があります。 PDF2GOなどの無料の編集サービスもウェブ上にありますが、元のファイルの「上」にテキストまたは画像を追加することしかできません。



さらなる開発



PDFはその欠点にもかかわらず、今日でも一般的な形式のままです。 マーケティング会社のHubSpot は、オンラインで読むかPDFでダウンロードするかという、電子書籍を使って何をするかについて、そのサイトを訪れた3000人の訪問者に尋ねました。 回答者の90%がPDFファイルのダウンロードを好むことが判明しました。



開発者は、ポータブルガジェットでの読み取りなど、新しい機能を常に追加しています。 たとえば、2018年の初めに、AdobeチームはAcrobat DCアプリケーションにモバイルデバイス上のファイルの強化された表示および編集機能を提供しました。



さらに、8月には、新しいプロジェクトに関する情報( PDF可聴)がありました 。 PDFの機能と音声アシスタント(Alexa、Google Home、Siri)の機能を組み合わせます。 これまでのところ、準備ができているのはプロトタイプだけですが、開発者は近い将来に作業バージョンをリリースすることを約束しています。



Adobeは新しい指示に従っており、拡張現実機能を追加するなど、形式をよりインタラクティブにする予定です。 どのように見えるかはまだ明確ではありませんが、開発者は今後数年間でPDFエコシステムが新しいレベルのユーザーインタラクションに到達することを約束します。






追加の読書-読者のレビューONYX BOOX:






All Articles