| ■お買い物するならアマゾンへGo! |
|||
| ここではPDFの基本とその関連ソフトをご紹介したいと思います。 | |||
| PDF | |||
| ■PDFとは PDFとはPotableDocumentFormatの略で一言で言えば「電子の紙文書」ということになります。勿論、電子ならではの特徴である付帯情報や各種の内容が入れられるようになっています。 したがってPDFはDOC(MS−Wordの出力フォーマット)などとは違って再利用するのはかなり難しいことになります。「紙」に出されているわけですから当然と言えば当然です。 その代わりどんな場合でも出力された状態をそのまま見ることが可能です。ですからPCによって行がずれたりすることはありません。また出力の大きさも用紙で決められていますからプリンタに出せばそのままを再現できます。 ■PDFを読むには Adobe社がArobatReaderを無料配布していることもあり、最近はマニュアルをPDFにして配布しているのを見かけます。これであれば誰でもどこでもAcrobatReaderさえあれば、アプリケーションを持っていなくてもデータが見えることになります。 つまりPDFでさえ出力できれば、誰でも読める環境になっています。Webでも多くのものがPDFで配布されています。AcrobatReaderは以下より入手できます。(実際のところReaderと言えども大変な技術から成り立っています。ビュアーを作るのは至難です。) PDFは最近はISO化の動きもあるオープンなフォーマットです。 ■なぜPDFか? 「紙」のよさは誰でもどこでもなんらソフトなく見られることがあげられます。つまりソフトに依存しません。電子データでもテキストは比較的透過性が高いものですが、そこでもコード問題があります。例えば、S−JIS、JIS、EUCなどと言ったもので文字化けが発生します。特に日本語は注意が必要です。しかしPDFであれば問題ありません。内部的には主にユニコードで処理されています。このようにPDFはコードもそうですが、異なるプラットホーム間で互換を保ちながらみることができます。HTMLも似ていますが、これは「見るための互換」でありPDFは「紙として印刷するための互換」と言えます。 |
|||
| ■PDF生成は難しいか? それはPDFを生成するのは難しいのでしょうか? 真っ先に考え付くのがAcrobatのStandardです。これは編集機能もある優れたソフトです。 しかし、これでなければならいということはありません。PDFライターと呼ばれるソフトがあれば、何か印刷できるアプリケーションであれば(メモ帳やWordPadでもいいのですが)作成することができます。これには仮想プリンタを作ってそこに印刷することでPDFに変換します。 ■PDFをどう使う? いろいろ考えられますが、PCの文書を統一するならPDFは最適と言えます。多くの人がバラバラのアプリケーションを使えば見る側でもそれに対応するソフトが必要です。それらはコストを圧迫します。また社内だけでなく、外部とのやりとりでも同じことが発生します。 例えばPDFを使えばFAXなどの代わりに利用できます。メールにPDFを添付して送ればいいのです。1対1通信という意味で安全ですし、必要であれば暗号でロックさせることもできます。 |
|||
| ■PDFとスキャナ 「PDFは電子の紙」というお話は書きましたが、実際の紙を電子化する装置がスキャナです。最近は価格低下も一段落しています。 従来スキャナの出力フォーマットと言えばTiffが使われていました。Tiffは様々な拡張が行われており、Tiffの中にJpegがあったりする場合もあります。またG3・G4と言ったFAXのフォーマットをサポートしていることでも知られます。Tiffは画像フォーマットの中では珍しく「マルチページ」をサポートしています。そのため例えば10枚の画像を1ファイルに落とすということができます。しかし、最近ではめったに見かけることがなくなりました。その理由は2つだと思います。 ・規格拡張が同じ拡張子であるため一見非互換に見える Tiffには多くの規格があり、それらを全部サポートしたソフトは滅多にお目にかかれません。そのため同じ拡張子(*.tifまたは*.tiff)でも開けない場合が多く発生します。 ・WindowsからImagingが消えた Win95ではKodak(旧Wang)社のImagingが入っていました。これはTiffファイルを生成できました。しかしカラーは非圧縮だけでしたのでカラーTiffは大きなサイズでした。またその後これは「画像とFAXビュアー」になりましたが、これはビュアーであり生成機能は消え去りました。 その後デジカメの台頭やカラーの普及もあってスキャナもJpegを出力するようになったのですが、これだとファイルがバラバラになるため、やはりマルチページがほしいところです。そこでPDFを出力するようになって行きます。 ■文書とスキャナ スキャナでコンシューマ向けのものは一時は台湾のOEMなどが乱立しましたが、現在は一段落しています。その後コンシューマ向けは用途としては写真からフィルムへ走っていったように感じます。しかし、ここにスキャナの原点である「紙を読む」にこだわったスキャナが登場します。それがPFU(富士通)のScanSnapでした。思えば最初にスキャナのフォーマットとしてPDFを普及させたのもScanSnapのように思います。ScanSnapのお話は別に譲るとして、ここではPDFのお話を進めたいと思います。 ■ImagePDF PDFというのは製版ソフトですので「文字」でも「画像」でも何でもありのフォーマットになっています。そこで全面を画像にしてしまえば、それでもPDFになります。例えばこのサイトにもJpg2PDFExというソフトがありますが、これはJpegをつないでPDFにするものです。それらの「画像だけから構成されるPDF」をImagePDFと呼ぶことがあります。 ここで注意してほしいのですが、最近は1枚のページ=1画像というわけではないことがあります。Jpegは非常に優れた圧縮方法ですが、それもA4で1枚は500K程度になることがあります。それらをさらに圧縮する手法としてセグメンテーションが使われる場合があります。これは1枚の画像を分解して、それぞれに最適な圧縮をかけるものです。例えばスキャンスナップでは「高圧縮」というのがそれにあたります。しかしこの手法は解像度によって効果が異なったり劣化の原因にもなりますので注意が必要です。 ともあれ、1枚のPDF=1枚の画像であれば、PDF→Jpegやその逆は比較的容易です。(それでも十分複雑ですが)それらを利用することでPDFのフォーマット変換が可能になります。 一般的なPDFを作ろうとするとそう簡単ではありません。テキストぐらいならそうでもないのでTxt2PDFというのは作ってみました。これでも役立つことがあると思います。また生成速度の速さは捨てがたいものです。 |
|||
| ■ImagePDFを検索する ImagePDFというのは単なる画像ですからそのままでは探すことができません。しかしOCRを使ってそれらを認識してPDFに透明テキスト(HiddenTextとも呼ばれます)を使って埋め込むことで検索対象とすることが可能です。勿論OCRですから100%というわけには行きませんが、それでも検索に使う分には十分といえます。OCRにはWordに戻すなどの「再利用」を目的とするものと、このような検索目的のものがあります。前者は修正画面などが豊富なものが使いやすいといえますが、後者はUIなどがなく勝手にやってくれるものの方が有難いです。 ですから、検索するにはOCRソフトが必要になります。ただしこれはスキャナについていたりさまざまです。 ■PDFを扱うには 「電子の紙」という意味でPDFは重要なのですが、どういうソフトがあればいいのでしょうか?またそれらは高いものなのでしょうか? 単純に思いつくのはAbode社のAcrobatStandardです。これは機能的には申し分ありませんが、¥36,540と安いものではありません。しかし、個人使用に限るなら他の手法もあります。別のページではそのあたりをご紹介します。 |
|||