anybody's game

日々感じたこと、艦隊これくしょん、千年戦争アイギス、読書記録

【第五回】スキャン画像の保存形式:imageFOMURA DR-150ならJPG + ZIP一択

 自炊をはじめてしばらくスキャン画像の保存形式に悩みました。とはいえ、スキャンした画像の保存形式にはそれほど多く選択肢があるわけではありません。対応するアプリケーションの豊富さ・扱いやすさ・将来性などを考えた場合、JPEG形式をZIP形式で圧縮した形式PDF形式以外の保存形式はあまり有力な候補とはなりませんでした。たとえば素のZIP圧縮していないJPEG形式などは、コピーに時間がかかる、すこし画像をレタッチした場合あやまって保存してしまうと元画像がなくなってしまうなどの問題があります。有力な候補としてあげた二つの形式に関しては、使いわけたりどちらかを選択するにたるだけのそれぞれお互いにはない利点があります。ぱっと思いつく利点では以下のような点があるでしょう。

JPEG+ZIP形式の利点
  • 専用の編集ソフト、閲覧ソフトがいらない。
  • 編集ソフト、閲覧ソフトがフリーで手に入る。
  • 画質、圧縮率等が細かく(=好みに)指定できる。
PDF形式の利点
  • テキスト埋め込みによる検索が可能
  • 電子書籍リーダーでの閲覧時、ソフト、ハードの選択肢が豊富

 JPEG形式の画像を編集するアプリケーションは種類が豊富で、フリーで手に入るものも多数でています。そのため、画質の調整をしたり余白を切り取りとったり、あるいはフィルターをかけたりなど画像の微調整が容易です。一方、PDF形式のファイルの編集アプリケーションは有料のものが多い上、そもそもドキュメント用の形式ですから、画像の画質の微調整は難しく、大まかな解像度や圧縮度を指定したりがやっとです。

 一方、PDF形式の利点としては、やはり、埋め込みテキストを検索することができる点ですね。なかの記述の重要度に差があり、特定の箇所だけよみたい、参照したいというような書籍を電子化する際には、ぜひ選択したいところです。

JPEG+ZIP形式とPDF形式はお互いコンバート可能

 JPEG+ZIP形式とPDF形式はAcrobat Pro等のアプリケーションを使うことでいつでもコンバート可能ですので、現在の環境で扱いやすい形式を選んだり、試行錯誤の中で自分にあったものを選んだり、書籍のタイプによって使い分けたりしてもよいかと思います。

imageFORMULA DR-150の場合、JPEG+ZIP形式の作業効率が格段に上

しかし、スキャナーにCanon「imageFOMURA DR-150」を選んだ場合は、JPG + ZIP形式をメインの形式として選択するのがよいかもしれません。

 「imageFOMURA DR-150」でスキャンした画像を付属のソフトでPDF形式にして保存する場合、表紙を含めたすべての画像を連続で取り込まなくてはいけません。また、「imageFOMURA」には、連続して取り込んだ画像のリストからいらないものを除去したり、画像の順序を変えたりする機能がありません。さらに、超音波方式の重送センサーがついておらず、重送がそれなりに発生します。重送が発生してスキャンが途切れると、順序正しいPDFを作成するには、1からの取り込みを行う必要があり、これは、非常に効率が悪い作業となります。

 一方で、JPEG画像として出力してからZIP形式でまとめた形式を選択する場合です。この場合、1つのディレクトリに画像をまとめて保存し、あとからそのディレクトリごとZip圧縮することになります。1つのディレクトリにまとまっていさえいればよいわけですから、重送が発生した時点で保存し、ファイラーで並び順を変更したり重送が発生した部分などを削除しても問題ありません。

 ちなみに、重送が発生した場合のオペレーションとしてお勧めなのは、重送発生ページ以降をすべて削除し、再度スキャンする方法です。たとえば、1〜50ページセットしてスキャンしました。しかし48ページしかありません。という場合、1箇所で重送が発生していることがわかります。こういった場合、とりあえずそこまでを保存し、ページ数などをたよりに重送箇所を特定します。35ページの次が38ページになっています。こういった場合、まず最初に思いつくのは、36ページと37ページをスキャンして並び替える方法ではないでしょうか。36ページと37ページは裏表ではありませんので、2枚をスキャンし、必要ない35ページと38ページを消して、スキャナーがつけた連番のファイル名に割り込ませて・・・とかなり、手作業で調整しなければいけません。そして、この手作業はスキャンし忘れのミスを誘発しがちです。

 なので、1〜50ページをスキャンして35ページ〜38ページのところで重送が発生した場合、今回の35ページ以降はすっぱりあきらめて、再度、35ページから50ページをスキャンしなおすのがオススメです。このときセットできるからといって35〜80ページとかをスキャンしがちですが、DR-150の場合、スキャン枚数が重送が発生していないことを確認する重要な情報となりますので、50ページなどキリがいいところがよいでしょう。

 なので、重送センサーがついていない機種では、基本「JPEG+ZIP形式」、検索したい書籍に限り「PDF形式」という選択が無難です。紙質の影響で重送が頻発するがこの書籍はPDFにしたい、そういった場合は、1枚づつセットしてスキャンする、JPEG形式にしてからAcrobat ProなどのアプリケーションでPDF化する、などの方法をとるとよいでしょう。僕も、技術書などテキスト検索が有用だと感じた書籍についてはPDFにし、それ以外はすべてJPEG形式の画像をZIP形式でまとめた形式を選択しました。

まとめ

  1. 自炊時の保存形式の有力な選択肢は2つ「JPEG+ZIP形式」「PDF形式」
  2. JPEG+ZIP形式」は、あつかいが容易
  3. 「PDF形式」は、テキスト検索が魅力
  4. imageFORMULA DR-150に関しては、「JPEG+ZIP形式」がメインで、書籍の用途によって「PDF」をサブがオススメ。

連載 書籍の電子化

aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp aods1004.hatenablog.jp