ScanSnapの使い方:本をスキャンする方法

書籍を解体/スキャンして電子書籍に変換する事を、俗称で「自炊」と呼びます。 ここでは、ディスクカッターとドキュメントスキャナ:ScanSnapを使った、自宅で手軽にできる電子書籍の作り方を解説します。 なお、「自炊」の方法全般については、自炊のしかた:電子書籍の作り方で紹介しています。 併せてご参照ください。

ディスクカッターで本を解体

ディスクカッターで本を解体してみましょう。 使用したモデルは定番のカール事務器 DC-F5100 です。 慣れてしまえば解体にかかる時間は3分、ディスクカッターでのカットに2分半、合計6分弱で終わる作業です。 カール事務器からは、ほかにもよりコンパクトな DC-210N なども発売されています。
iPhone まず表紙と中表紙を外します。これらは別途「カラー」モードでスキャンします。 表紙はできるだけ平らになるよう、折り目は逆方向にまげて、折り癖を消しておきます。 本体から中表紙を破かないように外すのが、解体工程で一番難しく、力がいるところです。
iPhone 本体を、30~40枚(60~80ページ)ごとの束に分解していきます。 コミックスなら3~4分割します。 カッティングマットの上で、本体を大きく開いて、カッターで丁寧に切り離します。 やや大きめの、グリップのしっかりしたカッターを使うのがコツです。 ここで使用したカッターは オルファ リミテッド NL LTD-07 です。 以上で解体完了です。
iPhone ディスクカッターで本体の束を順にカットしていきます。 ケチらず大胆に、糊の部分が残らないよう、6~7mmくらいの幅でカットします。 本体を適切な枚数で分割していれば、ディスクカッターは一束5~6往復させればカットできます。 束ごとにカットしたらすぐスキャンしていくと、効率が良いかも。
ここでもカラーページとモノクロページは分けて、スキャナのモードを切り替えてスキャンします。

ScanSnapの設定:共通設定

それではScanSnapを使って解体した書籍をスキャンしてみましょう。 使用したモデルは ScanSnap iX500 です。 慣れてしまえばコミック1冊のスキャンにかかる時間は8分程度です。
iPhone Windows 10では、ScanSnapの設定画面は[スタート]-[すべてのアプリ]-[ScanSnap Managerの設定]から起動します。
iPhone より詳細な設定を可能にするため、「クイックメニューを使用する」のチェックは外します。
iPhone 「アプリ選択」のタブでは、スキャン後の動作を指定します。好みで指定して下さい。 特に理由がない限り「起動しません(ファイル保存のみ)」で良いと思います。
なお、各ページで設定変更した後は、画面右下の「適用」をクリックします。
iPhone 「読み取りモード」のタブでは、画質などを設定していきます。
画質の選択」は「スーパーファイン」がおすすめです。
カラーモード」の指定は原稿に合せます。 文庫本などのモノクロ原稿の場合は「グレー」がおすすめです。 カラーページがある場合は「カラー」がおすすめです。 モノクロページとカラーページについては、それぞれ設定を切り替えて、個別にスキャンするときれいに仕上がります。 なお、「カラー自動判別」を指定すると、モノクロページは「グレー」ではなく「白黒」で読み込まれるため、文字がとても読みにくくなります。 またモノクロページに「カラー」を指定すると、文字は読みやすくなりますが、ファイルサイズが不必要に大きくなってしまいます。
原稿が両面印刷の場合は「読み取り面の選択」は「両面読み取り」を指定します。
ほかは好みで設定して下さい。「オプション」ボタンをクリックすると、さらに詳しいオプションが指定できますが、いずれも変更は不要でしょう。
画質の選択 スーパーファイン
カラーモード グレー 文庫本の本文など、モノクロ原稿の読み込み時
カラー 表紙、カラーページの読み込み時
カラー自動判別 使用しない
iPhone 「原稿」タブでは、読み込む原稿のサイズなどを指定できます。 「サイズ自動検出」になっていればOK。特に変更の必要はありません。
iPhone 「ファイルサイズ」タブでは、読み込み時の圧縮率を指定できます。 圧縮率を強くするとファイルサイズは小さくなりますが、文字や図が読みにくくなります。 初期値の「3」のままでOK。特に変更の必要はありません。

ScanSnapの設定:JPEG画像形式でスキャンする場合

ページ1枚1枚を、個別のJPEG画像ファイルとして読み込むことができます。 「保存先」と「ファイル形式」タブの設定を行います。
iPhone 「保存先」のタブでは、生成されるJPEGファイルの保存先を指定します。 事前に書籍の名前の空きフォルダを作っておき、そこを指定するのがよいでしょう。 指定したフォルダに、読み込んだ全ページのJPEGファイルが出力されます。
iPhone 「ファイル形式」のタブで「JPEG(*.jpg)」を選び、画面右下の「適用」をクリックします。
以上で設定は終了です。 画面右下の「OK」をクリックして設定画面を閉じます。
なお、JPEG画像をPDFに変換することも可能です。

ScanSnapの設定:PDF形式でスキャンする場合

すべてのページをスキャンし、1つのPDFファイルにすることができます。 「保存先」と「ファイル形式」タブの設定を行います。
iPhone 「保存先」のタブでは、生成されるPDFの保存先とファイル名を指定します。好みで指定して下さい。
iPhone 「ファイル形式」のタブで「PDF(*.pdf)」を選びます。
なお、「テキスト認識の選択」欄で文字のテキスト化(OCR機能)の指定ができます。好みで設定してください。
検索可能なPDFにします」にチェックを入れると、 原稿をテキスト化してPDFファイルの中に埋め込む事ができます。 検索可能なPDFファイルを作る事ができます。 最終的にテキストファイル/青空文庫形式/EPUB形式にしたい場合もこれを指定し、あとからテキストデータを抜き出します。
対象言語」は原稿の言語に合せます。 ここを合せないとテキスト化する時の認識精度が大きく下がります。 複数の言語が混在している原稿の場合は、最も重要視する言語を指定して下さい。 原稿全文をテキスト化するときは「全ページ」を指定します。
なお、「マーカー部分の文字列を・・・」にチェックを入れると、 マーカーを引いた原稿をカラーで読み取ると、マーカー部分のみをキーワードとしてPDFファイルの中にテキストデータを埋め込む事ができます。
以上で設定は終了です。 画面右下の「OK」をクリックして設定画面を閉じます。

ScanSnapでスキャンを開始する

iPhone ScanSnap本体に原稿をセットします。 原稿は、図のように先頭ページを一番奥に、上下を逆にしてセットします。 正面から見たときに、一番最後のページがさかさまに見えているはずです。 一度にセットする枚数は、紙の厚さにもよりますが、文庫・新書の場合50枚/100ページ程度がよいと思います。 そして本体の、青く光っている「Scan」ボタンを押すとスキャンが始まります。
カラー表紙など長い原稿を読むときは、「Scan」ボタンを長押しして、点滅してから指を離すと読み取れます。 さもないと紙詰まりと判定され、途中で読み込みが停止します。
iPhone スキャン中にはほかのアプリで別のことをしていても構いません。 読み取りが終わるとこの画面は消えてしまいます。 設定画面で指定したフォルダに、指定したファイル名でPDF/JPEGファイルが出力されているはずです。
続きのページがあるときは、その原稿をセットして本体の青く光っている「Scan」ボタンを押せばOKです。 格納先フォルダの中身から、自動的に続きのファイル名を判別して格納してくれます。
iPhone スキャンを終えたら最後にメンテナンスしましょう。 多数スキャンすると、写真のグレーのリングに紙の粉がまとわりつき、紙を吸い込まなくなります。 これらのリングは容易に取り外せます。スキャン10冊に1回程度の割合で、取り外して洗いましょう。

仕上げの調整

iPhone スキャンが終わったら仕上げの調整をしましょう。 モノクロページは、明るさとコントラストを調整します。 コーレル“Paintshop Pro”の場合なら[調整]-[明るさとコントラスト]-[カーブ]で図のようなカーブをかけるときれいに仕上がります。 これをスクリプトに登録して、全モノクロページに対して一括処理を行えばOKです。

PDFファイルからテキストを取り出す

ScanSnap設定画面の「テキスト認識の選択」で「全ページ」を「検索可能なPDFにします」の指定を行っていれば、そのPDFファイルからテキストを抽出することが可能です。
iPhone ScanSnap本体に付属している、Adobe Acrobatを起動します。 ScanSnapで読み込んだPDFファイルを開きます。
iPhone [ファイル]メニューから[名前を付けて保存]-[その他のオプション]-[テキスト(アクセシブルまたはプレーン)]を選びます。 するとテキストファイルの保存先を聞いてくるので、任意のフォルダ/ファイル名を指定します。 誤字の校正は必要ですが、全体の9割程度は正しいテキストに変換されます。
なお、Adobe Acrobatをお持ちでない場合は、フリーソフトの Free PDF to Text Converter を使う手もあります。