大幅にリライトしました!

自炊の全工程をスッキリ解説!裁断からスキャン、文字認識(OCR)まで

スキャン中

こんにちは、蜜です!

今回は私が実際に行っている、紙の本のデータ化(自炊)の手順についてお伝えしたいと思います。

SPONSERED

自炊の手順

まず、自炊の大まかな流れは次の3ステップです。

自炊の手順
  1. 裁断する
  2. スキャンする
  3. ファイル圧縮&文字認識

1冊あたりにかかる所要時間は、大体10~15分くらいです。

使用アイテム

スキャナ

「自炊と言えばScanSnap ix500!」とブロガーの皆さんが口々におっしゃるので、私もこのスキャナにしました。スキャナはこれ以外知りませんが、早くてきれいに出来るので満足しています。

created by Rinker
富士通
¥69,800 (2019/09/23 00:33:57時点 Amazon調べ-詳細)

裁断機

自炊で一番重要なのは、素早くキレイに切ることです!

ちゃんと切らないとスキャンするとき紙がひっかかったり、ページが台形になって文字認識をしたときの精度が下がってしまいます。

修正に時間がかかると自炊するのが億劫になってしまうので、ケチらずよい裁断機を買いましょう。

私はDURODEX 200DXを使っています。

created by Rinker
DURODEX
¥38,880 (2019/09/23 20:07:59時点 Amazon調べ-詳細)

PDF編集ソフト

自炊では大量の紙をスキャンするので、ページの抜け、重複、上下反転がよく起こります。私はJUST PDFを使っていますが、AdobeのAcrobatより安いし買い切りなのでおすすめです。ハイライトを一覧で抽出出来ないこと以外は満足。

created by Rinker
ジャストシステム
¥8,131 (2019/09/22 21:51:23時点 Amazon調べ-詳細)

文字認識ソフト

スキャンしたデータをPDFとして保存したあと、文字認識(OCR)すれば透明テキストを付けることが出来ます。この処理をすることで、本文を検索、コピー、ハイライトすることが出来るようになります。

私は読取革命を使っています。

created by Rinker
パナソニック(Panasonic)
¥8,190 (2019/09/22 21:51:24時点 Amazon調べ-詳細)

SPONSERED

本を裁断する

本を裁断する
  1. 表紙カバーを切る
  2. ハードカバーは表紙をはがす
  3. 厚い本はカッターで半分に割る
  4. 裁断機のセット
  5. 裁断機でページをバラバラにする

表紙カバーを切る

表紙を切る

表紙を切る

まず、表紙を切って取っておきます。

PDFの一枚目を表紙にしておくと、パソコンでファイルを探しやすくなります↓

※画像がぼやけて見えるのは、著作権に配慮してモザイクをかけているからです。スキャンの精度が悪いわけではありません笑

ファイルの見え方

ファイルの見え方

ハードカバーは表紙をはがす

ハードカバーは表紙と本体の間にカッターで切れ込みを入れ、表紙を外しておきます。

※文庫や新書など表紙がない場合は、この処理は必要ありません。

ハードカバーの両側に切り込みを入れる

反対側も同様にカッターで切り込みを入れます。

ハードカバーの両側に切り込みを入れる

手でぐいっと引っ張ると、本体から表紙を外すことが出来ます。

表紙を外す

このとき、しおりなど付属物があれば外しておきます。

厚い本はカッターで半分に割る

厚さ13mm以下の本であれば裁断機でさくっと一発ですが、13mmを超える本はカッターで半分に割ります。

厚い本はカッターで割る

厚い本はカッターで割る

裁断機のセット

DURODEX 200DXを使って説明します。

created by Rinker
DURODEX
¥38,880 (2019/09/23 20:07:59時点 Amazon調べ-詳細)

裁断する前に、本体の後ろの黄色い棒(受け木)を外し、

黄色い棒

裁断機のロックを解除したあと、刃の下に差しておきます。

受け木を指す

裁断機でページをバラバラにする

さあ、いよいよ裁断です。

本をセットし、カットの目印となる赤いライトをONにします。

裁断機で切り落とす

裁断機で切り落とす

本によりますが、だいたい端から5~10mmの部分を切り落とします。

注意点
  • ノリが残らないように幅をしっかり取って切り落とす
  • ページが台形にカットされないよう、まっすぐセットする
  • 半分に割った厚い本は、ガイドを利用して幅をそろえる

DURODEX 200DXでの裁断については、以下のサイトでも詳しい解説が見られます。

参考 マンガを一発で裁断できる自炊向き裁断機 ダーレー Durodex 200DXレビューごりゅご.com 参考 【第1084回】自炊事始め(3)DURODEX 200DXを使った断裁イジハピ!

見返しや扉を捨てる

裁断が終わったら、文字のないページ(見返しや扉)を取り除きます。

見返しや扉を外す

切り終えたらパラパラと束をよくほぐし、ページがくっついているところがあれば剥がしておきます。

しおりや広告も、あれば取り除いておきます。

最後に先ほど切っておいた表紙を上に乗せたら、原稿の準備は完了です。

スキャン準備完了

スキャン準備完了

スキャンする

ScanSnapの設定

スキャンに入る前に、スキャンの設定をしておきます。

created by Rinker
富士通
¥69,800 (2019/09/23 00:33:57時点 Amazon調べ-詳細)

設定にはScanSnap Managerというアプリが必要です。

各機能の説明やダウンロードの仕方については、以下のサイトを参照してください。とても詳しく解説してあります。

参考 ScanSnap iX500の設定方法本の電子書籍化(自炊)方法 参考 定番スキャナーScanSnap iX500で自炊!本に合わせた最適な設定と手順とコツushigyu.net

この記事では、私が実際に行っている設定と手順に絞ってお伝えしていきます。

ページの色や傾き、余白について、好みで設定を調整することも出来るようですが、私は特に何もしていません。私のように「普通に読めればいい」という方は、次の設定にしておけば大丈夫です。

ScanSnap Managerの設定

Windowsをお使いの方は、画面最下部のタスクバーの^ボタンからScanSnap Managerの設定画面を呼び出すことが出来ます。

設定画面呼び出し

 

Sボタンをダブルクリックすると、設定画面が開きます。

設定画面

私はマンガも本も、すべて以下の設定でスキャンしています。

  • アプリ選択→「指定したフォルダに保存」
  • 保存先→ファイルを保存したいところに指定します。「本棚」など、わかりやすい名前をつけた新規フォルダを作成しておきます。
  • 読取モード→後述
  • ファイル形式→PDF(対象言語は日本語を選択)
  • 原稿→サイズ自動検出、重なりで検出
  • ファイルサイズ(圧縮率)→3
読取モード
  • 画質の選択→スーパーファイン
  • カラーモードの選択→カラー自動判別
  • 読み取り面の選択→両面読み取り
  • 向きの選択→自動判別
  • 白紙ページの自動削除→ON
  • 継続読み取り有効→ON

上の設定画面の画像も参考にしてください。

原稿をセットする向き

原稿をセットする際、向きに注意して下さい。

セットする向き
  • 表紙を下に向ける
  • 上下逆

向きがわかりやすいように、裁断前の本を置いてみました↓

原稿の向きに注意

スキャンする順番

スキャンする順番
  1. 表紙
  2. 中身のページ(枚数によって2~3回に分ける)

中のページと紙質やサイズが違うので、まず表紙だけスキャンします。

原稿を置いて、本体の青く光るボタンを押すとスキャンがスタートします。

引き続き中身をページ数によって、2~3回に分けて読み取ります。

重複が起こらずスキャン出来るのは、体感で一回あたり約180枚。

薄めの文庫ならギリギリ1回で済み、ハードカバーの本は2回に分けます。

スキャン中

 

一回にスキャンする枚数を増やしたい

原稿をセットするとき、束をズラしておくと一度に吸える枚数が多くなるようです。

束をズラしてセットするとちょっと多く置ける

重送時の対処

スキャン中、ページが2枚同時にスキャンされることがあります。

これを防ぐために、なるべくノリを残さないように裁断し、束をよくパラパラしておくことが大切ですが、紙質によっては重送が起こります。

重送時の対処
  1. 重複して読み込んでしまった原稿を取り出す
  2. 最後に読み取った原稿を「残さない」に設定
  3. 再び原稿をスキャナにセット
  4. 「継続読み取り」をクリック

詳しくはうしぎゅうさんのサイトへどうぞ。

参考 定番スキャナーScanSnap iX500で自炊!本に合わせた最適な設定と手順とコツushigyu.net

ファイルを保存する

スキャンが終わったら、「読み取り終了」をクリックします。

「読み取り終了」をクリック

すると「指定したフォルダに保存」という画面が出てくるので、

指定したフォルダに保存
  • ファイル名を入力
  • 保存場所を指定
  • 最後に「保存」をクリック

して保存します。

スキャン後保存画面

ファイル名の決め方

私はあとで本を検索しやすいように、

  • タイトル
  • 著者名
  • 出版年

をファイル名にしています。

マンガなど文字認識しない本については、これで手順は終了です。

ファイルが大きい場合は圧縮すると、容量も小さくなって動作が軽くなります。

PDFファイルの圧縮_1デジタルペーパーを使いこなす】PDFを圧縮して動作を軽くする

SPONSERED

PDFに透明テキストを付ける

本文を検索、コピー、ハイライトしたい場合はPDFに透明テキストを付けます。

使用するソフトはコチラ↓

created by Rinker
パナソニック(Panasonic)
¥8,190 (2019/09/22 21:51:24時点 Amazon調べ-詳細)

読取革命でファイルを開く

標準モードで開く

読取革命には「標準モード」と「かんたんモード」がありますが、どちらで開いても構いません。

ここでは「標準モード」で開きます。

次に、上部のバーの「入力」を押し、ファイルを開きます。

「入力」を押しファイルを開く

すると下のような画面が表示され、PDFから画像への変換がはじまります。

ちょっと時間がかかりますので、ゆったり待ちましょう。

PDFを画像に変換

変換が終わったら、画面上部の「PDF透明文字」をクリックすると、文字認識が始まります。


※2019.9.12追記

このまま文字認識を行うと、すべての行末に改行が入ってしまいます。

不要な改行が入らないようにしたい場合は、下記サイトの指示に従って「改行」のチェックを外してください。

参考 認識結果に不要な改行を挿入しないようにしたいPanasonic

PDF透明文字

全工程で一番時間がかかるのがこの文字認識です。他の用事を済ませながら、のんびり待ちます。

PDFとして保存

しばらくするとPDF編集ソフトが自動的に立ち上がり、”yomikaku”という名のファイルが開きます。

メニューバーから「ファイル」→「名前を付けて保存」→「PDF」

で、スキャン時に名前を付けたPDFに上書き保存します。

”yomikaku”を元のファイルに上書き保存

”yomikaku”を元のファイルに上書き保存

 

ファイルが大きい場合は圧縮すると、容量も小さくなって動作が軽くなります。

PDFファイルの圧縮_1デジタルペーパーを使いこなす】PDFを圧縮して動作を軽くする

また、目次を付けると使い勝手がよくなります。

PDFにしおりの作成1デジタルペーパーを使いこなす】PDFに目次を作る

これで、私の行っている自炊手順の全工程の説明は終わりです!

以上、蜜でした!