本のページ写真を後処理するScan Tailor

Scan Snapとかを使い、本を断裁して読み込んでいる人がいっぱい居る。この方法を使えばキレイなPDFとして本が持っていられる。

うらやましいなーと思うのだけど、なんとなく抵抗はある。本が特別なものであると思いながら育ったために実体の書籍を切るのがイヤだし、さらには、文庫本なぞは文庫本というフォームファクターが大事なのではないかと思ってしまうのだ。

もうちょっと非破壊的にスキャンしたいなあ、と思っていたところにこいつに出会った:

http://www.instructables.com/id/DIY-High-Speed-Book-Scanner-from-Trash-and-Cheap-C/

これはスキャナ的な方法を使わないブックスキャナだ。走査をするのではなく撮影してしまう。また「ページめくり」という機械には失敗しやすいタスクを人間に心ゆくまで行わせることで、安さと速さを両立させている。

ところで、このスキャナを見て、まだ複雑で高価だ!と感じる人もいる。カメラを2台用意するのが大変だと感じる人、台をちゃんと作るのは大変だと思う人だ。そんな人向けに、さらにチープなバージョンも作られている:

http://www.instructables.com/id/Bargain-Price-Book-Scanner-From-A-Cardboard-Box/

段ボールの台にカメラは1台。さすがに誰にでもできるかんじ。でも、これで推奨してるやり方は

  1. 片側のページを全部撮影した後
  2. もう片側のページを全部撮影

である。ちゃんとした順序はまったく期待できないし、水平もおかしくなり、それぞれの半分が左右に90度ずつ回転する。撮影段階でこんなことをやっても大丈夫なのは、後処理ソフトのサポートがあるからだ。そのソフトがScan Tailorだ。

http://scantailor.sourceforge.net/?q=en

Scan Tailorはドキュメントの方向を自動認識して向きを合わせてくれる。さらにそれだけでなく、スキャン時に不可避なページの縁の歪み、膨らみによる歪みを取ってくれたりする。すごい。

ところがこれこのソフト、Mac向けにはバイナリコンパイル済みのものがリリースされてない。でもC++とQt4で書いてあり、WindowsLinuxで動く、とあるからOS Xでも動くのではないか。

まずMacPortを調べてみる。
mintel:~ kmf$ port search scantailor
No match for scantailor found
mintel:~ kmf$
見つからない。portに無いとなると、バイナリで入れられないだけでなくコンパイルも難しそうな気がする。まあとにかくやってみる。

ソースを持ってきて展開してみたけど、普通のUnix用のソースのようにconfigureスクリプトとかがあるわけじゃない。Makefileもない。

ちょっと調べてわかったのが、まずこいつはCMakeというお膳立てツールでパッケージングされてること。これはconfigureの代替というかんじ。このcmakeはちゃんとMacPortにある。

$ sudo port install cmake

これでいけるはず。というか、すんなり通ったのでトラブルのことはわからない。

んで、

$ cmake .

で./configure相当の動作をするはずなんだけど、これがうまくいかない。Qtが持ってるqmakeが見つからないという(Qt4もMacPortで入る。ビルドに凄く時間がかかるので頑張って。)。

これも調べてみたら、/opt/local/bin/にqmake-macという名前で入っているためのエラーみたい。シンボリックリンクを張ればよい。

$ cd /opt/local/bin/ ; sudo ln -s qmake-mac qmake

さらにboostが入ってないというエラーも出た。これもMacPortで入る。sudo port install boostと、非常に当たり前の事を書くだけ。

cmakeが通ったら普通のmakeをする。

$ make

ウチではこれでそのまま通った。
出来上がったモノは.appになっていない。scantailorというファイル名になっているので、普通にコマンドラインから起動するw

$ ./scantailor

ビミョー♪
まずは本を1章分スキャンして、いろいろいじってみようかなと思う。

ファイル群を選んだあと、メニューの「1.方向修正」「2.ページ分割」「3.歪み補正」「4.内容選択」「5.ページレイアウト」「6.出力」を適用していけばいいみたい。

本に直すには、そのあとPDFとして出力してくれるソフトを使えばよい。できればOCRもかけたい。