KidnleDXでPDFをDot-by-Dot表示する

KindleDXでPDFを表示すると、画面上下にメタデータを表示する領域が強制的に入る為、824×1200で作った画像PDFでは綺麗に表示されません。特に文字主体のデータでは潰れが酷くかなり読みづらくなります。

そこで、上下の領域を差し引いたピクセル数をスクリーンショットを使って計測しました。その結果。784×1142という数値が導き出されました。横は差し引かれないので、実際には824×1142でもいいかも知れませんが、824×1200の元データがアスペクトを維持して縮小された時の実測値が784×1142という訳です。本当にDbDかどうか確認する術はありませんが、一応Photoshopで作ったグリッド画像を表示してみた感じでは綺麗に表示できてるっぽいです。。

実際、eTilTranからこのサイズで出力したものをPDF化したところ、かなり良好に表示できました。新書サイズの小説をこのサイズにしたところ、PCで見るには若干解像度不足かなという気はしますが、当面はKindle優先で。解像度的には損してる感がしますが、やはり小説の場合、文字が綺麗に見えてナンボなので、Dot-by-Dotは重要です。

後継機に買い換えるどころか、今後PDFの全画面表示に対応するなどファームウェア更新ですら状況が変わってしまう可能性がある刹那的な設定ですが、まぁ当面はこれで頑張ってみます。

■MeTilTran

eTilTranの姉妹ソフトである、MeTilTranも試してみました。このソフトは、画像中の文字を文字単位で認識し、指定した解像度に最適な行数、列数で並べ替えをしてくれるというシロモノです。よくまぁ、思い付いたなと感心しきりです。

例えば、iPhoneに縦40文字とか入れたら小さくて読めないですが、縦20文字くらいにして行数とページ数を増やす方向で再配置すると、文字サイズを保って読みやすい画像ができがる訳です。

やってみると精度も実用レベル。これはかなり使えます。KindleDX位の解像度なら再配置しなくてもいけますが、PDA用に変換する場合などは重宝しそうです。

残念なのは現在縦書きにしか対応していない点。横書きも扱えると翻訳モノのビジネス書なんかにも使えて良さげなんですけどね。

何年かぶりのOCRソフト、e.Typist v.12

以前のエントリで、非マンガ書籍をKindle用PDFについて試行錯誤していた訳ですが、その際ネックになったOCRを、別途専用ソフトでやったらよくね?ってことで、何年かぶりにOCRソフトに手を出してみました。というか単体パッケージを買うのは初めてかも。元々OCRとかディクテーションとか翻訳といった自然言語系のソフト技術は学生の頃に絶望していらいあんま信用しておらず、その後あまり注目したこともありませんでした。でも、先日ScanSnap Organizerの認識率はまずまずだったし、PDFの検索用に透明テキストを作る位なら一字一句正確でなくてもまぁ諦められるかなと。

で、ScanSnap Organizerの認識エンジンを調べると、ABBYY FineReader for ScanSnap™ 4.0となっています。海外製のソフトをOEMで買って来て使っているもよう。おそらくScanSnap以外で取り込んだPDFを認識しないのは、ライセンス上の制限なんでしょう。なら、その製品のフルパッケージを買えばよくね?と思った訳ですが、体験版の申し込みをした後、さっぱりメールが来ない。まぁ、迷惑メールフォルダをあされば出てくる可能性大ですが、とりあえず放置。日本語は辞書を利用した認識はしてくれないみたいですし。

で、次に同社のエンジンを(英文に)利用しているらしいPanasonicの「読取革命」に注目。しかし体験版のインストーラーすら起動せず。64bit非対応でしたorz。

調べてみると64bit完全対応を謳う製品はなく、「動作未保証」になっているのが「e.Typist」と「読んでココ」辺り。このあたりは1万円台後半で、ドキュメント管理やOffice文書(への)変換など統合ソフト的になってきていて、ぶっちゃけ画像PDFに透明テキストが載っけられれば良いσ(^^)にはやや無駄も多かったんですが、老舗なりの精度を期待したのと、「e.Typist」のオーバーレイ表示が認識精度のチェックに良さげだと思ったので決めました。

64bitで動くか不安だったので体験版を探すも見つからず諦めて店頭へ。で、パッケージをみるとやっぱり「体験版は公式サイトにあるから、動作確認はそっちでよろしく」と書いてある。仕方なく店頭では買わず、無駄に駐車場代を払って帰宅。で、公式サイトで体験版一覧のページを見つけて開いてみると「現在配布配布している体験版はありません」ときやがる!なめとんのかゴルァですよ。結局Vectorで買いました。

■やっとレビュー

認識率は変に凝ったフォントでない限り問題なさげです。認識速度も爆速。ただ、画像PDFの読み込みが若干もっさりします。

本製品はScanSnap連携機能もあり、直接ScanSnapのボタンでスキャンした結果を取り込むことができます。が、しかしこれを使うと結局前のエントリで問題になった点をすべて引きずることが判明。さらにTIFF形式で渡してるみたいなんですが、これもやっぱり読み込みがもっさり。結局この機能はさっくり殺しました。

結局JPEGで喰わせるのが一番速いようで、JPEGで取り込み、eTilTranで傾きとガンマ補正して再度JPEG保存。それをe.Typistに読み込むという手順がいいみたいです。KindleDXに最適化したピクセル数だとPC上で読むのにやや粗いので、リサイズはしない方向で。前回のものに比べサイズが3倍以上(178ページで30MB->110MB)になりましたが、動画などに比べたら屁でもないのでクオリティ優先で。できあがったPDFはPCで見ても綺麗で検索もでき、KindleDXでもそれなりに読めるので、満足しています。

ユーサビリティとしては、全体にやや煩雑です。フォルダで喰わせられず、百単位の画像ファイルを全選択して渡す必要があったり(フォルダ指定はできました)、レイアウト調整、認識もデフォルトでは選択しているファイルしかしてくれなかったり。色々マクロ的な機能を使いこなせば一発変換もできるみたいですが、なんかそこまでするのもまためんどくさそうな微妙な作りです。あと開いてるファイルの閉じ方も不明。別の書籍データを取り込もうとすると、同名ファイルが既にあると怒られる。よくわからないので毎回一旦アプリを終了してます。保存メニューから透明テキスト付きPDFを保存できるかどうかもよくわからなくて、いつも「ワンタッチ転送」機能でAcrobatに渡してそっちで保存しています。Acrobat持ってない人はどうなんだろう?とか。

そういう応用力と試行錯誤する根気がある人には精度と速度的には充分オススメでしますが、例えば実家の父親にホイっと渡して使える気はあんまりしない、という感じ。逆に業務で定型文書を扱う時なんかには、テンプレート設定機能を使って最適化してやれば、父親の会社の事務員さんなんかには使ってもらえるかなという気もします。その辺りの機能はまた機会があれば試してみたいと思います。プログラミング系のリファレンス本なんかにはいいかも。>テンプレ

KindleDX用ZIP/JPG自炊のツボ

色々試行錯誤をして、KindleDXで快適に閲覧できるZIP入りJPGアーカイブができるようになってきました。

最近やっていることは、

個別にどの程度効くかは未検証ですが、KindleDX購入以前からあったアーカイブに比べ、明らかにページめくりのレスポンスが良くなっています。表紙などカラーページやはり若干もたつく印象ですけどね(著作権的に問題のない作品でもあれば動画でも載せたいところなんですが)。

ZIP圧縮率0だとファイルが大きくなるんじゃ?と思われるかも知れませんが、もともとJPEGフォーマットの段階でほぼ限界まで圧縮されているので、更にZIPで圧縮してもたいして縮まらず、展開負荷が無駄になります。ちなみにウチでは7-Zipを使って圧縮しています。

あと、おそらくバグですが、MENUでは全画面モードのはずなのに、実際にはタイトルバーが出ている、という状態になることがあります。仕方ないので、こないだ発見したキーボードショートカットの[F]を2度押しして再度全画面表示にしてやる必要があります。

あとの不満はジャンプができないって位ですね。後半1/3位から読みたい、なんてのができないので。まぁ、最後に読んだページは覚えててくれるので大抵はそれでなんとかなるんですが。

非マンガ書籍自炊のためのメモ

将来的に小説なども電子化することを視野に、来週参加予定の読書会で使う書籍を電子化試行してみたんですが、なかなか一筋縄ではいきませんでした。

ScanSnap Organizerで直接PDFにする方法と、マンガ同様に一旦JPEGでスキャンしてeTilTranにかけてからPDF出力する方法があるのですが、一長一短なんです。

■ScanSnap OrganizerによるPDF化

  • OCRの処理速度と精度が良い
  • 画質がイマイチ

解像度自体はスーパーファインで問題ないんですが、「グレースケール」で取り込むと濃度がやや薄めでKindle上ではかなり読みづらくなります。で何故か手動の濃度調整は「自動」か「白黒」の時にしか使えない。「白黒」は図版が潰れるので論外として、「自動」では図版のあるページとないページで濃度セッティングが変わってしまい、ページによって文字の濃さ(太さ)がまちまちになってしまうという問題発生。「グレースケール」で手動濃度調整できれば試したなかでもっともバランスの良い自炊結果が得られそうなんですが残念無念。

■JPEG –> eTilTranでPDF化

  • 画質は良い(少なくともセッテイングを追い込める余地がある)
  • 角度補正も効く
  • AcrobatのOCRがイマイチ

この手順で作ったPDFをScanSnap Organizerに食わせてOCR処理させると「ScanSnapで作成したものじゃない」と怒られます。ケチ~。しかたないのでAcrobat9内蔵のOCRにかけてみたんですが、処理が1.5~2倍程度かかる上に、精度が低い。ScanSnap Organizerで拾えていた単語がこちらでは拾えないということが多々あります。

 

現状の結論として、

  • ScanSnap Organizerのグレースケールモードで手動濃度調節ができるようになるのが理想
  • Acrobat内蔵以外で良いPDF用OCRツールを物色するとよいかも

という感じ。

■KindleDX側の制約

もっとも、KindleDX側のPDFリーダーもあまりイケてる訳ではなく、そもそもせっかくOCRによる透明テキストを埋め込んでも、日本語検索(入力)に対応していないので意味なしです。まぁ、透明テキストはPC上での閲覧用にあるといいなということでこだわってみてます。

また、PDF内のしおりもKindleでは扱えません。ページ番号指定によるジャンプのみです。Kindle上のみの独自のBookmark機能はあって、1冊のデータに何カ所でも打てますが、名前をつけ変えたりはできません(一覧画面ではページ番号で表示)。

更にページ内の部品を認識して勝手に外周のマージンを削るように拡大表示してくれます。解像度の制約が大きいこの手のデバイスとしてはなるべく有効コンテンツ部分の解像度を高くして見せようという努力は評価できますが、結果としてページ毎に文字サイズがバラバラになるばかりか無駄にリサイズすることで文字が潰れたりギザったりしてくれやがります。ZIP/JPEGならできるDot-by-Dot表示もなぜか不可。

「なら、いっそZIP/JPEGでよくね?」って話になりますよね?ところがこっちも問題があるんです。ページ指定ジャンプができない。マンガや小説を頭から順に読んでく位ならあまり必要ないんですが、ランダムアクセスするような書籍だとさすがに1ページずつめくってられないです。「Go to Location…」というメニューはあるんですが、ページ番号入れてもファイル番号入れても何も起きない。マニュアルみても「特定のロケーションにジャンプできます」って書いてあるだけ…。そもそもZIP/JPEGがネイティブ対応してることはマニュアルには書かれていないので、あまり期待はできないかも。先頭ジャンプも効かないし、スリープ復帰後に最後に見ていたページはまとも表示されないし(めくると次ページからはちゃんと見える)、色々とバギーです。

 

ままならないものです…

Kindle DXの隠し操作というかキーボードショートカット

閲覧中、たまたまキーボードに触れてしまったりして、いくつかショートカットとして機能するキーがあることに気付きました。

User’s Guideにも載っておらず、ググっても出てくるのは前モデルのものが多く、ほとんどはDXでは使えないようです。

以下、とりあえず手元で確認できたもの。他にも画面更新など反応はあるものの、何が起きているのかわからないもの多数。どこかにまとめられてないかなぁ。

どこでも、

Alt + G: 画面再表示(前ページのゴーストが残っている場合などに)

Alt + ↑ + G: スクリーンショット撮影(documentsフォルダ下にGIFで保存される)

Home画面で、

ALT + Shift + M: マインスイーパ―起動 (イラネーw)

MENU: タイトルバーに時計を表示(Whispernet切ってるせいか時刻はズレまくり)

PDF閲覧中に

Alt + B: ブックマーク ON/OFF

ZIP/JPG閲覧中に、

F: Full Screenモード ON/OFF

R: Rotate(2方向のみ?)

C: Actual Size を trueに(=Dot-by-Dot表示)

Q: 拡大

W: 縮小

(拡大・縮小はAa –> Actual Sizeがnoにしてある時のみ)

 

 

 

というか、いじってるウチに画面下部に定規みたいな目盛りと数字が出てきたんですが、これが消せないorz。(再起動したら一応消えた)。