KindleDXで自炊小説PDFを綺麗に表示する覚え書き

前のエントリでPDFでもDot-by-Dot表示するための解像度を突き止めたんですが、これだけでは不十分でした。KindleのPDFビューワーがお節介にも外周の余白を落として拡大表示してくれるせいで、ページ毎に微妙にズーミングされてしまい、いくら元データを揃えても意味がないんです。また、PCで読むのには784×1142ではやや粗いので、1ファイル・マルチディスプレイ的な使い方にはイマイチです。

で、その後も色々試行錯誤して、DbDの整数倍である、1568×2284という解像度で作るとなかなか良好な結果になりました。スキャンした解像度とあまり変わらないので、そのまま入れた方が綺麗なんじゃないか?という説もありましたが、実際に比べた結果、1568×2284の方が綺麗でした。どのみち傾き補正はするので一度はリサイズが発生しますしね。流石にファイルサイズは784×1142の時に比べて、2倍ほどになりましたが、それでも450ページの小説で300MBほど。動画コレクションに比べたら誤差のレベルです。KindleDX上での操作レスポンスも気になるほどの違いは感じられません。

以下はKindleDXに表示した状態でスクリーンキャプチャを撮ったものです。トリミングしてJPEG圧縮。

 

DbD濃

784×1142のリサイズした画像を取り込んでPDFにしたもの。ガンマ補正で全体を濃くすることによってフォントを太らせています。こうしないとKindle上では薄くて読みづらいからです。

3行目の「つ」や「け」など各所にリサイズによる崩れが発生。

全体のファイルサイズは139MB。


2倍DbD濃

2倍DbD(1568×2284)で食わせた例。ガンマ補正有り。

気になるほどの崩れはありません。

ファイルサイズは328MB。

2倍DbD

2倍DbD(1568×2284)で食わせた例。ガンマ補正無し。

こうしてみるとこっちの方が見やすいんですが、KindleDX上ではカスレ気味に見えて目が疲れます。KindleDXで濃度調整機能があればいいんですが…

ファイルサイズは319MB。
以下は後ろの2つをKindleDXで表示した様子(クリックで拡大)。

kindle_dbd_1 kindle_dbd_2

うーん、この写真だと右(ガンマ調整無し)でも読めそうに見えるかな?まぁ、読めないことはないんですけどね。ひらがなのはらいの部分みたいに細いところが消えかかってる感じ。あと全体にグレー字になって見えるので、環境によってはツラいんです。

Kindle用純正(?)LEDライト Mighty Bright Music Light Xtra Flex

Kindleの難点はバックライトがないので暗所では読めないというところです。まぁ、普通は部屋の照明をつけてればいいんですが、プロジェクターでゲーム等をしながら使いたい(攻略サイトを参照するなど)場合があるので電気スタンドでは明るすぎて、、→のクリップ型のライトを買って見ました。

この製品は元々は譜面台用とされていますが、Amazon.comのKindle StoreでKindle Accessoriesのところに載っています。わざわざ「Kindle Version」となってますが、どうもロゴが印刷されてるだけっぽい。どう見ても同じものですよね。てことで事実上の純正オプションなんだろうということでチョイス。

グースネックの部分は結構細くてグニャグニャ柔らかいですが、ヘッド自体がそう重い訳ではないので、多少揺れた位では勝手に変形したりはしなさそうです。

ただ、クリップ部分が大きくて、KindleDXのフレームに止めるには端っこギリギリしかありません。公式サイトだと平気で画面にかかるように止めてたりしますが、繊細な日本人には無理ですねw。ここでもかろうじて止められはいます。激しく動かさない限り一応止まっている、というカンジ。純正指定とはいて、所詮出来合というところですかね。ちなみに電池ボックスはクリップの裏側にあり、単4x3本。スイッチはヘッド部分にあります。重さはカタログスペックで109gありますが、これをつけるとメチャメチャ重くなるという印象はないです。まぁ、あまり長時間試した訳ではないですが。

mighty1 mighty2

2枚目の写真は部屋を暗くした状態で撮ってみたもの。色は一般的な白色LEDの色。もう少し色温度が低くい方が見やすいかも。明るさは充分かな。逆にもう少し照射範囲が狭い方が、プロジェクター画面に光があたらないという意味では理想。ただヘッドを画面に近づけてしまうと光源が映り込んで見辛くなってしまうんですよね。

Kindle専用設計ではない分の微妙さはありますが、まぁこの値段で買えるなら良しとしましょう。

KidnleDXでPDFをDot-by-Dot表示する

KindleDXでPDFを表示すると、画面上下にメタデータを表示する領域が強制的に入る為、824×1200で作った画像PDFでは綺麗に表示されません。特に文字主体のデータでは潰れが酷くかなり読みづらくなります。

そこで、上下の領域を差し引いたピクセル数をスクリーンショットを使って計測しました。その結果。784×1142という数値が導き出されました。横は差し引かれないので、実際には824×1142でもいいかも知れませんが、824×1200の元データがアスペクトを維持して縮小された時の実測値が784×1142という訳です。本当にDbDかどうか確認する術はありませんが、一応Photoshopで作ったグリッド画像を表示してみた感じでは綺麗に表示できてるっぽいです。。

実際、eTilTranからこのサイズで出力したものをPDF化したところ、かなり良好に表示できました。新書サイズの小説をこのサイズにしたところ、PCで見るには若干解像度不足かなという気はしますが、当面はKindle優先で。解像度的には損してる感がしますが、やはり小説の場合、文字が綺麗に見えてナンボなので、Dot-by-Dotは重要です。

後継機に買い換えるどころか、今後PDFの全画面表示に対応するなどファームウェア更新ですら状況が変わってしまう可能性がある刹那的な設定ですが、まぁ当面はこれで頑張ってみます。

■MeTilTran

eTilTranの姉妹ソフトである、MeTilTranも試してみました。このソフトは、画像中の文字を文字単位で認識し、指定した解像度に最適な行数、列数で並べ替えをしてくれるというシロモノです。よくまぁ、思い付いたなと感心しきりです。

例えば、iPhoneに縦40文字とか入れたら小さくて読めないですが、縦20文字くらいにして行数とページ数を増やす方向で再配置すると、文字サイズを保って読みやすい画像ができがる訳です。

やってみると精度も実用レベル。これはかなり使えます。KindleDX位の解像度なら再配置しなくてもいけますが、PDA用に変換する場合などは重宝しそうです。

残念なのは現在縦書きにしか対応していない点。横書きも扱えると翻訳モノのビジネス書なんかにも使えて良さげなんですけどね。

何年かぶりのOCRソフト、e.Typist v.12

以前のエントリで、非マンガ書籍をKindle用PDFについて試行錯誤していた訳ですが、その際ネックになったOCRを、別途専用ソフトでやったらよくね?ってことで、何年かぶりにOCRソフトに手を出してみました。というか単体パッケージを買うのは初めてかも。元々OCRとかディクテーションとか翻訳といった自然言語系のソフト技術は学生の頃に絶望していらいあんま信用しておらず、その後あまり注目したこともありませんでした。でも、先日ScanSnap Organizerの認識率はまずまずだったし、PDFの検索用に透明テキストを作る位なら一字一句正確でなくてもまぁ諦められるかなと。

で、ScanSnap Organizerの認識エンジンを調べると、ABBYY FineReader for ScanSnap™ 4.0となっています。海外製のソフトをOEMで買って来て使っているもよう。おそらくScanSnap以外で取り込んだPDFを認識しないのは、ライセンス上の制限なんでしょう。なら、その製品のフルパッケージを買えばよくね?と思った訳ですが、体験版の申し込みをした後、さっぱりメールが来ない。まぁ、迷惑メールフォルダをあされば出てくる可能性大ですが、とりあえず放置。日本語は辞書を利用した認識はしてくれないみたいですし。

で、次に同社のエンジンを(英文に)利用しているらしいPanasonicの「読取革命」に注目。しかし体験版のインストーラーすら起動せず。64bit非対応でしたorz。

調べてみると64bit完全対応を謳う製品はなく、「動作未保証」になっているのが「e.Typist」と「読んでココ」辺り。このあたりは1万円台後半で、ドキュメント管理やOffice文書(への)変換など統合ソフト的になってきていて、ぶっちゃけ画像PDFに透明テキストが載っけられれば良いσ(^^)にはやや無駄も多かったんですが、老舗なりの精度を期待したのと、「e.Typist」のオーバーレイ表示が認識精度のチェックに良さげだと思ったので決めました。

64bitで動くか不安だったので体験版を探すも見つからず諦めて店頭へ。で、パッケージをみるとやっぱり「体験版は公式サイトにあるから、動作確認はそっちでよろしく」と書いてある。仕方なく店頭では買わず、無駄に駐車場代を払って帰宅。で、公式サイトで体験版一覧のページを見つけて開いてみると「現在配布配布している体験版はありません」ときやがる!なめとんのかゴルァですよ。結局Vectorで買いました。

■やっとレビュー

認識率は変に凝ったフォントでない限り問題なさげです。認識速度も爆速。ただ、画像PDFの読み込みが若干もっさりします。

本製品はScanSnap連携機能もあり、直接ScanSnapのボタンでスキャンした結果を取り込むことができます。が、しかしこれを使うと結局前のエントリで問題になった点をすべて引きずることが判明。さらにTIFF形式で渡してるみたいなんですが、これもやっぱり読み込みがもっさり。結局この機能はさっくり殺しました。

結局JPEGで喰わせるのが一番速いようで、JPEGで取り込み、eTilTranで傾きとガンマ補正して再度JPEG保存。それをe.Typistに読み込むという手順がいいみたいです。KindleDXに最適化したピクセル数だとPC上で読むのにやや粗いので、リサイズはしない方向で。前回のものに比べサイズが3倍以上(178ページで30MB->110MB)になりましたが、動画などに比べたら屁でもないのでクオリティ優先で。できあがったPDFはPCで見ても綺麗で検索もでき、KindleDXでもそれなりに読めるので、満足しています。

ユーサビリティとしては、全体にやや煩雑です。フォルダで喰わせられず、百単位の画像ファイルを全選択して渡す必要があったり(フォルダ指定はできました)、レイアウト調整、認識もデフォルトでは選択しているファイルしかしてくれなかったり。色々マクロ的な機能を使いこなせば一発変換もできるみたいですが、なんかそこまでするのもまためんどくさそうな微妙な作りです。あと開いてるファイルの閉じ方も不明。別の書籍データを取り込もうとすると、同名ファイルが既にあると怒られる。よくわからないので毎回一旦アプリを終了してます。保存メニューから透明テキスト付きPDFを保存できるかどうかもよくわからなくて、いつも「ワンタッチ転送」機能でAcrobatに渡してそっちで保存しています。Acrobat持ってない人はどうなんだろう?とか。

そういう応用力と試行錯誤する根気がある人には精度と速度的には充分オススメでしますが、例えば実家の父親にホイっと渡して使える気はあんまりしない、という感じ。逆に業務で定型文書を扱う時なんかには、テンプレート設定機能を使って最適化してやれば、父親の会社の事務員さんなんかには使ってもらえるかなという気もします。その辺りの機能はまた機会があれば試してみたいと思います。プログラミング系のリファレンス本なんかにはいいかも。>テンプレ

KindleDX用ZIP/JPG自炊のツボ

色々試行錯誤をして、KindleDXで快適に閲覧できるZIP入りJPGアーカイブができるようになってきました。

最近やっていることは、

個別にどの程度効くかは未検証ですが、KindleDX購入以前からあったアーカイブに比べ、明らかにページめくりのレスポンスが良くなっています。表紙などカラーページやはり若干もたつく印象ですけどね(著作権的に問題のない作品でもあれば動画でも載せたいところなんですが)。

ZIP圧縮率0だとファイルが大きくなるんじゃ?と思われるかも知れませんが、もともとJPEGフォーマットの段階でほぼ限界まで圧縮されているので、更にZIPで圧縮してもたいして縮まらず、展開負荷が無駄になります。ちなみにウチでは7-Zipを使って圧縮しています。

あと、おそらくバグですが、MENUでは全画面モードのはずなのに、実際にはタイトルバーが出ている、という状態になることがあります。仕方ないので、こないだ発見したキーボードショートカットの[F]を2度押しして再度全画面表示にしてやる必要があります。

あとの不満はジャンプができないって位ですね。後半1/3位から読みたい、なんてのができないので。まぁ、最後に読んだページは覚えててくれるので大抵はそれでなんとかなるんですが。