Kindle DX/電子書籍自炊の最近のブログ記事

夢の電子お風呂読書用にと米Amazonで注文したKindleDX用防水ケース。紆余曲折あって届くのに随分かかってしまいましたが、ようやく手元に届きました。

ちょっぴりがっかりな感じでしたが一応レビュー。

kindle_wp1

まず外観。とてもショボいです。また色もエグいというか。まぁ、海辺で使う様なイメージなんでしょうね。外装ケースには2つ折りで収納されていたせいで、半分のところにしっかり折り目ついちゃってますorz。あと紐はどう考えても邪魔。

kindle_wp2

固定はまず二列あるビニールチャックを締めます。

kindle_wp3

次にその口を二回折り曲げ、黒い部分で覆うようにしてプラホックとベルクロで固定。

 kindle_wp4

これが装着状態。本当に専用品か?っていうくらいサイズがブカブカです。そして表示面もヨレヨレなので無駄に光が乱反射してせっかくの電子ペーパーの視認性が損なわれてしまっています。

あと上部のスライド電源スイッチもこういう硬質なビニールの上から爪を立てるように操作を続けるといずれ傷んで穴が空きそうで不安です。

個人的には多少重くて高価になってもいいので、プラスチック製でシャキっと画面が見られるようなのが欲しいです。

■電子ペーパーにお風呂は暗い!

見るからのショボさに心が折れそうになりつつも、お風呂げGo。そして真っ先に気付いたのは、「日本の(少なくとも我が家の)お風呂は電子ペーパーで本を読むには暗すぎるという点です。KindleDXの画面はそれなりに白いとはいえ、やはり絶対コントラストは紙には劣ります(っていうか紙の本も風呂で読んだことないんですけども)。今まではPSPとかAirBoardとか自発光デバイスしか持ち込んだことなかったのであまり気になりませんでしたが、環境光頼りの電子ペーパーにはかなり厳しいレベル。ちなみにウチのお風呂は蛍光電球に不透明のカバーがかかってます。カバーとればだいぶ明るくなるんですがソケットと電球むき出しで使うワケにもいかないですし。あのカバーって汎用品で透明のに交換できたりしないのかなぁ。

で、以前買ったクリップ式のLEDライトをびしょ濡れの体でベッドルームまで取りに戻って取り付けてみたんですが、今度はヨレヨレビニールの折れ目で画面に影が落ちて読みづらいorz。

 

なんかもうこのビニールのよれよれ具合を頑張ってなんとかする位ならPSPで動画見とけばいいや、的な心の折れ方です。

ScanSnapで書籍をスキャンする時、B5以下のものなら横向きでやると若干速く済むのと、歪みも少ないような気がします。ただ、当然ながら表と裏で互い違いに寝た状態になってしまうので、偶数ページと奇数ページそれぞれで90度または270度回転してやる必要がでてきます。今まではこちらに公開したバッチファイルで偶数奇数でフォルダ分けするとこまでして、後は手作業で回転ツールにかけていたんですが、今回hkondo氏と共同で回転まで含めて自動化するバッチファイルを作成してみました。同じようなことで手間をかけてる方の参考になればと公開してみます。

まず回転処理自体はJPEGの無劣化回転が行えるjpegtrran.exeを使います。今回はこちらからダウンロードできるjpeg6b_win32_jp.zipという配布ファイルに含まれているものを利用させていただきました。

で、バッチファイルの中身は以下のようになります。

@echo off
REM 回転に用いるjpegtran.exeのパスをフルパスで指定
SET JPEGTRAN=jpegtran.exe
REM 完成したJPEGが逆さまになる場合は下記の90と270を入れ替える
SET ODD=270
SET EVEN=90
REM 仕分け処理
mkdir rotated
for %%i in (*1.jpg) do %JPEGTRAN% -optimize -rotate %ODD% -copy none %%i rotated\%%i
for %%i in (*2.jpg) do %JPEGTRAN% -optimize -rotate %EVEN% -copy none %%i rotated\%%i
for %%i in (*3.jpg) do %JPEGTRAN% -optimize -rotate %ODD% -copy none %%i rotated\%%i
for %%i in (*4.jpg) do %JPEGTRAN% -optimize -rotate %EVEN% -copy none %%i rotated\%%i
for %%i in (*5.jpg) do %JPEGTRAN% -optimize -rotate %ODD% -copy none %%i rotated\%%i
for %%i in (*6.jpg) do %JPEGTRAN% -optimize -rotate %EVEN% -copy none %%i rotated\%%i
for %%i in (*7.jpg) do %JPEGTRAN% -optimize -rotate %ODD% -copy none %%i rotated\%%i
for %%i in (*8.jpg) do %JPEGTRAN% -optimize -rotate %EVEN% -copy none %%i rotated\%%i
for %%i in (*9.jpg) do %JPEGTRAN% -optimize -rotate %ODD% -copy none %%i rotated\%%i
for %%i in (*0.jpg) do %JPEGTRAN% -optimize -rotate %EVEN% -copy none %%i rotated\%%i
echo 完了

「メモ帳」などにコピペして、rotate.batなど拡張子をbatにして保存して下さい。赤字の部分は場合によって修正が必要になります。jpegtran.exeをc:\tools\に置いた場合は、

SET JPEGTRAN=c:\tools\jpegtran.exe


のようにします。rotate.batと同じフォルダに置く場合は元のままで良いでしょう。

また横向きにする時の方向によって結果がすべて逆さまになってしまう場合には、270と90を入れ替えて下さい。

で、このバッチファイルを取り込んだJPEGファイル(001.jpg、002.jpg…のように連番のファイル名であること)があるフォルダに置きます。スキャン後に自動的に保存されるフォルダに入れておくのが便利かと思います。

で、このrotate.batをダブルクリックすると、処理が実行されます。同じフォルダにrotatedというフォルダが作成されて、そこに向きが直った画像が作成されます。元の画像はそのまま残りますので、rotatedに正しく保存されていれば適宜削除します。逆にダメならrotatedフォルダを消して、rotate.batを修正してやり直します。

以前のエントリでKindleDXのPDF表示時の自動ズームをキャンセルする為に、画面端に薄いグレーの線を入れるというテクニックを紹介したんですが、これを見た方が2chのKindleDXスレで(eTilTranの作者である722氏の)ChainLPで同じことをできるようにしてくれないかと書き込みをされて、722氏が早速それに応じて下さいました。で、厚かましくも35ことσ(^^)もeTIlTranでも同じ機能を搭載してくれないかとお願いしてみたところ、これまた快く応じて下さいました

σ(^^)の方法では事前に画像サイズが一意に決まらなかったため、長めの逆さL字線で上端と右端に1ドットの線を引いてたんですが、eTilTran/ChainLPの場合は保存時に画像サイズがわかっているので、上下左右の4頂点に点を打つだけというより影響の少ない方法になっています。正直、従来の方法だとKindleDXでページめくりをで黒反転する時に一瞬線が見えちゃったりしていたんですが、頂点のみだとほとんど気にならないですね。

JPEG再圧縮の工程も丸っと1つ減るので、時間と手間はもとより画質面でも有利になるはずです。いやはや有り難いことです。感謝して使わせていただきたいと思います。

KindleDXの画面だと、文庫本のScanSnap画像はやや大写しになり、視線移動量が大きくて読みにくさを感じます。Zip/JPEGなら適当なサイズに縮小してDot-by-Dot表示にしてやればいいんですが、ページ指定ジャンプが使えないので使い勝手に問題が出ます。

そこで、文庫本はMeTilTranを駆使してPDA向けに変換して読む方針でレシピを試行錯誤してみました。

その結果がこちらの写真(クリックすると1600x1200の拡大画像)。小説版サマーウォーズのP.54~56付近です。

novel

T-01A(480x800)とiPhone(320x480)に最適化して文字を並べ替えた状態です。文字縮小率は前者が80%、後者が65%。どちらもZip/JPEG形式で前者はMangaMeeyaCE、後者はiComicで表示しています。

やはりT-01Aくらいの解像度があると随分自然ですね。更に小さくしてMeTilTranを使わないでオリジナルレイアウトでもかろうじて読めるんですが、ちょっと目が疲れそうなので断念しました。おそらく電車などの揺れる状況では読めたものではないでしょう。オリジナルの組み版に比べると、2、3文字減ってとこです。

使い勝手ではしおり管理がしっかりしているiComicの方が上ですね。MangaMeeyaだとアプリを起動しなおすと最初からになってしまい、移動コマンドでページ数を指定して適当にジャンプしながら最終既読位置を探すことになります。

ただMeTilTranは作品との相性もあって、この本の場合、誤判定によるレイアウト崩れが結構多い印象。T-01Aの方の1行目の最後の「彼」という文字が画面端にかかって見切れてしまっています。やはり保存用にはオリジナルレイアウトのものをPDFなりで保存しておき、MeTilTranによるPDA用ファイルはあくまで一時使用に限定って感じですかね。

ともあれ完全に片手で読めるのは文庫本のまま読むのに比べても色々アドバンテージがあります。電車読書はもちろん、寝っ転がってお菓子つまみながら読む時とか。

先日、仕事の打ち合わせ用の資料をKindleDXに入れて使ってみました。通常なら、ノートPCの画面でドキュメントとOneNoteなどの記録アプリを開いてスイッチしながら使うところを、ドキュメントをKindleDX側に追い出してやれれば使い勝手が良いのじゃないか、という試みです。ある意味、KindleDXをサブモニタ的に使ってみようということですね。

結論としては1点だけ惜しいところがあるものの、なかなかに快適でした。紙ドキュメントを見るのに充分な解像度があり、そこそこ軽いので、表示とハンドリングは合格。今のノートはtypeZの高解像度液晶版なので紙向けドキュメントを閲覧するにはちと表示が小さすぎますしね。

残念な点は、スリープに入るまでの時間が短すぎる点(設定不可)。紙資料代わりとなると、いつでも見られるように表示は維持しておいて欲しい訳ですが、KindleDXは数分で勝手にスリープし壁紙表示になってしまいます。30分くらいは維持できるよう設定させてくれるか、スリープしても同じ表示を維持するように改良してほしいものです。

あと強いて言えば、ランダムアクセスに弱いので、膨大なページ数でかつあちこち閲覧カ所がジャンプするような書類だと向かないかも知れません。

WispernetをオフにしたKindleDXはホント電池持ちます。最後に充電したのいつだか覚えてませんが、少なくとも先週の水曜から一週間半で、画像PDFの小説を平均400ページx4冊は無充電で読んでます。で、現在バッテリーメーターは半分も減ってません。何段階表示かわかりませんが、パっと見で残2/3ってとこです。

既存ガジェットの液晶とバックライトがいかに大食いだったかっちゅう話ですね。

KindleDXやiPhone3GSを買った時に、動作の様子を動画でアップしたいなと思ったんですが、ハイビジョン撮影ができるHandyCamは実家に貸しっぱなし。手元にはVGAまでしか撮れないPowerShot G10のみ、という状況でした。

で、せめて720pでいいので撮れるカメラがあるといいなぁ、と物色。最初は実売2万円で買えるCybershot W270に目を付けたんですが、詳しく調べてみると動画撮影中のズームができないことが判明。IXYの220ISも同様。やはり撮影中ズームは必須でしょうということで条件に設定。上は数万以上出すとどうせならHandyCamのフラッシュメモリタイプいっちゃえ、ってことになって危険なので、予算3万程度を目標に。

てことで、最終候補に残ったのがCybershot T90、T900、LUMIX TZ7あたり。T90は色が絶望的にイケてなかったのでボツ。TZ7はAVCHD Liteという将来的に汎用性が高そうなフォーマットがツボでしたが、G10との使い分けという視点で、常時携帯できそうなT900をチョイス。この薄さなら普段Type Zを持ち歩いているバッグのポケットに忍ばせておくことも可能です。G10はさすがに普段から持ち歩く気にはなれず、かといって出先でふとカメラが欲しくなった時に、iPhone 3GSしかなくて切なかった、ということが何度もあったので。

T900は光学ズームは控えめなものの、720pのMP4が撮れ、音声もステレオ、もちろん動画中ズームもOKと割と高スペック。静止画はG10があるので正直あんまり気にせずに選びました。

どうでもいいですが、この機種のレッドとブラウン、カメラカバーにグラデーション塗装を採用つってますが、どうみても剥げたようにしか見えないですよね。発売から日が経ってるし、ちょうど展示台が色が薄くなってる部分だけ見えて、あとは重なってるような作りだったので、モックが展示しているうちに剥げたんであって、実物はこんなのじゃないですよね?と店員さんに聞いてしまったり(^^;)。レッドとブラウンを考えてる人は一度店頭でモックや実機を確認することをオススメします。

ってことで“剥げてない”シルバーをチョイス。ヘアライン好きだし。3,4800円にポイント20%で実質3万以下でゲットできました。

t900

メモステは、動画撮るなら速い方がいいだろうと、HGタイプをゲット。Amazonで通常タイプと1,000円差しかなかったので。16GBで7,980円。

タッチパネルタイプのCybershotとしてはDSC-T2に続き2台目。2,3世代を経ているだけあって基本は同じですがなんとなくこなれてきている気がします。今T2が手元にないのでどこがどう違ってるか挙げられないんですが。あっちは内蔵メモリ中心でアルバム管理周りがワケわかんないことになってた分の違いかも知れません。

撮影時のプレビューはノイズ出まくりですが、撮ってみるとちゃんと綺麗に写るので、あまり気にせずシャッターを押してしまう方が良いみたいです。マクロも自動で切り替わるのは便利。最近ずっとG10であれもこれも手動でパラメーター調整しまくって撮る、というクセが身についているので、久々になんでもおまかせってスタイルが逆に新鮮(でもちょっと不安)。まぁ、静止画方面は今回の使途だと出先でちょい撮りできてiPhone3GSより綺麗ならいいや、って感じなのであまり気にしないことにしましょう。

そういう意味ではこの薄さは重宝します。発表時、カタログ写真の巧妙な撮影アングルに「薄っ!」と驚きつつ、実物をみて「騙された…」って感じで萎えていたんですが、あれから時間がたって少し気持ちが寛大になったのかも知れません(笑)。

付属品は電池と充電池以外は未開封のまま。いまんとこクレイドルに載っけたり、HDMIでテレビにつないで再生などの用途は必要性を感じないです。そういうのが必要な人はminiHDMI端子が直接出ているIXYやLUMIXの方が良いかも知れませんね。

あと気になってるのは、愛用のPMBで本機で撮影した動画を認識しないっぽい点。製品付属のバージョンではなく最新版を使っていますがどうもダメっぽい。純正ユーティリティでこのていたらくはどうよ?という印象。製品添付CDから上書きインストールしたら対応しました。使っていた方のが新しいバージョンだったのでバージョン下がらないかドキドキだったんですが、本体のバージョンダウンはせず、必要なプラグインだけ追加されたぽいです。PMBはこの辺りのプラグイン周りが煩雑ですね。結果としては全自動で良かったんですが、もう少しインストーラーが親切に状況を説明してくれても良いと思います。

残念ながらPSPにメモステ差し替えても認識できない模様。>動画

■せっかくなので、KindleDXを撮ってみました

回線帯域に余裕のある人は是非HDモードでご覧下さい。

(字幕を入れる為に、TMPGEnc 4.0 Expressで再エンコードしています)

色々と迷走していますが、ついにKindleDXで綺麗にDot-by-DotでPDFデータを表示する技が完成しました。したような気がします。

要点は、「画面内の部品を認識して無駄な外周マージンを省いて拡大表示してくれやがる」という“親切”機能を無効化したい訳なので、画像の外周に部品を置いてやれ!ってことです。試しにJPEG画像の右上と左下に汚れをつけたものをPDF化してやると、綺麗にDot-by-Dotで表示してくれました。

で、これを一括大量処理するソフトを物色。こちらの「おてがる画像変換」が利用できることがわかりました。元々は透かしやロゴなどを合成するためのものなので、一度に1つの画像しかスタンプできません。そこで、充分なカンバスサイズで、上端と左端に1ピクセルずつグレーの直線を引いた透過PNGを作ってみました。これをeTilTranで傾きとガンマ補正した中間画像にスタンプしてやることで、PDF化した時に綺麗にDot-by-Dot表示されることを確認。

2009.09.01追記:eTilTran V0.12β-5に上記と同等の処理をするオプションが組み込まれました。ツール->オプションで「Kindle対応」を「あり」に設定すればOKです。

というわけで、現時点の我が家での小説自炊レシピをまとめてみます(KODANSHA BOXの例です。文庫本などでは設定値に微調整をすることになると思います)。

■KindleDXでもPCでも綺麗に見られて、検索もできるPDFの自炊レシピ

・本を裁断し、ScanSnapで取り込む

画質は「スーパーファイン」で最低圧縮率に設定。今回取り上げた本では、1463x2155前後になりました(自動サイズ調整にしてあるので、ページ毎に若干サイズが変わる)。

・eTilTranで傾きとガンマ補正

「ヒストグラム」で灰レベルを標準の127から180~200程度に上げてやると、Kindle上で見やすくなります。イラストページとテキストページがわかれている作品なら、イラストページを除外設定(種別を「漫画」などに)してからかければ、イラストが黒くつぶれてしまうのを防げます。この辺り、eTilTranは本当に気が利いてますね。

・eTilTranからリサイズ出力

KindleDX専用ファイルなら784x1142。PCでも綺麗に見たければ1568x2284を指定します。JPEG圧縮率が一定なら、後者は前者の倍程度のサイズになります。で、JPEGで書き出します。

・おてがる画像変換で隠し逆L字線を書き込む

これをしないとせっかくサイズを計算して出力しても、Kindle上では自由気ままに拡大表示されてガタガタになってしまいます。また、eTilTranよりも先にこの処理をすると、eTilTranでの傾き補正で線が消えてしまう場合があるので、この工程を後にしています。

おてがる画像変換は設定を保存しておけばドラッグ&ドロップで一括処理できるようです。

・JTBなどでJPEGデータ最適化

JTB(jpegtran)のようなJPEG最適化ツールでExifやサムネイルなどの無駄なデータを除去したりグレイスケール化するなどの最適化をすると、画像劣化無しで数%ほどファイルサイズを落とせます。

・PDF作成とOCR

なんらかのPDFツールでJPEG画像群をPDFにします。Acrobat 9なら「ファイル->結合->ファイルを単一のPDFに結合...」で行えます。ちなみにプロパティ->概要で「作成者」欄に著者名を入れておくと、Kindle上でタイトル(ファイル名)に並んで表示されます。

ツールを持ってない場合は再度eTilTranを使っても良いと思いますが、傾き補正は無効にしておく必要があります。

σ(^^)の場合は、e.TypistでOCR処理した後に透明テキスト付きPDFとして書き出します。

 

■作成

別の本ですが、上記手順で作成したものの例です。写真じゃわかりにくいですが、前エントリのものより更に綺麗になったと思います。

Real-DbD Real_DbD_pic

前のエントリでPDFでもDot-by-Dot表示するための解像度を突き止めたんですが、これだけでは不十分でした。KindleのPDFビューワーがお節介にも外周の余白を落として拡大表示してくれるせいで、ページ毎に微妙にズーミングされてしまい、いくら元データを揃えても意味がないんです。また、PCで読むのには784x1142ではやや粗いので、1ファイル・マルチディスプレイ的な使い方にはイマイチです。

で、その後も色々試行錯誤して、DbDの整数倍である、1568x2284という解像度で作るとなかなか良好な結果になりました。スキャンした解像度とあまり変わらないので、そのまま入れた方が綺麗なんじゃないか?という説もありましたが、実際に比べた結果、1568x2284の方が綺麗でした。どのみち傾き補正はするので一度はリサイズが発生しますしね。流石にファイルサイズは784x1142の時に比べて、2倍ほどになりましたが、それでも450ページの小説で300MBほど。動画コレクションに比べたら誤差のレベルです。KindleDX上での操作レスポンスも気になるほどの違いは感じられません。

以下はKindleDXに表示した状態でスクリーンキャプチャを撮ったものです。トリミングしてJPEG圧縮。

 

DbD濃

784x1142のリサイズした画像を取り込んでPDFにしたもの。ガンマ補正で全体を濃くすることによってフォントを太らせています。こうしないとKindle上では薄くて読みづらいからです。

3行目の「つ」や「け」など各所にリサイズによる崩れが発生。

全体のファイルサイズは139MB。


2倍DbD濃

2倍DbD(1568x2284)で食わせた例。ガンマ補正有り。

気になるほどの崩れはありません。

ファイルサイズは328MB。

2倍DbD

2倍DbD(1568x2284)で食わせた例。ガンマ補正無し。

こうしてみるとこっちの方が見やすいんですが、KindleDX上ではカスレ気味に見えて目が疲れます。KindleDXで濃度調整機能があればいいんですが…

ファイルサイズは319MB。
以下は後ろの2つをKindleDXで表示した様子(クリックで拡大)。

kindle_dbd_1 kindle_dbd_2

うーん、この写真だと右(ガンマ調整無し)でも読めそうに見えるかな?まぁ、読めないことはないんですけどね。ひらがなのはらいの部分みたいに細いところが消えかかってる感じ。あと全体にグレー字になって見えるので、環境によってはツラいんです。

Kindleの難点はバックライトがないので暗所では読めないというところです。まぁ、普通は部屋の照明をつけてればいいんですが、プロジェクターでゲーム等をしながら使いたい(攻略サイトを参照するなど)場合があるので電気スタンドでは明るすぎて、、→のクリップ型のライトを買って見ました。

この製品は元々は譜面台用とされていますが、Amazon.comのKindle StoreでKindle Accessoriesのところに載っています。わざわざ「Kindle Version」となってますが、どうもロゴが印刷されてるだけっぽい。どう見ても同じものですよね。てことで事実上の純正オプションなんだろうということでチョイス。

グースネックの部分は結構細くてグニャグニャ柔らかいですが、ヘッド自体がそう重い訳ではないので、多少揺れた位では勝手に変形したりはしなさそうです。

ただ、クリップ部分が大きくて、KindleDXのフレームに止めるには端っこギリギリしかありません。公式サイトだと平気で画面にかかるように止めてたりしますが、繊細な日本人には無理ですねw。ここでもかろうじて止められはいます。激しく動かさない限り一応止まっている、というカンジ。純正指定とはいて、所詮出来合というところですかね。ちなみに電池ボックスはクリップの裏側にあり、単4x3本。スイッチはヘッド部分にあります。重さはカタログスペックで109gありますが、これをつけるとメチャメチャ重くなるという印象はないです。まぁ、あまり長時間試した訳ではないですが。

mighty1 mighty2

2枚目の写真は部屋を暗くした状態で撮ってみたもの。色は一般的な白色LEDの色。もう少し色温度が低くい方が見やすいかも。明るさは充分かな。逆にもう少し照射範囲が狭い方が、プロジェクター画面に光があたらないという意味では理想。ただヘッドを画面に近づけてしまうと光源が映り込んで見辛くなってしまうんですよね。

Kindle専用設計ではない分の微妙さはありますが、まぁこの値段で買えるなら良しとしましょう。

KindleDXでPDFを表示すると、画面上下にメタデータを表示する領域が強制的に入る為、824x1200で作った画像PDFでは綺麗に表示されません。特に文字主体のデータでは潰れが酷くかなり読みづらくなります。

そこで、上下の領域を差し引いたピクセル数をスクリーンショットを使って計測しました。その結果。784x1142という数値が導き出されました。横は差し引かれないので、実際には824x1142でもいいかも知れませんが、824x1200の元データがアスペクトを維持して縮小された時の実測値が784x1142という訳です。本当にDbDかどうか確認する術はありませんが、一応Photoshopで作ったグリッド画像を表示してみた感じでは綺麗に表示できてるっぽいです。。

実際、eTilTranからこのサイズで出力したものをPDF化したところ、かなり良好に表示できました。新書サイズの小説をこのサイズにしたところ、PCで見るには若干解像度不足かなという気はしますが、当面はKindle優先で。解像度的には損してる感がしますが、やはり小説の場合、文字が綺麗に見えてナンボなので、Dot-by-Dotは重要です。

後継機に買い換えるどころか、今後PDFの全画面表示に対応するなどファームウェア更新ですら状況が変わってしまう可能性がある刹那的な設定ですが、まぁ当面はこれで頑張ってみます。

■MeTilTran

eTilTranの姉妹ソフトである、MeTilTranも試してみました。このソフトは、画像中の文字を文字単位で認識し、指定した解像度に最適な行数、列数で並べ替えをしてくれるというシロモノです。よくまぁ、思い付いたなと感心しきりです。

例えば、iPhoneに縦40文字とか入れたら小さくて読めないですが、縦20文字くらいにして行数とページ数を増やす方向で再配置すると、文字サイズを保って読みやすい画像ができがる訳です。

やってみると精度も実用レベル。これはかなり使えます。KindleDX位の解像度なら再配置しなくてもいけますが、PDA用に変換する場合などは重宝しそうです。

残念なのは現在縦書きにしか対応していない点。横書きも扱えると翻訳モノのビジネス書なんかにも使えて良さげなんですけどね。

以前のエントリで、非マンガ書籍をKindle用PDFについて試行錯誤していた訳ですが、その際ネックになったOCRを、別途専用ソフトでやったらよくね?ってことで、何年かぶりにOCRソフトに手を出してみました。というか単体パッケージを買うのは初めてかも。元々OCRとかディクテーションとか翻訳といった自然言語系のソフト技術は学生の頃に絶望していらいあんま信用しておらず、その後あまり注目したこともありませんでした。でも、先日ScanSnap Organizerの認識率はまずまずだったし、PDFの検索用に透明テキストを作る位なら一字一句正確でなくてもまぁ諦められるかなと。

で、ScanSnap Organizerの認識エンジンを調べると、ABBYY FineReader for ScanSnap™ 4.0となっています。海外製のソフトをOEMで買って来て使っているもよう。おそらくScanSnap以外で取り込んだPDFを認識しないのは、ライセンス上の制限なんでしょう。なら、その製品のフルパッケージを買えばよくね?と思った訳ですが、体験版の申し込みをした後、さっぱりメールが来ない。まぁ、迷惑メールフォルダをあされば出てくる可能性大ですが、とりあえず放置。日本語は辞書を利用した認識はしてくれないみたいですし。

で、次に同社のエンジンを(英文に)利用しているらしいPanasonicの「読取革命」に注目。しかし体験版のインストーラーすら起動せず。64bit非対応でしたorz。

調べてみると64bit完全対応を謳う製品はなく、「動作未保証」になっているのが「e.Typist」と「読んでココ」辺り。このあたりは1万円台後半で、ドキュメント管理やOffice文書(への)変換など統合ソフト的になってきていて、ぶっちゃけ画像PDFに透明テキストが載っけられれば良いσ(^^)にはやや無駄も多かったんですが、老舗なりの精度を期待したのと、「e.Typist」のオーバーレイ表示が認識精度のチェックに良さげだと思ったので決めました。

64bitで動くか不安だったので体験版を探すも見つからず諦めて店頭へ。で、パッケージをみるとやっぱり「体験版は公式サイトにあるから、動作確認はそっちでよろしく」と書いてある。仕方なく店頭では買わず、無駄に駐車場代を払って帰宅。で、公式サイトで体験版一覧のページを見つけて開いてみると「現在配布配布している体験版はありません」ときやがる!なめとんのかゴルァですよ。結局Vectorで買いました。

■やっとレビュー

認識率は変に凝ったフォントでない限り問題なさげです。認識速度も爆速。ただ、画像PDFの読み込みが若干もっさりします。

本製品はScanSnap連携機能もあり、直接ScanSnapのボタンでスキャンした結果を取り込むことができます。が、しかしこれを使うと結局前のエントリで問題になった点をすべて引きずることが判明。さらにTIFF形式で渡してるみたいなんですが、これもやっぱり読み込みがもっさり。結局この機能はさっくり殺しました。

結局JPEGで喰わせるのが一番速いようで、JPEGで取り込み、eTilTranで傾きとガンマ補正して再度JPEG保存。それをe.Typistに読み込むという手順がいいみたいです。KindleDXに最適化したピクセル数だとPC上で読むのにやや粗いので、リサイズはしない方向で。前回のものに比べサイズが3倍以上(178ページで30MB->110MB)になりましたが、動画などに比べたら屁でもないのでクオリティ優先で。できあがったPDFはPCで見ても綺麗で検索もでき、KindleDXでもそれなりに読めるので、満足しています。

ユーサビリティとしては、全体にやや煩雑です。フォルダで喰わせられず、百単位の画像ファイルを全選択して渡す必要があったり(フォルダ指定はできました)、レイアウト調整、認識もデフォルトでは選択しているファイルしかしてくれなかったり。色々マクロ的な機能を使いこなせば一発変換もできるみたいですが、なんかそこまでするのもまためんどくさそうな微妙な作りです。あと開いてるファイルの閉じ方も不明。別の書籍データを取り込もうとすると、同名ファイルが既にあると怒られる。よくわからないので毎回一旦アプリを終了してます。保存メニューから透明テキスト付きPDFを保存できるかどうかもよくわからなくて、いつも「ワンタッチ転送」機能でAcrobatに渡してそっちで保存しています。Acrobat持ってない人はどうなんだろう?とか。

そういう応用力と試行錯誤する根気がある人には精度と速度的には充分オススメでしますが、例えば実家の父親にホイっと渡して使える気はあんまりしない、という感じ。逆に業務で定型文書を扱う時なんかには、テンプレート設定機能を使って最適化してやれば、父親の会社の事務員さんなんかには使ってもらえるかなという気もします。その辺りの機能はまた機会があれば試してみたいと思います。プログラミング系のリファレンス本なんかにはいいかも。>テンプレ

色々試行錯誤をして、KindleDXで快適に閲覧できるZIP入りJPGアーカイブができるようになってきました。

最近やっていることは、

個別にどの程度効くかは未検証ですが、KindleDX購入以前からあったアーカイブに比べ、明らかにページめくりのレスポンスが良くなっています。表紙などカラーページやはり若干もたつく印象ですけどね(著作権的に問題のない作品でもあれば動画でも載せたいところなんですが)。

ZIP圧縮率0だとファイルが大きくなるんじゃ?と思われるかも知れませんが、もともとJPEGフォーマットの段階でほぼ限界まで圧縮されているので、更にZIPで圧縮してもたいして縮まらず、展開負荷が無駄になります。ちなみにウチでは7-Zipを使って圧縮しています。

あと、おそらくバグですが、MENUでは全画面モードのはずなのに、実際にはタイトルバーが出ている、という状態になることがあります。仕方ないので、こないだ発見したキーボードショートカットの[F]を2度押しして再度全画面表示にしてやる必要があります。

あとの不満はジャンプができないって位ですね。後半1/3位から読みたい、なんてのができないので。まぁ、最後に読んだページは覚えててくれるので大抵はそれでなんとかなるんですが。

将来的に小説なども電子化することを視野に、来週参加予定の読書会で使う書籍を電子化試行してみたんですが、なかなか一筋縄ではいきませんでした。

ScanSnap Organizerで直接PDFにする方法と、マンガ同様に一旦JPEGでスキャンしてeTilTranにかけてからPDF出力する方法があるのですが、一長一短なんです。

■ScanSnap OrganizerによるPDF化

  • OCRの処理速度と精度が良い
  • 画質がイマイチ

解像度自体はスーパーファインで問題ないんですが、「グレースケール」で取り込むと濃度がやや薄めでKindle上ではかなり読みづらくなります。で何故か手動の濃度調整は「自動」か「白黒」の時にしか使えない。「白黒」は図版が潰れるので論外として、「自動」では図版のあるページとないページで濃度セッティングが変わってしまい、ページによって文字の濃さ(太さ)がまちまちになってしまうという問題発生。「グレースケール」で手動濃度調整できれば試したなかでもっともバランスの良い自炊結果が得られそうなんですが残念無念。

■JPEG –> eTilTranでPDF化

  • 画質は良い(少なくともセッテイングを追い込める余地がある)
  • 角度補正も効く
  • AcrobatのOCRがイマイチ

この手順で作ったPDFをScanSnap Organizerに食わせてOCR処理させると「ScanSnapで作成したものじゃない」と怒られます。ケチ~。しかたないのでAcrobat9内蔵のOCRにかけてみたんですが、処理が1.5~2倍程度かかる上に、精度が低い。ScanSnap Organizerで拾えていた単語がこちらでは拾えないということが多々あります。

 

現状の結論として、

  • ScanSnap Organizerのグレースケールモードで手動濃度調節ができるようになるのが理想
  • Acrobat内蔵以外で良いPDF用OCRツールを物色するとよいかも

という感じ。

■KindleDX側の制約

もっとも、KindleDX側のPDFリーダーもあまりイケてる訳ではなく、そもそもせっかくOCRによる透明テキストを埋め込んでも、日本語検索(入力)に対応していないので意味なしです。まぁ、透明テキストはPC上での閲覧用にあるといいなということでこだわってみてます。

また、PDF内のしおりもKindleでは扱えません。ページ番号指定によるジャンプのみです。Kindle上のみの独自のBookmark機能はあって、1冊のデータに何カ所でも打てますが、名前をつけ変えたりはできません(一覧画面ではページ番号で表示)。

更にページ内の部品を認識して勝手に外周のマージンを削るように拡大表示してくれます。解像度の制約が大きいこの手のデバイスとしてはなるべく有効コンテンツ部分の解像度を高くして見せようという努力は評価できますが、結果としてページ毎に文字サイズがバラバラになるばかりか無駄にリサイズすることで文字が潰れたりギザったりしてくれやがります。ZIP/JPEGならできるDot-by-Dot表示もなぜか不可。

「なら、いっそZIP/JPEGでよくね?」って話になりますよね?ところがこっちも問題があるんです。ページ指定ジャンプができない。マンガや小説を頭から順に読んでく位ならあまり必要ないんですが、ランダムアクセスするような書籍だとさすがに1ページずつめくってられないです。「Go to Location…」というメニューはあるんですが、ページ番号入れてもファイル番号入れても何も起きない。マニュアルみても「特定のロケーションにジャンプできます」って書いてあるだけ…。そもそもZIP/JPEGがネイティブ対応してることはマニュアルには書かれていないので、あまり期待はできないかも。先頭ジャンプも効かないし、スリープ復帰後に最後に見ていたページはまとも表示されないし(めくると次ページからはちゃんと見える)、色々とバギーです。

 

ままならないものです…

閲覧中、たまたまキーボードに触れてしまったりして、いくつかショートカットとして機能するキーがあることに気付きました。

User's Guideにも載っておらず、ググっても出てくるのは前モデルのものが多く、ほとんどはDXでは使えないようです。

以下、とりあえず手元で確認できたもの。他にも画面更新など反応はあるものの、何が起きているのかわからないもの多数。どこかにまとめられてないかなぁ。

どこでも、

Alt + G: 画面再表示(前ページのゴーストが残っている場合などに)

Alt + ↑ + G: スクリーンショット撮影(documentsフォルダ下にGIFで保存される)

Home画面で、

ALT + Shift + M: マインスイーパ―起動 (イラネーw)

MENU: タイトルバーに時計を表示(Whispernet切ってるせいか時刻はズレまくり)

PDF閲覧中に

Alt + B: ブックマーク ON/OFF

ZIP/JPG閲覧中に、

F: Full Screenモード ON/OFF

R: Rotate(2方向のみ?)

C: Actual Size を trueに(=Dot-by-Dot表示)

Q: 拡大

W: 縮小

(拡大・縮小はAa –> Actual Sizeがnoにしてある時のみ)

 

 

 

というか、いじってるウチに画面下部に定規みたいな目盛りと数字が出てきたんですが、これが消せないorz。(再起動したら一応消えた)。

届いて数日で某所に貸してしまっていたので、その後あんまり触れていなかったKindleDXですが、今日無事返ってきました。

■傾き補正の半自動化

ScanSnap S1500でスキャン作業が効率化したといっても、若干気になるのが微妙な傾き。単ページ表示なら気になるほどではないんですが、MangaMeeya等で見開きにすると、コマ割線がVの字やハの字になるので結構目に付いてしまいます。今までにも手作業で修正をするツールは試してみたんですが面倒で挫折。最近は諦めてました。

が、最近になってeTilTranというツールを発見。画像を解析して自動で傾き補正値をしてくれ、1枚1枚グラフィカルに確認しつつ手動調整もできるという優れものです。自動補正の精度もなかなかのもので、劇的に効率があがりました。

ただ、コマ割線がほとんど無く唯一のものが斜めになっているようなレイアウトだとさすがに誤認識します。ScanSnap S1500の場合、1度を超えるような修正が必要になることはほとんどないので、それ以上の修正をしようとしてるページだけ目視でチェック、修正してやればいい感じです。一括保存時にリサイズ指定もできるので更に便利です。またカラーページとグレーページを自動判別し、それぞれ別のガンマ補正をかけたりと自炊のためのツボをよくおさえたツールです。

現状、“薄い御本”(©貴島煉瓦)1冊が裁断からZIP圧縮までで概ね6分で処理できています。

■書庫内ファイル名の2バイト文字問題

早速色々作り貯めておいたZIP/JPEGファイルを放り込んでみたんですが、なぜか表示されないまま固まる(Homeボタンで戻れるので本当にフリーズしているのではない)。色々条件を変えて検証した結果、

ZIP書庫内のフォルダ名に2バイト文字があるとダメ

ということが判明。試してないですが、おそらくJPEGファイル自体のファイル名も同様でしょう。

ここ最近は書名のフォルダに入れた形でZIP圧縮していたので全部ヒットorz。全部圧縮し直しです。

unzip –> cd –> zip * みたいな感じで簡単にバッチが組めそうな気もしたんですが、そもそもたくさんあるzipの中からフォルダ入りで圧縮してあるものを判別するのも大変なので、結局VBで簡単なアプリを作ってしまいました。zipファイルをドラッグ&ドロップすると、指定ファイルに解凍し、フォルダ入りだったらその階層をスキップして再圧縮。フォルダがないものはスルー。またフォルダが複数あったり多階層のものはとりあえずスルー(対応めんどいから)。これで、自炊書庫内のファイルをまとめてドロップすれば、必要なものだけ再圧縮されます。やれやれ。

(超ニッチだと思うのでとりあえず公開はしません。希望があればお知らせ下さい。)

■携帯用ケーブル

前エントリで上げたmicroUSB-miniB変換ケーブルを買いにビックカメラに行ったら、こちらのコネクタタイプのものを見つけました。手持ちのmini-B超ショートケーブルUSB-MBM5と組み合わせて、PCでマウントできたのを確認。

もともとmini-Bケーブルは汎用性が高く常時携帯していることを考えると、プラスワンとしてはかなり有効な選択肢だと思います。

kindle_cable

■Unicodeハック + 壁紙変更ハック

また海外の有志により二種類のハックが公開されています。どちらも公式アップデータを装う形式で、Kindleにコピーして、本体のメニューからアップデートを実行するだけで簡単に導入できました。同じ形式でアンインストール用のファイルも同梱されており、元に戻すこともできるようです(未テスト)。国外に持ち出した時点でサポートは期待していないので、思い切って導入してみました。

Unicodeハック

内蔵フォントを日本語を含むものに置き換えるハックです。PDFにフォント埋め込みしなくてもよくなり、日本語のテキストファイル(UTF-8限定?)も読めるようになるとのことですが、そこら辺は未テスト。ただHome画面で日本語ファイル名が表示できるようになったのが何よりのメリットです。

日中韓フォントを含むdroidと含まないliberationの二種類のパッチが公開されています。droidだと英字フォントがセリフ無しになってしまうようです。実際書籍の表示は導入前の方が好みでした。まぁ、英語コンテンツはこの後あまり増えない(買えない)ので、妥協します。

ScreenSaverハック

開発したのが別のサイトのようですが、手順説明がわかりやすいのでこちらをリンクしておきます。先にこちらで操作手順をつかんでから、上記Unicodeハックを導入すると簡単かも知れません。

Kindleは電源をオフした時に、ランダムで著名な文豪の顔写真や鳥などのイラストが表示されます(表示維持に電力を必要としないe-Inkなので、次に電源入れるまでずっと表示したまんまです)。最初は有名な作家の顔が見られて面白いんですが、慣れるとぶっちゃけ、オッサン&オバハンの写真じゃなぁ、という気がしてきます。

このハックを導入すると、指定フォルダに置いた画像ファイルがランダムで使われるようになります。痛Kindleの完成ですw。

ただ、フルカラーCGを単純に放り込むだけだと16階調グレースケール化された時に綺麗に表示されないケースがありました。それなりに明るさ、コントラスト、ガンマ値などを自分でいじらないと、こだわり派の人は満足できないかも知れません。

待ちに待ったKindleDXが届きました。

■ZIP/JPGアーカイブのハンドリング

これまでのあらすじ。

ZIP圧縮したJPEG(以下ZIP/JPG)アーカイブが使えると聞いて自炊マンガ用に発注

オンラインマニュアルによるとKindleサーバーによる変換が必要と聞いてガックリ

試したら普通にUSB直置きでも行けた(←今ここ)

 

てことで、以前スキャンしたZIP/JPGなファイルをUSB経由でコピーしたらあっさり開けました。ただ、コピー時間からしてもフラッシュメモリの書き換えが遅いらしく、表紙などのカラーページは重い、というか上から何段かに分かれて徐々に表示される感じになります。グレースケールのページはPDFと遜色ない印象(というかカラーのPDFはまだ試してない)。連続でパカパカめくるとつらいですが、読んでる間に先読みキャッシュしているっぽくて、それができてる状態なら割とサクっと切り替わります。逆にページ指定で一気に跳んだりする時はやけに時間がかかる場面があります。

まぁ、パラパラ~っとめくるには遅いですが、普通にマンガとして読むなら実用レベルだと思います。小説などテキスト中心のドキュメントなら楽勝でしょう。

■ハード面

プロダクトとしてはかなり綺麗なデバイスですね。惚れ惚れします。キーボードは数字列があると良かったかな。ページ指定ジャンプで数字は結構使いそうですが、今はQWERTY列+ALTしないとならず面倒。

今んとこ、とりあえずマンガ用(通しで順に見てくだけ)には概ね満足です。ランドスケープで見開き表示にならないのは惜しいですが。画質は自炊する時に最適な濃度やガンマ値を試行錯誤すればかなり綺麗に出る予感(実際スクリーンセーバー の写真とか綺麗ですし)。

ファイル名が化けるのはUnicodeハックで解決するのかなぁ。さすがに初日からつっこむ気になれない(^^;)。

USBポートはminiB(PSPなので使うアレ)かと思ったら違った。あれならどこにでもケーブル転がってるから便利だったのに。多分PlantronicsのBTヘッド セットと同じ。micro-USBという規格みたいですね。WILLCOM-03用のコレ→が使えるかも知れないので、現在手配中。電池自体はワイヤレスをオフにしてやれば二週間もつとのことですが、出先でふとPDFファイルを入れてみたくなる場合があるだろうということで、VAIOと一緒に持ち歩いておこうと。そういう意味では、初期モデルにあったSDカードスロットが廃止されたのは惜しいですね。microSDでもいいからついてたら便利だろうと思います。

■ソフト面

とりあえず付属USBでのマウントはドライバ無しで普通にマスストレージで認識(Vista)。documentsフォルダの下にPDFもZIP/JPGも置けばいいんですが、フォルダ階層掘ってもKindle上ではフラットに表示されるので、たくさんつっこむ時は不便。しかも一覧画面上で最近読んだのが上にくるので、毎回並びがかわって探しづらい。 設定でファイル名順に固定できました。

あと、オートローテートがウザイのはiPhoneと全く同じ。なんでオフにできねぇんだと小一時間問いたいこれも設定できました。横画面では、PDFの場合は1ページが横幅一杯で縦が欠け、NEXT PAGEボタンで半分ずつ表示される感じ。ZIP/JPGの場合は縦合わせでちんまり表示です。どちらもほとんど実用性はないので、オートでローテートされてもイラっとくる場面の方が多いです。ただページ送りボタンは片側にしかないので、手が疲れて左手に持ち替える時はクルっと180°ひっくり返すだけで切り替わるのは便利です。ランドスケープモードだけDisableできれば理想的。

またパスワード認証とかはないので、業務関連のファイルを入れて紛失したりするとヤバいです(パスワード付きPDFもダメでした)。

Kindke DXを注文しました。来週一時帰国予定がある在米の知人宅宛に送って、持ってきてもらいます(後述のようにAmazonアカウントと紐付けて出荷されるようなので、一応自分のアカウントで購入する方が良さげです)。

実は発表直後にも予約はしたんですが、その後、さらに解像度が高く、タブレットも積んでいるiRexのDR1000Sという機種があることを知り、どうせ買うならそっちのがいいかなぁと思ってキャンセルしちゃってました。DR1000Sの方が高いのでユーロ為替と通帳残高動向を見守りつつ悩んでたんですが、アメリカでKindle DXが発売されZIP圧縮のJPEGも開けるなど色々とヨサゲな気がしてきて結局再注文。最短で今月25日には手元に届きそうです。

もちろん3G回線を通じての配信機能は日本では使えないので、USB経由で自炊PDF(日本語フォントの埋め込みが必要)やZIP圧縮JPEGを閲覧する用途限定になります。電波系はおそらくフライトモードみたいな設定があるだろうからそれでぬっ殺しておくつもり。

■米Amazonの書籍購入エクスペリエンスがスゲー!

別にDXから始まったことではないので、既存ユーザには「何を今更」って感じでしょうけど、まぁ日本ではあまり見たことある人もいないでしょうから紹介しておきます。

せっかくだから、知人宅にKindke DXが届いたら開封してもらって電子書籍をダウンロード購入しておいてもらおうと思い、タイトル選びにAmazon.comのKindleストアにいってみたんですよ。そしたらこんな画面になってました。

Kindle Store

Kindle Store2 

通常ならば、「配送先」として登録した宛先を選ぶプルダウンメニューが出るところに、「Send wirelessly to:」として「KAZUYOSHI's Kindle」という項目が出てるじゃないですか!これはこのアカウントで既にKindleを購入(注文)したせいだと思うんですが、多分あとはもう「Buy now with 1-Click」ボタンを押せば、あとは勝手に3G回線経由でKindleに買った本が届くということなんでしょうね(もちろんアメリカにいる場合限定)。これはかなり素敵なユーザエクスペリエンスですよね。iTunes Storeで音楽買ってケーブルでiPodにコピーするのよりも簡単です(もちろんKidle上で購入も可能)。更に新聞系だと毎朝自動的に届いているってことですよね。

発売から2年も経ってからなんですが、「いやこれはスゲーな!」と。品揃えも価格もなかなか魅力的で、久しぶりに在米の人がうらやましくなりました。Wi-Fiも搭載して国外からでも購入できるようにしてほしかったなぁ。てかローミングとかSIM差し替えとかでなんとか日本から使えないもんですかねぇ(^^;)。

 

てことで、ブツが届き次第またレビューします。

アーカイブ

ウェブページ



Powered by Movable Type 4.25