MeTilTranで行認識誤爆を防ぐ為の覚え書き

SDIM0943小説などをスキャンした画像から文字を認識してより低解像度のビットマップ上に再配置してくれる神ツールMeTilTranですが、たまにルビ付きの行を誤認識して、写真のように真ん中で真っ二つにぶった切ってしまうことがあります(5行目。クリックで拡大)。今回SONY Reader用に久しぶりに使い出して気になったので研究してみました。

実際に当該ページの認識状態をMeTilTranで見てみると、このように、1行+ルビが2行として誤認識されてしまっています。手動で分割したりルビ分離したりすれば直せますが、全ページこれが発生してないかチェックする訳にもいきません。

で、設定画面にそれらしいパラメーターがないか探したところ、「分布_行間隣接しきい値」がぁゃιぃ。初期値0.35だったところを0.4にしてみたらかなり改善。でもちょい取りこぼし。なんでとりあえず0.5にしてみました。今のところ副作用はないようです。

2010.12.16追記:

0.5でもまだ誤爆発生。もういっそ思い切って1.0にして副作用が出ないか検証することに。

before settings after
設定修正前 設定項目 設定修正後

 

MeTilTranのほぼ唯一気になっていたところなので、これが改善されればかなり快適なSONY Readerライフが送れそうです。

(強いて言えば、後は禁則処理がおかしくて、行頭に「、」が来たりする点が気になりますが、中身が読めない訳でもなし。これもどっかパラメーターをいじれば改善するんですかねぇ。)

買いましたともっ!SONY Reader PRS-350

ようやく国内投入されたSONYの電子書籍リーダー「Reader」。まぁ、色々と不満はあって悩んだんですけどね。結局買っちゃいました。KindleDXもあるので使い分けの観点から5インチモデル(小さい方)のPRS-250をチョイス。今回のラインナップの中では黒が良かったんですが5インチには紺しかなかったので、ならばとシルバーにしてみました。もともと白いコンテンツを見るんだから額縁部分も近い色の方がウザくなくていいですし。

SDIM0938

シルバーはMacBookAirとほぼ同じ色味で並べるとオソロ感が半端ないです。

ハードウェアとしての特徴は、

  • 600×800の電子ペーパーデバイス
  • 無線LAN、3Gといった通信デバイスは非搭載
  • 光学式のタッチパネル(画面上にかぶせる方式ではないのでコントラストが低下しない)

といった感じ。6インチモデルは加えてSD/MSスロットがついてたり、音楽再生機能があったりします。

残念ながら自炊派御用達のZIP/JPGには非対応(JPG直接はOK)ですが、PDFには対応しています。またDRMがかかってない限り、ePubやXMDFといった規格にも対応。面白いことに、仕様には載っていないもののSONYが以前出していたリブリエで採用していたBBeB(拡張子LRF)も非公式ながら読めてしまいます。

ZIP/JPGが読めないということで脊髄反射的に「イラネ!」と思って予約もしてなかったんですが、どのみちこのサイズでコミックを読めたとしてもKindleDXやiPad、iPhone4のかわりに使うとは考えられない。むしろPDFで作ることが多い小説、特に文庫本用としてはアリなんじゃないかという気持ちが実機を触っててムクムクとw。文庫は自炊してもKindleDXだと大きすぎて読みづらいんですよね。

てことで、ちょうどエコポイントのギフト券が2万円分届いたので、ぴったり買えるじゃないかと!

■ハード周り

SDIM0940

キーボードがない分、Kindle3よりもコンパクトでガジェット魂を揺さぶるデザインです。

ページめくりキーは左下のみで右手で持った時はやや押しづらいですが、一応画面のスワイプでもめくることはできます(シングルタッチでめくることはできない)。

電子ペーパーのレスポンスは上々。KindleDXで慣れてるので全く気になりません。コントラストはもうちょっとあると理想ですが、まぁ実用範囲かと。

充電&シンク用ポートはmicroUSB。流行がmini Bからシフトしつつありますね。KindleDXはもちろん、先日買ったWiMAXルーターWM3500RもmicroUSBなので、ケーブルや充電器の使い回し可能範囲は随分広くなりました。

残念なのはコンテンツの転送に専用ソフトが必要な点。PDFやJPGといったオープンなファイルを転送するにもいちいち専用ソフトを使う必要があります(Readerを接続すると自動で起動するように設定可能)。で、USBケーブルを抜くと本体側でデータベース更新でしばらく待たせるあたりWALKMANと同じ作りです。WALKMANは去年くらいのモデルからExplorerから直接ドラッグ&ドロップに対応して一定の評価を受けてるというのに、また同じことを繰り返すんですか?と(SD/MSが使える6インチモデルだとどうなんでしょうね?)。

本体上ではフォルダ分けはありませんが、「コレクション」というプレイリスト的な機能があるので、コンテンツが増えてもあまり困ることはなさそうです。

■ストアの品揃えは発展途上

(これもヒドい話ですが)発売と同時にオープンしたSONYの書籍ストアはガッカリ感が高いものでした。「小説」にも色々ありジャンル一覧という表も見られるんですが、驚くべきことにコンテンツは「小説」という括りでしか一覧できません。「SF」だけを表示とかできず、興味ないジャンルのものも一緒くたに延々とリストされ、物色する気が萎えます。

また「コンピューター」など現時点で17冊しかない上に、PalmとかZERO3とか「今更誰が買うの?」的な実質あまり意味がない本が一定量を占めていたりして、2万冊を謳っていますが実際は無意味な嵩上げをされてる印象。イチオシが「スティーブ・ジョブス 脅威のプレゼン」とかもう笑うしかないですね(^^;)。

■自炊にはMeTilTran必須

ビットマップベースの自炊書籍を閲覧する場合、600×800という解像度はやや心許ないです。そんな時に重宝するのがMeTilTranです。以前にも紹介したかもですが、テキスト文書をスキャンした画像からひと文字ひと文字を切り出して(OCRするわけではない)、指定の解像度に再配置してくれる神ツールです。例えば、上の写真は元々縦二段組みでレイアウトされていたB6サイズの小説ですが、見事に1段組に組み替えられて、600×800でも充分に読めるレイアウトになっています。ルビがついてる行でたまに誤爆しますがまぁ許容範囲。これがなければそもそもReaderを買ってなかったでしょう。

また、テキストファイルをソースとする場合は、同じ作者さんのChainLPが便利でしょう。

■MeTilTran暫定レシピ

昨日一晩かけて作った暫定レシピを覚え書き。

400dpiでスキャンする

fi-6130を買ってからコミックばかりスキャンしてたので300x300dpi設定になってましたが、やはり文字主体だともう少し細かい方がいいということで400x400dpiに。ただfi-6130は400dpiにすると読み込みが極端に遅くなりますねぇ。でもまぁ画質には変えられないので我慢かな。

追記:いやもう、下に書いた本体の濃度調整使えば、別に300dpiでも平気な気がしてきた。

・MeTilTranで読み込む

連番JPEGで取り込んだ画像を食わせます。最初にノンブル(ページ番号など)の位置を正しく指定してやるのがポイント。また挿絵のページは誤爆していることが多いので、手動で「
ページ編集」モードから「挿絵」指定をしなおします。それでも正しく識別できない時は「グループ編集」モードで自分で範囲指定をしてやります。

KindleDX同様、標準では文字が薄くて読みづらいので、「ヒストグラム」で少し濃くしておくと良いです。灰レベルを200近辺まであげたりすることが多いですが、やりすぎると文字が太ってつぶれてしまうので試行錯誤が必要です。PCで見てちょっと濃いかなーってくらいがちょうど良い感じかと。1ページ調整した後、「設定コピー」で他のページにも同じパラメーターを反映させます。この時、挿絵ページは無駄に濃くならないよう、種別を指定してコピーすると良いでしょう。

追記:Reader本体側の調節機能を使えば充分に綺麗に見られるようです。コントラストを高め(60程度)、明るさを低め(-60程度)にすると、ヒストグラム未調整のファイルでも、文字を太らせずにクッキリ濃い表示ができました。

・出力設定

「再配置」ボタンを押すと出力パラ-メーターを指定するダイアログが出ます。残念ながらChainLPのように機種別テンプレートが用意されてたりはしないので、個別に指定しなければなりません。

画像形式:LRFが良さそうです。PDFだとなぜかReader上でタイトルが文字化けします。「文書詳細」でタイトルや著者名を設定します。ここでし忘れると多分後からは変更できないので忘れずに。

出力幅:584 出力高さ:754 600×800ですが実際には情報バーがあったりするのでこの値がドットバイドットらしいです。

文字サイズ:100%以外の数値を指定すると、再配置と同時に縮小もしてくれます。まずは100%でやってみて「もっと詰め込みたい」と思ったら数字を小さくしてみるといいでしょう。

 

そんなこんなでできあがったのが2枚目の写真です(クリックで拡大)。ルビも含めて一応読めています。もうちょっと濃く、かつ細くしたいところです。またKindleDXと違って本体側でも濃度調節が効くので、そちらとの兼ね合いも含めてチューニングをしてみたいと思います。

本体濃度調整したらバッチリでした。こちらが調整後の写真。

SDIM0941

iOS4.2.x 動画周り検証メモ

iPadユーザー待望のiOS 4.2.x(以下iOS4.2)がリリースされましたね。早速iPad、iPhone4ともに更新し、動画周りをチェックしてみました。なお、AppleTVは2台も買ったものの両方とも実家なので、AirPlay周りはAirMac Expressでしか検証できてません。

■iPad

チャプタースキップには対応。ただしチャプターリストを表示することはできない模様。

またHTTPストリーミング時はやはりチャプターには非対応の様子。ただ、SafariでBASIC認証がかかっている場合でも正常に再生できます。

AirPlayはAMEなので音声のみしか試せてないですが、音ズレがヒドく実用には今一歩という印象です。特にシークするとボロボロです。

■iPhone4

まず困ったことにiPodアプリで「テレビ番組」の番組名別表示ができなくなりました。分類表示が廃止されたという見方もできなくもないですが、トップ階層でAという番組名が出ているのにもかかわらず掘り下げるとA,B,Cのファイルがごっちゃになって表示されるので、やはりバグではないかと。早々に治るといいなぁ。

同日補足:

2chにて以下の書き込み発見。

697 :iPhone774G :sage :2010/11/23(火) 17:22:12 ID:JT5kbgv/0

>>599
今まではビデオタグの番組でグループ分けされていたのが、4.2だと情報タグのアーティストで
グループ分けされてる(ただし、グループ名はビデオタグの番組名)。
今まで通りのグループにするにはアーティスト名編集するしかない・・・。
ただ、バグがあるみたいでアーティスト名を日本語にするとiPhone上でグループ名が出ない場合
があった(アーティスト名を英語にすれば解決した)。

 

んー、これがバグで一時的なものなのか、将来的に確定した仕様変更なのかで対応が違ってきますねぇ。

というか、iPhone4もiPadのように「ビデオ」アプリを独立させて欲しいものです。

UTF-8だとAppleTVやiTunes 10.1上で文字化けしていたチャプター名ですが、iPhone4では引き続き正しく表示されます。仕様変更ではないようでホっとしました。AppleTV、QuickTimeの更新で治るといいなぁ(AppleTVも更新あったみたいなんだけどどうなんでしょうね)。

HTTPストリーミングに関しては、SafariでもiCabでも再生できなくてエラーになる確率が高くなった気がします。最近iPhoneではあまり使ってなかったので詳細な比較はできませんが。感覚的にはマルチトラック音声のファイルがダメな気がします。総ビットレートやファイルサイズのせいである可能性もありますが、試した範囲ではマルチトラック音声のファイルが100%ダメなようです。

 

まとめると、更新してよかったiPad、ちょっと待てばよかったiPhone4、って感じですかね。

新AppleTVゲット(2)

■映画コンテンツの再生にはテレビ側のHDCP対応が必須

UIがシンプルでサクサクなので実家の母親も利用意欲を見せたAppleTV。安いので先日買ったBRAVIAのあるリビングだけでなく、古いWEGAを移設した和室にもつけちゃえと思い、とりあえず動作確認ついでに「イブの時間」HD版を購入してみました。

ところが!いざiTunesにダウンロードが終わり、WEGAについないだAppleTVで再生しようと思ったら、HDCP非対応デバイスでは再生できないとエラーにorz。あー、そんな規格あったよねぇ。PCに地デジチューナーとかつけても古いモニタだと見られないっていうアレですよ。さんざんAppleTVのレビュー記事など読みあさっても一度も目にしなかったし存在自体すっかり忘れてました。

そう、HDMIがついていても初期のものはHDCP非対応なので、レンタルや購入した映画コンテンツは再生できないって訳です(音楽や写真などは大丈夫)。これどこもあまり説明してないので知らずに買っちゃう人とか多いんじゃないでしょうかね?知らずにハード買って、しかもプレビューは見られちゃうから安心してコンテンツにまでお金払った段階でエラーが出て唖然、、、みたいな。

現状は「AppleTV HDCP」でググってもあまり日本語の情報がヒットしないですが。HDMIついてるけどHDCPには対応してないってテレビは実際にはどれくらい存在するんでしょうね?SONYだとBRAVIAの名前になってからのは全部OKなのかな?

HDCPはハードウェア的な用件なので後からファームウェアの更新とかでどうにかなるものではないし、最終的な出画デバイスが対応していないと意味がないものなので、途中に何かをかまして回避という訳にもいかず。AppleTV買って見たけど非対応テレビだったって人はどうするんでしょうね。

とりあえず2代目を買い増すという計画は中止。

■Atom + IONではHDコンテンツ再生厳しめ

普通にH.264/720pのMP4ファイルを再生できているAtom + IONな録画PCですが、iTunes上で購入した「イブの時間」のHD版を再生すると、頻繁にコマ落ちする状態でした。CPUゲージが100%近くをウロウロしてます。Windows版のQuickTimeコンポーネントがH/W支援に対応してないっぽいですね(Mac版はしてるみたいですが)。普通にフリーの再生ソフトで再生できる負荷なのに、DRMのせいでiTunesに縛られて滑らかに再生できないってのは悔しいです。

ちなみにHDコンテンツを購入したところ、SD版とHD版が自動的にダウンロードされました(1.2GBと3.3GB程度)。SD版はiPhone 3GSとかで使えってことでしょうかね。拡張子はm4v。おそらく音楽と一緒で別PCにコピーしても、同一AppleIDで認証すれば5台までは再生できると思われます。母艦ではないのでiPhoneやiPadへの転送は試してません。

■写真

実家用なので、妹の子供の写真ライブラリをiTunesに登録し、AppleTVで見られるように設定しました。残念ながらWindowsの場合は指定した写真フォルダの中のサブフォルダ第一階層がAppleTV上で「アルバム」として認識されます。それ以上も以下も無理。ウチはSONYデジカメに付属のPMBで取り込んで管理してるので、取り込み日で「2010-11-01」のようなファイルが生成されて保存されます。これだと必ずしも撮影日とは一致しないし、こまめに取り込むとフォルダ数がエラいことになってAppleTVといえどスクロールが大変なことに。もちろんこまめにイベント単位でフォルダ分けすりゃーいいんですが、なんかもうすこしAppleらしいエレガントな実装を期待したいですね。Exifから撮影情報拾って、指定年、年月、年月日などで動的にスライドショーできるとか。Mac母艦でiPhotoを組み合わせるともう少し色々できるんですかね?

スライドショー時のBGMはiTunesのプレイリストを指定できて便利。こういうのは大抵それっぽい曲が数曲プリセットで入ってるだけとかってのが多いんですが。さっそくσ(^^)のコレクションが火を噴いたスライドショーBGMプレイリストを作成しておきました。

マルチポートUSB充電器 BUFFALO BSIPA09BK

昨今、iOSデバイスを筆頭に5Vで充電するガジェットが増える一方で、USBポート付き充電器+USBケーブルという付属品構成の製品も増えています。我が家で代表的なものをざっと挙げても

  • iPhone4
  • iPad
  • iPod nano
  • PSPgo
  • WALKMAN
  • Kindke DX

など。

これら全ての付属充電器を使っているとコンセントのタコ足がエラいことになります。かといってどれか1つの充電器に都度ケーブルをさしかえて使うのも面倒だし、また容量の違いの問題があります。iPadの場合、使用しながら充電するには2A(2,000mA)の出力をもつ充電器でなければいけません。また1,000mA未満だとiPhoneのバッテリ残量が空に近い場合に充電ができないなどの問題が発生します(少し古いものや安物は500mA程度のものが多いので注意)。

ならいっそセルフパワーのUSBハブ使えばいいんじゃね?ってことでACアダプタの容量が大きなものを買って見たりもしたんですが、上流ポートがPCにつながっていないとダメっぽかったり。基本、充電のためにつないだ時にPCに反応してほしくないので、PCとは独立の充電環境を作りたいんですよね。

と前置きが長くなりましたが、今回ご紹介する製品はコチラ。BUFFALOの4ポート USB充電器 BSIPA09BK[製品紹介]です(同じ外観で2ポートや1ポートのみのものもあるので購入時は注意して下さい。型番が09のものが4ポートです)。

SDIM0051SDIM0050

写真のように左右それぞれにUSBポートが2口ついている充電器で、合計2Aまで同時に充電できます(ただし2A対応の口は左の写真に見える下側の「2A PORT」と書かれた口のみ)。グリーンのLEDは過電流お知らせランプで、過電流時に点滅してくれます。

個人的にはテーブルタップ的に片側に端子が並んだ形状の方が使いやすい気がします。BSIPA09BKはどちらかというと携帯用ですね。泊まりの出張などに持って行くと便利そう。まぁ、でもこれ1つで今までの箱4つ分がまかなえると思えばコンセント周りは随分スッキリします。

是非据え置きタイプで8ポートくらいの製品を出して欲しいなと。さすがに80ポートはいりませんのでw。