何年かぶりのOCRソフト、e.Typist v.12

以前のエントリで、非マンガ書籍をKindle用PDFについて試行錯誤していた訳ですが、その際ネックになったOCRを、別途専用ソフトでやったらよくね?ってことで、何年かぶりにOCRソフトに手を出してみました。というか単体パッケージを買うのは初めてかも。元々OCRとかディクテーションとか翻訳といった自然言語系のソフト技術は学生の頃に絶望していらいあんま信用しておらず、その後あまり注目したこともありませんでした。でも、先日ScanSnap Organizerの認識率はまずまずだったし、PDFの検索用に透明テキストを作る位なら一字一句正確でなくてもまぁ諦められるかなと。

で、ScanSnap Organizerの認識エンジンを調べると、ABBYY FineReader for ScanSnap™ 4.0となっています。海外製のソフトをOEMで買って来て使っているもよう。おそらくScanSnap以外で取り込んだPDFを認識しないのは、ライセンス上の制限なんでしょう。なら、その製品のフルパッケージを買えばよくね?と思った訳ですが、体験版の申し込みをした後、さっぱりメールが来ない。まぁ、迷惑メールフォルダをあされば出てくる可能性大ですが、とりあえず放置。日本語は辞書を利用した認識はしてくれないみたいですし。

で、次に同社のエンジンを(英文に)利用しているらしいPanasonicの「読取革命」に注目。しかし体験版のインストーラーすら起動せず。64bit非対応でしたorz。

調べてみると64bit完全対応を謳う製品はなく、「動作未保証」になっているのが「e.Typist」と「読んでココ」辺り。このあたりは1万円台後半で、ドキュメント管理やOffice文書(への)変換など統合ソフト的になってきていて、ぶっちゃけ画像PDFに透明テキストが載っけられれば良いσ(^^)にはやや無駄も多かったんですが、老舗なりの精度を期待したのと、「e.Typist」のオーバーレイ表示が認識精度のチェックに良さげだと思ったので決めました。

64bitで動くか不安だったので体験版を探すも見つからず諦めて店頭へ。で、パッケージをみるとやっぱり「体験版は公式サイトにあるから、動作確認はそっちでよろしく」と書いてある。仕方なく店頭では買わず、無駄に駐車場代を払って帰宅。で、公式サイトで体験版一覧のページを見つけて開いてみると「現在配布配布している体験版はありません」ときやがる!なめとんのかゴルァですよ。結局Vectorで買いました。

■やっとレビュー

認識率は変に凝ったフォントでない限り問題なさげです。認識速度も爆速。ただ、画像PDFの読み込みが若干もっさりします。

本製品はScanSnap連携機能もあり、直接ScanSnapのボタンでスキャンした結果を取り込むことができます。が、しかしこれを使うと結局前のエントリで問題になった点をすべて引きずることが判明。さらにTIFF形式で渡してるみたいなんですが、これもやっぱり読み込みがもっさり。結局この機能はさっくり殺しました。

結局JPEGで喰わせるのが一番速いようで、JPEGで取り込み、eTilTranで傾きとガンマ補正して再度JPEG保存。それをe.Typistに読み込むという手順がいいみたいです。KindleDXに最適化したピクセル数だとPC上で読むのにやや粗いので、リサイズはしない方向で。前回のものに比べサイズが3倍以上(178ページで30MB->110MB)になりましたが、動画などに比べたら屁でもないのでクオリティ優先で。できあがったPDFはPCで見ても綺麗で検索もでき、KindleDXでもそれなりに読めるので、満足しています。

ユーサビリティとしては、全体にやや煩雑です。フォルダで喰わせられず、百単位の画像ファイルを全選択して渡す必要があったり(フォルダ指定はできました)、レイアウト調整、認識もデフォルトでは選択しているファイルしかしてくれなかったり。色々マクロ的な機能を使いこなせば一発変換もできるみたいですが、なんかそこまでするのもまためんどくさそうな微妙な作りです。あと開いてるファイルの閉じ方も不明。別の書籍データを取り込もうとすると、同名ファイルが既にあると怒られる。よくわからないので毎回一旦アプリを終了してます。保存メニューから透明テキスト付きPDFを保存できるかどうかもよくわからなくて、いつも「ワンタッチ転送」機能でAcrobatに渡してそっちで保存しています。Acrobat持ってない人はどうなんだろう?とか。

そういう応用力と試行錯誤する根気がある人には精度と速度的には充分オススメでしますが、例えば実家の父親にホイっと渡して使える気はあんまりしない、という感じ。逆に業務で定型文書を扱う時なんかには、テンプレート設定機能を使って最適化してやれば、父親の会社の事務員さんなんかには使ってもらえるかなという気もします。その辺りの機能はまた機会があれば試してみたいと思います。プログラミング系のリファレンス本なんかにはいいかも。>テンプレ

痛ガジェット用シートの覚え書き

痛ガジェット用にいくつか用紙を試したので、CraftROBOの設定とともに覚え書き。

痛ガジェット用に使う用紙の要件として、「綺麗にはがれる」が重要だと思います。ガラリと違うデザインを楽しみたくなった時、失敗して貼り直すとき、ガジェットを売却する時など、シートが破れずに綺麗にはがれる必要があります。

次に、伸びるフィルムを使うかどうか。PSPは曲面が複雑なので、無理矢理つじつま合わせができる伸びるタイプは適しています。逆にDSiは平面が主なので必ずしも伸びるシートを使う必要はないという印象です。伸びるフィルムの欠点は、逆に貼るときの引っ張り具合で形が変わってしまう点と、保護フィルムとの組み合わせを前提にしにくいという点です。後者は伸びる透明保護フィルムが入手できればいいのですが。もちろん、透明タイプの伸びるフィルムシートはあるので、それを上から貼ればいいかも知れません。ただ二枚重ねになった時の伸び方に問題がないかは未検証。また保護を謳うシートのように紫外線カット機能などは期待できないでしょう。

伸びるフィルムを使う場合、消耗品と割切ってそのまま使うか、クリアケースを上からかぶせて保護するかという選択になるでしょう。個人的に一回り大きくなるクリアケースは極力使いたくないので、DSiは伸びないフィルム+保護シートで利用中。PSPはまだ悩み中です。とりあえず伸びるシートで貼ってみたんですが、一部失敗もしてしまったので、次は伸びないシート+保護フィルムで再挑戦してみるつもり。

なんとなく安定して入手できそうなイメージがあるA-one製品を基本にチョイスしています。

■A-one 29282

「キレイにはがせる」、伸びないタイプの白ラベルです。弱粘着タイプながら、何度か位置決め直しではがしても充分な接着力は発揮してくれます。

ただ印刷後の手触りがイマイチで、かなり摩擦が高いので、ボタン周りには向きません。DSの上画面の左右部分など、指が触れない箇所向け。

Cutting Master 2の設定は、青キャップ(0.1mm)でカット圧14で一部台紙まで切れてしまいました。10~12程度でヨサゲです。

■A-one 20282 + 保護フィルム ナナクリエイト PF-7

最初から保護シートがセットになったものもありますが、色々買いそろえるのは割高な気がして、保護フィルムだけの製品を別途買ってみました。A6サイズx10枚のPFH-7もあり、小型ガジェット中心の場合は使い勝手が良いです。

29282の上にこれを貼ることで、保護効果はもちろん、手触りもすべすべになって好印象。

Cutting Master 2では、黄キャップ(0.2mm)を使い、カット圧16でバッチリ切れました(29282上に貼って一緒にカット)。

■A-one 29297

こちらは伸びるタイプの白フィルム。「キレイにはがれる」とは書いてないですが良好です(フィルムならあまり気にすることないかも知れません)。逆に何度か張り直ししても充分粘着しています。エッジのカーブにもピッタリフィットしています。

肌触りはスベスベというよりはややザラザラしていますが、悪くない感触です。

カット設定は黄キャップ、カット圧14。

ただ、やはり伸びるタイプということで、PSPに貼って見て、ボタン穴にあわせて何度かは貼り直しているウチに、一部が伸びてしまったのか、外辺の直線が直線ではなくなったりしました。上下をそれなりに余裕もってカットし貼り付け後にパーツの継ぎ目にそってカッターで切るか、いっそ分解して内側に巻き込むように貼る位した方が綺麗に仕上がるでしょう。

あと、インクの乾きが足りなかったのかも知れませんが、既にエッジ部分が少し擦れてきています。せっかく手触りが良いのですが、やはりクリアケースで保護が必須かも知れません。

■CraftROBOのノウハウ

今回もCraftROBOには苦労させられました(^^;)。まず、Vista 64bitドライバが公式サイトで配布されていたので対応したものだとばかり信じていたのですが、どうもIllustrator & CorelDraw用プラグインのCutting Master 2は非対応みたいです。トンボを打つところまでは行くんですが、カッティングしようとすると固まります。これに気付くまでにかなり時間を無駄にしました。

仕方なく別の32bitマシンに環境を構築して再挑戦。が、今度はカッティング時にエラー。結論からいえばまたトンボの作り方がマズかったようです。自動で作ったところ紙のエッジに近すぎてNG。手動でオブジェクト周囲ギリギリに縮めてうったら今度はセンサが図柄をトンボと誤認してエラ-。どちらもエラー表示は「ポート送信エラー」(だったかな?)という類の内容で、トンボが原因だとは一言も触れてくれてません。シートがもったいないので、印刷済みのトンボを修正テープで消して、トンボだけ何度も出力してトライ&エラーをしました(^^;)。結論として、用紙外辺からのマージン少なすぎても、印刷オブジェクトに近すぎてもダメ。その絶妙な位置に手動でボックスを描いて、それをトンボに変換するという使い方が基本になりそうです。

MP980 + Vista 64bitで「新規ポートの作成に失敗しました」

横浜に戻り、仕事用メインマシンのVista 64bit機でMP980のLAN接続セットアップをしようと思ったところ、「新規ポートの作成に失敗しました」と出て失敗。ヒドいのは、「もう一度」というボタンしかなく、クローズボタンもないので、再チャレンジしか選択肢はない点(「もう一度」を押して次画面に遷移し、そこで「戻る」ボタンを押すと何故かホーム画面に戻れるんですが…)。で、チャレンジする度にプリンタにアイコンは増えていくという無限増殖パターン。

ググると、公式サイトに「64bit版のWindows Vistaでご使用になる場合、セットアップ時に「新規ポートの作成に失敗しました」メッセージが表示されることがあります。この場合には、一旦セットアップを中止し、パソコンを再起動してから再度セットアップを実施してください。」とあります。だからその、「セットアップの中止」がわかりづらいんだってばさ!ユーザテストやったら絶対被験者ハマるパターン。わかってるんなら、上記メッセージと一緒に再起動ボタンもつけといてくれよ、と。

ともあれ、再起動後に再挑戦したらスンナリ成功しました。ただ、「プリンタ」コンパネの中には再チャレンジした回数だけ、同じ名前で末尾に「(1)」などと付加されたアイコンが溜まっているので、それらを一旦削除してからインストーラーを起動するのが良いでしょう。

なお、単に再起動では上手くいかなかった方もいるようなのでご参考にリンク張っておきます。

Canonプリンタで「インクタンクが複数取り付けられています」と出る時の覚え書き

プリンタネタで思い出した。最近、妹が使っているiX5000で「下記のインクタンクが複数取り付けられています」とシアンインクがエラーになる現象が出ました。どれだけ確認しても差し直しても解消されません。

で調べると、iX5000に限らずBCI-7eシリーズを使う機種に頻発している問題のようで、インクタンク側のICチップの不良のようですね。対処は別のインクタンクと交換すること。キャノンのサポート(外箱に書いてある電話番号)に連絡すると交換品を送ってくれるとのことなので、実際に電話してみました。「“インクタンクが複数取り付けられています”というエラーでインクを交換してもらえると聞いたんですけど?」と切り出したら一発で通じました。で送付先を伝えたら送ってくれて、同封される返送用送り状を使って不良の出たインクを返送すれば良いようです。到着までは中二日ほどかかりました(電話口で「○曜日にお届けできます」と明示してくれます)。

ちなみに「この問題はすでに解決していて、今出回ってるロットでは起きないんですか?」と聞いてみたところ、残念ながら微妙な相性の問題で再発する可能性はあるとのこと。まだメーカーでも完全に対策は出来てなくて、対症療法的に交換でお茶を濁している状態のようですね。常時予備タンクを用意しておけばそれほど致命的なことにはなりにくいですが、面倒っちゃ面倒なので早いとこ解決してほしいものですね。

PIXUS MP980用インク型番メモ

プリンタ買ったら恒例の自分用インク型番メモ兼Amazon購入用ショートカット、ってことでMP980用。

iX5000等で使うBCI-7eシリーズよりも若干安いみたいですね。ただ、タンク容量自体も少し小さいのかも。