群盲、象を撫でる~局所的知覚による誤解釈

 久々のユーザビリティ・パターン案の追加です。

下りエスカレーターの案内板

 家電量販点の店内の写真です。エスカレーター前に真っ赤に目立つ案内板が置かれています。実はこの奥にあるエスカレーターは上りなんです。2つ見えるのは、下から昇ってきたものと更に上に行くヤツがあるからです。下りのエスカレーターは写真右手に写っている食洗機コーナーの前を進んだ方向にありますよ、ということを示しているんです。この写真ではわかりにくいですが、左から歩いてきた時に見える向きに上りエスカレーターを示す黒い案内板も出ています。

 つまり、まっすぐこの写真の向きにエスカレーターに向かう人に、「おっと下りはあっち(右)ですよ」ということが言いたいんですが、たまたまエスカレーターの進行方向にマッチしているために、非常に紛らわしいことになってしまっています。


 おそらくもっと広く見渡して総合的に吟味をすれば間違えることはないのですが、ある視野角に切り取って局所的な情報だけで判断するとミスガイドになってしまう。こういうパターンって結構あるんじゃないでしょうか?

 例えばアプリケーションのメニュー項目を考えてみてください。ある機能がどのメニュー項目の中から実行できるか探している時に、あなたは全てのメニューを開いて全ての項目を吟味した上でもっともそれらしいものを選択するでしょうか。おそらくしないですよね?ひとつのプルダウン・メニューを開いて、その中にある程度それらしいものが見つかれば、まずそれを選んでみたりしますよね。

 つまりシステム全体が視野に入っている設計者が大丈夫だろうと思ってデザインしたものも、ユーザがある一部を切り取って認知した時には全く別の解釈が成り立ってしまうよね、という問題提起です。

 どうでしょう?パターンとしてアリでしょうか?またなんと名付けましょうか?

 思いつきでは、やはり「局所的」とかってキーワードが入るかと思います。逸話系のネーミングだと「群盲、象を撫でる」という言葉がありますね。確か仏教系の話です。目の見えないお坊さん達が象に触って、たまたま耳に触った人は「象とは大きくて平べったいものだ」と言い、足に触れた人は「象ってのは太い丸太みたいなものだ」と言う。みんな自分の触った部分の印象だけで表現して、ちっとも全体像にたどり着けない、というアレです。ちょっと正確なリファレンスを探したんですが見つかりませんでした。こういう文脈で使って適切かどうか、どなたか詳しい人がいらっしゃいましたらご教示いただければと思います。

自分にとって大事なこと≠他人にとって大事なこと

 どこぞの健康雑誌のダイエット特集で「脂肪炎上」という見出しが使われていて、どこぞの社会学の先生が「日本語としておかしい」云々を根拠に批判していた、という話を聞きました。激しくどうでも良い話ですね。こんなのはインパクト勝負なんで、コピーライターだってわかってやってるワケですし。

 ただ、もう少しメタ認知してみると、翻って我々ユーザビリティ屋だって似たようなことをしてる可能性が大いにあります。「ゴミを入れたら膨らむゴミ箱なんてこの世に存在しないんだから、そんなメタファーは適切ではない」なんて指摘をしても、世の中の人は多分誰も困っていないワケです。むしろ親しみがわいてポジティブな評価や効果を得られていることでしょう。

 我々は何かについて専門家になり、人が知らないことを知ってしまうと、それを知らない人に対して教えたくなります。おそらくその感情の奥にあるのは、人より優位に立ちたいといった類のものでしょう。マズローの五段階欲求説で言えば、承認欲求(社会的に評価されたいっ!)のあたり?この欲求を理性的に制御できないと、つい他者を貶めることで相対的に自分の自尊心を満足させる方向に走ってしまいがちになります。そんなコミュニケーションはまた別のネガティブな感情を呼びますし、建設的ではないですよね。

 ユーザビリティ(あるいは認知科学)は実世界で役に立ってナンボのショーバイです。常に実効性を重視し、個人の自尊心を満足させるための道具にはしないようにしたいものです。

 元々からしてユーザビリティ屋は“ダメ出し”が仕事なワケで敵を作りやすい。そんな中で、「デザイナーの奴らはこんな基本的なことも知らない。ユーザのことがなんにもわかってない。」なんて態度を丸出しにしていたら議論になるワケがありません。戒めていきたいものですね。

 以前のコラムで、 「人は自分が理解していることは、同様に他人も理解できる」と思いこんでしまいがちな性質をもっているという研究を紹介しましたが、逆に「ある事柄について知っているのは自分だけ」とか「最近知ったことは、まだ他人は知らないでいる」などと思いがちな性質なんてのもあるかも知れませんね。あるいはその情報価値に対する評価なのかも知れません。「自分にとって大事なことは、他人にとっても大事である」って思考なのかな?

 折しも、Normanが「エモーショナルデザイン」で、ユーザビリティ屋もデザイナーも設計者も、自分の価値観を他セクトに押しつけるだけでなく、協調して製品開発しないとダメだよ、と諭しておられる話と符合しますね。

 ひとつ前のエントリで触れた、人類が総体として賢くなるために乗り越えて行かなければならない壁のひとつだと思います。

認知科学会大会 ワークショップ所感

 7月29†31日に京都大学で開催された認知科学会第22回大会に参加してきました。

 色々と面白い発表もあったのですが、最終日のトリのワークショップのひとつ、「認知工学:設計のための認知科学」が個人的にエキサイティングだったのと、聞けずに帰った関東直帰組が内容を聞きたがっていたので、感想を書いてみます。内容のレポートというより、σ(^^)自身がインスパイアされて思い浮かべたことなので、その場にいなかった人にはちょっと通じにくいところがあったらごめんなさい。

 コーディネーターの三宅芳雄先生の主張は、「認知工学って言葉が登場して久しいけど、その実際はあまり確かではない。本当のところ認知“工学”とは一体なんなのか?」ということだったようです。デザイン的にはなんら問題のなさそうで、差異が明らかだと思われる新幹線の自動券売機、喫煙車と禁煙車のアイコンを間違えて押してしまう人が意外にいる(実はσ(^^)も間違えたことがあります)。しかし現在の知見では明確な理由付けができない。

 話題提供者のひとり、産総研の橋田さんは、機械が人を理解し、人が機械を理解するためには、セマンティック・ウェブの考え方のように、オントロジーによる構造記述を用いたユーザ・インターフェイスが必要なんじゃないの?という提起をされました。

 σ(^^)自身、卒業研究は英文の構造を二次元配置で表現できるようにするツールを試作したり、ユーザビリティ・パターンのようなものを考案してみたりと、 ユニヴァーサル・ランゲージを策定してコミュニケーションを効率化する系の考え方は好きなので同意。

 で、元の芳雄先生の話に戻ると、認知工学のために必要なことは、認知科学の知見を現場の人が再利用な形に構造化、一般化することなのかなと思いました(というか多分芳雄先生自身もそうおっしゃっていたと思います)。認知科学の根底的な考え方として「人の認知は状況依存性がとても強く、一般化は難しい、または意味がない」というのがあります。やはり話題提供者の三宅なほみ先生も今回のワークショップでも強調してらっしゃいました。ただ、Normanの『誰のためのデザイン』が広く受け入れられた理由のひとつは、そういった捉えにくい認知科学の知見を「対応付け」とか「フィードバック」とか「アフォーダンス」とかいった“わかりやすい”指針という形にブレイクダウン(?)したところだったように思います。実際、現場ではそういうレベルのガイドラインやチェックリストを常に期待されてしまいます。あまり詳しい知識がない人でも再利用可能なスキーマでなければならないわけです。このことと、認知科学では一般化を嫌うということは割と対極的であり、ジレンマなんだろうなと思う訳です。

 「見やすい表示のためには文字サイズやピッチは何mmあればいいですか?」と聞かれた認知科学屋は、「それは状況によりけりで一概には言えません」と答えるのが常だと思います。少なくとも現在の方法論ではそうとしか答えられません。でもそれでは現場の人が利用するのは難しいわけで、認知科学にとって大事なものをもうちょっとだけ犠牲にして、広く利用可能な“部品”の形に落とし込むのが認知工学なのかなと。認知科学を工学化するということは本質的に矛盾を含んでいて、「認知科学的なアプローチを保持した工学」ってのは難しくて、「認知科学の成果を(アカデミックな正当性はある程度諦めて)シュリンクした工学」くらいのものなのかなと。>認知工学

 スライド
 戸田先生の宣言の要約

 なほみ先生は、日本の認知科学の重鎮というか創設者のひとりであられる戸田正直先生がずっと以前にアジ的に宣言された「人は新しい技術や環境の中で、自身の認知過程を制御する術を見つけなければ、人類に未来はない。」(チョー要約)という言葉を引用され、認知科学の知見を全人類が共有することの重要性を説かれていました。先生は3年位前の大会でも「認知科学を基礎教養に」と主張されてましたが、確かにその通りだと思います。IT的に言えば、人の認知には様々な脆弱性があります。例えば先入観のようなバイアスに左右されやすいといった特性を悪用されてしまえば、容易に認知を制御されてしまいます。振り込め詐欺やぁゃιぃ宗教に洗脳されるのみならず、それこそ戦争推進派につけこまれて世界滅亡のシナリオに向かってしまう可能性だったあり得るわけです。それは認知特性である以上、完全に塞ぐことはできないセキュリティ・ホールなワケですが、少なくとも多くの人が自覚を持つことで破滅的な結末だけは回避できるはずです。むしろ、人類が総体としてより“賢く”なれることで、様々な進歩を得られるはず。もっと卑近な例でいえば、ちょっと意見するだけで気分を害してしまい、建設的な議論ができないアイツをなんとかできるはず、とかねw。

 今現在の認知科学の知見だけで本当にそれが実現できるかどうかわかりません。でもなほみ先生曰く、認知科学というのは(例えばファジー学会みたいな)ある特定の方法論で議論することを目的とした集まりではなく、人について探求するという志を持った人があらゆる方法論を持ち寄って取り組む学際的な場所である(べきである)。これは初日に食事をご一緒させていただいた場でも両三宅先生がおっしゃってましたし、なほみ先生は懇親会の会長挨拶でも「これからもそういう場であり続けよう」と強調されていました。そういう場であり続ける限り、いつかはそういう成果も得られるでしょう。

 そうした時に、それを広く一般に普及せしめるのが、認知工学(あるいは別の呼び方をされるべきかも知れない何か)であるのかも知れません。「認知科学って難しい」とワークショップでも言われていました。つまり、有益だが難しい何かを、噛み砕いて一般に利用しやすい形に落とし込む、まさに「認知科学のユーザビリティを向上させる」ってワケですね。

 学術研究としてはすっかり認知科学から遠のき気味なσ(^^)ですが、もしなにか貢献できるとしたらそこかも知れない、と思いました。σ(^^)の好きな言葉で言えば、認知科学エヴァジェリストw?

 来月やらせていただくHQLでのセミナーでは、とりあえず開発者コミュニティ限定ですが、少しでもそれに近いことができたらいいなぁ、なんて思ってみました。がんばろっと。

ネットワーク気分アイコン

Engadget Japanese ネット越しに気分を伝える「ネットワーク気分アイコン」

7684682934735558.JPG はは、これ良いですね。今の気分を相手に簡単に伝えられるアンビエント系デバイスだそうです。

 入力側のインターフェイスはどうなってるんでしょうね。各表情の部分を押すなりタッチするなりするだけなら使いやすいでしょうね。「ワンクリック」ってあるからそうなんでしょう。 あれ、でも入力と出力が同じだと、自分と相手の気分が違う時はどうなるんだろう?押した瞬間だけそれが光って相手に伝わり、自分の方には相手のエモーション表示に戻る、とかかな?

 いいなぁ、欲しいなぁ。

一緒に使う相手がいればね…

 というか、こういう単純な機能のネットワーク家電を作りたいなぁ、と思います。

P.S.

 「アンビエント」カテゴリ新設してみました。

ビデオデータの切り出し機能、その後

 hkondo氏にffmpegの最新版をコンパイルしてもらい、コマンドラインオプションを色々弄って試しています。

○静止画切り出し

 これは基本的に問題なさそうです。タイムコードを渡してJPEGファイルに書き出すことができます。MPEG2でも問題無し。

○動画切り出し

 こっちは苦戦中。というか悩み中。まず動画コーデックも音声コーデックも変更しないでただ切り出す、という指定ができるんですが、MPEG2ソースの場合なぜか上手くいかない。まぁ、サイズも縮めば好都合だろうと思い、多少変換に時間がかかっても別フォーマットに変換することを考えつつあるんですが、何を使うべきかが悩ましい。おそらく要件としては、

  • PowerPointに貼れること
  • 特殊なデコーダーを入れなくてすぐに再生できること
  • もし入れるとしてもフリーのもので済むこと

といったカンジでしょうか。PowerPointにしても、バージョンやプラットフォーム(Win/Mac)によっては対応形式に差違があったり…

サイズや汎用性など一長一短なので、最終的には、テンプレートとして、

  • 再エンコード無し(元データ形式によってはうまくいかないかも)
  • PowerPointに貼りたい人向け
  • DVD-Videoに焼きたい人向け
  • 最新のコーデックで小さく縮んで、PC上で綺麗に再生できれば良い人向け

くらいを用意しようかとも。もちろん自分でカスタマイズすればあらゆるパラメーターで変換できるんですが、そこはどっかに裏技として余地を残しておけば良いかと。

 で、試行錯誤の結果。

・MPEG1(音声MP2。拡張子MPG)

 WindowsでもMacでも標準で再生可能だしパワポでも問題無し。ただし最近のコーデックに比べて画質、音質ともにパフォーマンスが劣る。サイズの割に汚い。

・MPEG2(音声MP2かAC3。拡張子MPG)

 切り出したファイルを再変換無しでそのままDVD-Videoに焼ける(そんなニーズあるかな?)。ただし、WindowsXPですら標準では再生に対応しておらず、ソフトDVDプレイヤーか、フリーのコーデックをインストールする必要がある。 DVDドライブを搭載したPCならインストール済みなことも多い。ただし、今のところffmpegをつかっての出力がうまくいっていないのが問題。

・ISO-MPEG4(音声AAC。拡張子MP4)

 拡張子.mp4の世界標準準拠のMPEG4。最近のコーデックなので画質が良い割にサイズは小さい。音声もiTunesなどで使うAACで、MP3よりも高音質。ただしこれもXP自体は再生に対応しておらず、QuickTime6を入れないとダメ(Macや家電メーカーのPCならインストール済みだったりする)。しかもPowerPointに貼れない。PowerPointに貼らなくて良い人向けにはコレが一番無難な気がします。

・DivX(音声MP3。拡張子.AVI)

 これも画質対サイズのパフォーマンスは問題無し。ポータブルプレイヤーなど対応ハードウェアも充実。DVD-RやCD-Rに焼いとくだけで再生できるDVDプレイヤーも1万円を切る価格で入手可能。PCでの再生にはフリーのコーデックをインストールする必要がある。MacOSXもOK。PowerPointだと映像が真っ黒。

・WMV v2(音声MP3。拡張子.WMV)

 試行錯誤の結果、PowerPointでちゃんと表示できたのはこれだけ。少し古いコーデックなので画質面では不満もあるけど、PowerPoint用テンプレートとしてはこれを使っとくしかないかなぁ、という感じ。

・Camtasia(音声MP3。拡張子.AVI)

 対応フォーマット一覧を眺めていてみつけました。また試してはないですが、CamtasiaやMORAEを使って画面をキャプチャしたAVIファイルを加工する場合は利用できそうです。

 という感じ。どうも、PowerPointはAVIコンテナには対応しているものの、外部のDirectShowフィルタは利用できないんじゃないかという気がします。なので、PowerPoint用には、Windows(やMac)が標準で対応している形式を選ばないとダメそう。ffmpegが扱える形式の中では、MPEG1かWMV v2くらいかな。もちろんDV形式のAVIなどは扱えるんだけど、ファイルサイズがバカでかくなるから除外。

 あぁ、でもDVカメラで撮って、iLinkでコピーして、動画眼で必要な部分を抜き出して、それからMPEG2などに縮める、というニーズもあるかな?だとするとDV形式AVIも必要ですかね。

 PC上で再生できりゃいいよ、って人にはISO-MPEG4がいいかな。QuickTime6はほとんど標準みたいなものだし、クライアントに入れてくださいっていうのにも、あまり怪しまれずに済むんではないかと。DivXとか3ivxとか、GPL MPEG1/2とかだとダウンロードサイトとかが知らない人には不安をかき立てそうw。SourceForgeとか知らない人にはドキドキでしょうね。その点、Appleのサイトなら抵抗がないかと。

 MPEG2出力に関してはもう少し検証が必要。

 あと、Everioが吐くAC3音声なMPEG2を読み込むために、デコーダーを組み込んだffmpegを作ってもらったんですが、こういうのはライセンスの扱いが微妙。ソースコードの配布なら特許に抵触しないのでどうにでもできるんですが、コンパイル済みのものを配布した途端にライセンス料が発生する可能性があります。そうなると無料配布をいう形態では扱いが困難になるかも知れません。うーむ。

 

ビデオデータの切り出し機能

 今日はmixi内のコミュニティ“ユーザビリティの会”のオフ会でした。

 その場で、動画眼を試用してくださったKさんから、「動画の一部分を切り出すような機能があるとウレシイ」みたいな要望をいただきました。その時は、「動画ファイル自体に手を入れるのは深みにハマるからそれは難しいな†。あんまり触れたくない部分だなぁ…」と思ったりしたんですが、ふと帰りの電車の中で「案外イケるかも!」という気がしてきました。

 例によって、既存のツールを流用するアプローチです。既にあるものは利用する。それが道具眼流(笑)。

 ffmpegというオープンソースのエンコーダーがありまして、コイツはコマンドラインで色々なパラメーターを指定して様々なフォーマットで動画を変換することができます。コマンドラインでオプションを渡せるので、例えば動画眼のログから、バッチファイルを生成できれば、後は半自動で指定範囲を別ファイルに切り出したりはできるはずです。

 実は、先日hkondo氏からGrabFrame.DLLというライブラリを教えてもらって、これを組み込めば少なくとも.AVI形式のファイルに関しては簡単に静止画キャプチャはできそうだね、という話をして、実は開発版に試験的に組み込んでみたりしてました。が、このライブラリではMPEG2形式の動画から切り出すことはできず、限定的な使い方になるなぁ、と思ってました。しかし、ffmpegであればタイムコードを指定して特定フレームをJPEGなりに書き出すことはできるはずなので、静止画書き出しの問題も一挙解決?

 うん、それでいってみよう。なんでもかんでも動画眼の機能として内容する必要はない。動画眼のログから、ffmpegで一括切り出しを指示するバッチ(マクロ)を生成する、みたいなアプローチで。ffmpegならGPLだから動画眼と一緒に配布しても多分問題ないはずだし。

 というわけで、このヒラメキ(?)のための良いきっかけをくれたKさん、ありがとうございました。何かしらの形になったらお知らせします。

 

FeliCaで街をブックマーク

ITmediaビジネスモバイル:FeliCaで街をブックマーク──TOWNPOCKET
 これちょっとP.O.R.っぽいですね。でもこういうのはDoCoMoではなくauにやってほしいなぁ。いや、σ(^^)がau使いだからということではなくて、auにはGPSナビがついてるからです。ブックマーク情報の中にGPS情報が入っていれば、そこからルートを検索してナビしてもらえるワケで。
 でも面白いですね。QRコードよりもずっとスマートにやりとりが終わるし。よく店頭で気になるプロモーションのポスターとかあって立ち止まって詳しく読みたくっても時間がなかったり雑踏で迷惑そうだったり、なんかそういうのに興味もってそうな自分を他人に見られたくなかったりw。
 あぁ、つーか別にケータイでなくてもいいなぁ。普通のEdyでタッチしておくと、後から登録アドレスに案内が届く、みたいなのがいいかも。

動画眼1.0RC2リリース

道具眼製ツール
 動画眼の1.0の正式リリース候補版2(RC2)をリリースしました。更新内容はいくつかのバグフィクスです。
 動画眼、動画眼Note共にマニュアルもほぼ書き上がっており、動画眼Note用の新アイコンも作ってもらってありますので、あとはそれらをインストーラーパッケージに仕立てて、正式リリースとしたいと思っています。
 動画眼Noteを作ってから、すでに3件程度の業務で使ってみましたが、クライアントさんの評判も上々です。従来、単にビデオを納品してもクライアントさんの方でも活用できず、ただ「実施しました」という“証拠品”でしかなかった訳ですが、動画眼でタスク別にすぐに頭出しができるようになっていれば、テストに同席できなかった方も少しは自分で見てみようかと思われるかと思います。ユーザテストを自身の目で見ることの重要性はことさら繰り返すまでもありませんが、その機会が増すというだけでもこのツールの価値があるかと思っています。
 正式リリース後は、開発体制をmixiの“ユーザビリティの会”コミュニティ中心に移行するか、フリーのプログラマに転身を図るkawaguti氏あたり引き継いでくれるか(彼への報酬を工面するためにシェアウェア化の可能性も)、このままちまちまとバージョンアップを繰り返すかは未定です。ご意見、ご要望などもお待ちしています。
 個人的には、ソースはスクラッチ(ゼロ)から書き直したい気分ですね。これを作り始めたことはVB始めたてだったので、ウインドウなどのオブジェクトの内部的な扱いがすごく“キタナイ”んですよ。将来的に他の誰かが引き継いでくれるようなことになった時に、今のソースはスパゲッティすぎます…

キートップ表示がかえられるキーボード

全キートップにカラーディスプレイを搭載したキーボード
 これは面白いですね。例えば、Shiftをおしたらキートップの文字が大文字になるなんてのはもちろん、Ctrlキーを押してるあいだは、Cキーに「Cut」とかショートカット名が表示されたり、なんてこともできちゃうわけですね。その時にショートカットが割り当てられているキーだけが点滅したり色変わったりして誘導もできると。
 個人的には写真にあるPhotoshopモードも欲しいかも。
 てかCtrlとCAPSを綺麗に入れ替えられるだけでご満悦w。使ってみたい!
 やっぱキータッチが悪い(重い?)のかなぁ。
 一体、いくらになるんだろ。

1.8’HDD内蔵Everio

ビクター、1.8インチHDD内蔵の動画カメラ「Everio」新モデル
 先日北米市場で発表された1.8インチHDD内蔵型のEverio Gシリーズが日本でも発表されましたね。20~30GBのHDDを内蔵しており、連続撮影時間が伸びています(バッテリはあんま伸びてないですが…)。MicroDrive方式ではないので、取り外してPCに挿す、ということはできず、USB2.0で転送することになります。
 これだけ容量があれば、ユーザテスト1日分は充分録りきれるでしょうから、セッション毎にMicroDriveからデータを吸い出したりしなくてもヨサゲ。液晶画面が大きいのもMC500に比べてアドバンテージですね。
 ユーザテスト用に買うならこっちが正解かも知れない。ふーんだ。3CCDじゃないムービーなんていらないさっ!