ブログなんかでよく使うアニメキャラの名前を辞書登録するのってちょっと面倒ですよね。有名作品なら誰かが辞書ファイルを配布してくれたりもするかもですが、最近はあまり見かけません。
で、ふと気付いたのは、「Wikipediaの番組エントリの登場人物一覧の見出しで
姓 名(姓読み 名読み)
となっている部分を利用すればよくね?」ってこと。
で、簡単なスクリプトを作ってみました。名付けてWikipedia2Dic。あくまで上記の書式でレイアウトされていること前提の超手抜き処理ですが…
今のところ、自分が使うATOK用のフォーマットのみ出力できますが、単純な、
よみ(タブ)漢字表記(タブ)品詞
形式なので、MS-IMEなどで流用するのも簡単なんじゃないかと。要望が多ければ対応するかも知れません。要望があったので対応してみました。IMEのバージョンでフォーマットが違う可能性もありますが、とりあえずMS-IME 2007の辞書ツールでインポートできることを確認しました。
あと、一部エントリでは余計なタグが混入することがわかり、タグを一括除去するように改良しました。