費用感ですが、本ツールを無償で公開したとして、WasonのSpeech To Text APIの利用料が(辞書登録など音声モデルのカスタマイズをした場合で)$0.03/分なので、60分のセッションを丸起こしさせたとして200円くらい?音声ファイルの長さで計算されるのか、変換にかかった時間なのか不明あやふやですが、実際変換はほぼ実時間くらいかかるのでどちらでもそう変わらないかと。結果がいまいちで、そのタスクや業界固有の用語を辞書に追加したりして何度かやり直しかけたりしてもまぁそんなにスゴい値段にはならないかと。
で、これを自動でタブ区切りテキストに変換するため、ツール2としてC#でコマンドラインツールを作成。Visual Studio for Macで作ってmacOSで動いてますが、まぁ前後ツールの関係で実質はWindowsで使うことになりますかね?ただ自分でWatsonに投げられて、Excelで読めればいいやって向きにはMac版のニーズもあるかも知れません。VS for Macが吐いた.exeファイルをVS無しで単体で実行可能にする方法をまだ調べてない…(それよかツール1をMacに対応させた方が早いかもしれません。Xamarin.Formとか使えば両方で動くものにできるんじゃないかと)
動画眼はWindows Media Playerコンポーネントを利用して動画を扱います。今回の機能はそれとは全く独立にタイムコード(秒数)をffmpegに渡して処理をおまかせしています。なので、動画眼(=Windows Media Player)で読み込めてる動画形式が必ずしもffmpegで扱えるとは限りません。一般にはffmpegの方が扱える範囲は広いはずではありますが。また同じ秒数を指定しているのに微妙にズレたところが切り出されるといった可能性もないとは言い切れません。この辺り、まだほとんど検証ができてませんので、上手くいかなかったらごめんなさい、ということで。連絡いただければこちらで検証してみられるかも知れません(結局はffmpeg次第なのでどうしようもないかも知れませんが)。
ただし実際に開けるかどうかはお使いのPCの環境に依存します。マニュアルにも繰り返し書いていますが、動画眼の動画再生周りはWindows Media Playerコンポーネントを利用しています。Windows Media Playerで開けるものは動画眼でも開けます。そしてWindows Media Playerがどの形式を扱えるかというのは、インストールされたコーデックによるのです。バージョンにもよります。Windows7に付属のWindows Media Player 12であればもしかするといきなりMP4が開けるかも知れません。逆にXP/Vista等に付属するWMP 8~11だと、別途コーデック(DirectShowフィルタ)をダウンロードして入れる必要があるでしょう。ウチはほとんどのマシンがWindows 7になってしまってますし、後から色々なソフトを入れてるので、もはや何と何を入れれば開けます、ということを調査するのは難しい状況にあります。場合によっては既存環境に影響も与えるので、そう気軽に「これを入れればOKですよ」と保証できないって側面もあります。ただ直感的には、ffdshowあたりが有力ではないかなと。