年明けに書いているので、もう去年ですが、2024年に業務に導入して良かった機材やソフトウェアサービス、技術などを振り返ってみたいと思います。
■ユーザースクリプトを活用した既存Webサイト改修プロトタイピング技法
既存Webサイトの改修案をプロト作って検証したいという案件がありまして、当初はフローの中の該当ページだけ別URLのプロトタイプに移動してもらって体験してもらうという前提で制作依頼をいただいたのですが、ふと「ブラウザのユーザースクリプト実行機能を使って、本番サイトをリアルタイムで書き換えてやれば、現行ページをプロト側で再実装する手間も減るし、なにより途中でプロトURLに切り替えてもらう参加者にとって不自然なステップを挿入しなくて済むんじゃね?」と閃いて、実際にかなり上手くいきました。既存ページのほんの5%を改修して検証したいといった場合、95%をプロト上で再実装するのは無駄ですし、そのためにFigmaなどを使って本来の文字入力フローなどを「欄をクリックしたら文字入力された体でデロっとテキストが出る」みたいな省略動作になってしまいます。JavaScriptによる改編なら改編部分以外は現行サイト通りに動作しますし、本来の操作フローの中で違和感なくプロトを仕込めます。
ユーザースクリプト自体はJavaScriptによるDOM操作に精通した人なら普通に作成できるでしょう。一方その実行環境としてワンソースでPC/iPhone/Androidで効率的にユーザースクリプトを共有する実務ノウハウが蓄積できたので、近日中になんらかの形でドキュメントをまとめて公開したいと思っています。
■ワイヤレスマイク RODE Wireless Pro
RODE Microphones ロードマイクロフォンズ Wireless PRO ワイヤレス プロ デュアルチャンネルワイヤレスマ…
コロナ禍でマスク、パーティション、換気という悪条件の下で明瞭な音声収録をせねばとなった時から、RODE Wireless Goからはじまった小型録音機能付きUSBワイヤレスマイクを活用しつづけています。GO、GOII、DJI Mic、Hollyland Lark Maxなど色々試して結局RODEに戻って最上位モデルのWireless Proしか勝たん、となっています。しかも2セット揃えてしまった…
32bit floatとかタイムコードとか尖ったカタログスペックはさておき、もっと可視化されづらい違いとして、「遅延の少なさ」が際立っていました。詳細はこちら。
今年グループインタビュー案件で2セットのワイヤレスマイクを使う機会があって発覚したんですが、両者の間に遅延の差があって、単純ミックスするとエコーのような音質になって非常に聞き取りづらくなってしまいました。少なくとも異機種、異メーカー混在は避けた方が良さそう。また1セットとしても映像との同期を考えると遅延は少ないに越したことはないなと思っています。遅延はカタログスペックが記載ないので、実際に試してみるしかないですが、自分は当面はRODE信者で行きたいと思います(RODEの他機種は計測できてないですが、、)
またハードにしろソフトにしろミキサーを選定する時は遅延補正機能も重要だなと思う一件でした。何年か前に買ったZOOM F6がチャンネル別に遅延補正量を設定できて持ってて良かったと思いました。
■リモコン制御可能なPTZカメラ OBSBot Tail Air
購入は2023年末ですが、実際に業務に投入したのが今年なので。
PTZとはパン/チルト/ズームの頭文字で、これらを電動制御できるのがPTZカメラになるのですが、本製品はHDMI出力またはUSB(UVC)カメラとして使えつつ、リモコンでPTZコントロールが使えるのがミソ。ネットワーク制御もできますがそういう面倒なセッテイング抜きでリモコンで動かせるので設営が楽ですし、見学者の方に渡して好きに画角調整してもらうこともできます。モデレーターに「ちょっと参加者さんの顔が見切れてるのでカメラ向き直して~」等とリクエストが来るのを避けられます。
惜しむらくは広角寄りの画角で、参加者の顔カメラとしては良いですが、手元や画面をアップにするにはちょっと望遠側が足りません。2025年早々に望遠モデルが出るようですが、結構お高いので悩ましいところです。案件が潤沢にあれば検討しますが、当面は画面寄りはFX30、顔をTail Airという組み合わせかなーと。
■音声テキスト化(書き起こし)AI周り
UTの発話記録を書き起こせると分析が捗りますが、今までは小規模案件ではなかなかプロのタイピストの方に依頼するのも難しかったです。私は、AI書き起こしを活用し、拙作ツール「動画眼」を使って、ある単語が出たシーンを頭出しできる環境を作ることで、精度が完璧でなくともビデオの見返しを劇的に楽にできるということを提唱していまして、そのための書き起こしツールを日々模索しています。実務案件だとクラウド系の書き起こしは機密上使えない(クライアントNG)ことがほとんどなので、ローカルPC上でエッジ処理できるものに限っています。これまではPremiere Pro内蔵の書き起こしエンジンを使っていましたが、去年くらいからChatGPTで有名なOpenAIがリリースしているWhisperとその派生エンジンを使い始めています。
これまでオリジナルのWhisper、VAD処理を一括で行い精度をあげられるstable-ts、Mac用GUIクライアントで手軽に使えるMacWhisperなどを紹介してきました。
日々進歩の激しいカテゴリなので、一概にこれがいいとは言えませんが、Windowsでそれなりに良いGPUを搭載してPCがあるならstable-ts、AppleシリコンMacならMacWhisperが良いスターティングポイントになると思います。
■ビデオスイッチャー RODECast Video
長らくATEM MINIシリーズ一強だったビデオスイッチャー界隈に期待の新星が現れました。RODEのRODECaster Videoです。これを書いてる時点でまだ手元に届いていないのですが、年末駆け込みで発注済み。どこも初回入荷分は品切れの中、奇跡的にラス1をゲットできたので、ショップの年明け営業が始まり次第出荷されるはずです。別途紹介記事を準備中。
後発だけに色々便利だったり配線をスッキリさせられる要素が詰まっています。特に前述のRODE Wirelessシリーズマイクを直接ペアリングできるのはヨサゲ。3画面以上の合成レイアウトを作るUIも直観的になっています。ATEM MINIがもともと放送機器メーカーのBlackmagic design製なだけあって、物理UIもソフトもかなりプロ仕様だったのに対し、本機はかなりアマチュア配信者フレンドリーなユーザビリティを実現してきている印象。
ATEM MINI EXTREME ISOよりも実売価格で上を行くのが悩ましいですが、3画面以上の合成が必要なら有力な候補になる気がします。逆にそれ以下ならATEM MINIの下位モデル(数万円)か、割と非力なPCでもOBS Studioでいける気がします。
■スマホ画面収録用ミラーリングツール ApowerMirror
定番だったReflector4を久々に使おうとしたら何故かAndroidの画面キャストを受けることができず、代替ソフトを模索しました。ApowerMirrorという製品に辿り着きましたが、Reflector4と比べるとかなりお高いので、月額サブスクを必要な月だけ契約する形にしつつ、Reflectorのアップデートを待っています。
■3Dプリンター
2024年は2台目の3Dプリンターとしてそこそこ良いもの(BambuLab X1-Carbon Combo)を導入し、個人ホビーとしても活用しまくりでしたが、業務で使うものもそこそこ作りました。
記事にはしてませんが、iPadの背面にスライド送りリモコン(Logicool SPOT)を取り付ける治具も作り、参加者に見せるパワポスライドの制御と、iPad + Apple Pencilでの記録を持ち替え無しでできる環境を作ったり。
金融系の調査でダミーのマイナンバーカードを用意する必要があって、厚紙やプラ板を手でカットするのよりもかなり精緻なものが作れました。
こうした実査中の小さなストレスを解消したり、よりリアルな場作りをしたりするのに3Dプリンターは有用だなと思っています。汎用的なものはどんどん公開していきたいと思いますし、何か困り毎があればご相談いただければと思います。
■まとめ
2024年は正直仕事の量はガクっと減ってしまい、商売としては割とピンチでしたが、その分、ひとつひとつの案件には腰を据えてじっくり取り組め、こうした準備も手の込んだことが色々できたかなという気がしています。
これらのノウハウを活かせるお仕事が2025年はたくさんくるといいなぁ。お待ちしております。