メーカーの違う2.4GHzワイヤレスマイクを混在させると混信以外のところでハマるかも?

先日参加者4名のグループインタビューをお手伝いしました。私がモデレーターとして入って計5名の音声をZoomで中継する形です。先方には同時通訳者が入ってクライアントが聞く、という座組です。

当初、レンタルインタビュールーム備え付けのバウンダリーマイク(卓上置きマイク)で事足りると中間クライアントは考えていたのですが、エンドクライアントは各個人へのピンマイク装着を希望。テストをしてみてダメだったら私がワイヤレスマイクを4台持ち込みましょう、ということになりました。

で、案の定やはりピンマイク(個人別マイク)だよねということになったのですが、こちらも少しハマったので覚え書き。

セットアップとしては手持ちのRODE Wireless ProとHollyland Lark Max DuoをMacBook Proに接続し、モデレーター用としてMacBook Proの内蔵マイクとあわせてAudio Hijackを使ってソフトウェア上でミックスしてLoopbackの仮想オーディオデバイス経由でZoomのマイク入力として入れる、ということをしました。

同じ2.4GHz帯を使うデジタル通信を使う製品なので同じ部屋で使うと混信して途切れたりが心配でしたが、それはまぁ一応大丈夫そうでした。しかしエンドクライアントというか同時通訳者の方から「ハウリング(エコー)して聞きづらい」と言われてしまいます。当初バックヤード側の設定ミスで会場備え付けのマイク音声がZoomに載ってたりして少しずつ改善はしていったんですが、やはり2組のワイヤレスマイクを全てオンにするとエコーすると。一旦は2組4台を使うのを諦めて、1組2台を2人ペアの真ん中に置いてしのいでいたのですが、それはそれでやはり声が小さい(遠い)と言われるので、休憩時間になんとかできないかと試行錯誤。

■デジタルワイヤレスマイクは機種毎に遅延時間に結構差がある!

結果として問題だったのは各機種固有の遅延時間でした。Wireless ProとLark Max Duoとで音声の伝送時間に差があり、結果的にMacに入力される声がズレるのでエコーのようになってしまうというわけです。基本的には1人1人の口元で音を拾うわけですが、多少の漏話(隣の人の声を拾ってしまう)がある距離だったというのもあります。

そこでAudio Hijack上で「Delay」ブロックを使って、タイミングを補正してやることで解決できました。

以下のスクショが実際に使用したAudio Hijackのレシピです。

3系統のマイク(左端上からLark Max Duo、Wireless Pro、内蔵マイク)のうち、もっとも遅延が大きいのがLark Max Duoでした。厳密に録音して波形をみて合わせるまではせず、モニターイヤホンで声や拍手を聴いて感覚であわせた限りですが、Wireless Proに80msの遅延をかけてやっとLark Max Duoとのズレがなくなった感じです。同様に(あまり遅れなさそうな)内蔵マイクにも50ms遅延を入れています。

ついでに説明すると、Wireless Proの音声は「Volume」ブロックで200%に上げたあとでMixerブロックに送っています。それを(別売り製品である)RX10のVoice De-noiseフィルターで部屋の空調ノイズなどを提言し、最終的に更に音量をあげてLoopDeckの仮想音声デバイスである「UT Mic」に送っています。Zoomのマイク選択リストにこの「UT Mic」が見える感じ。

フィルターを入れれば入れるほどその処理遅延は大きくなり最終的に映像とのズレが出てきてしまうので、あまり多くはいれない方が吉なんですが、Zoom側のノイズ除去との兼ね合いも測りつつ、こんな感じでやっていました。

その後気になって調べてみたんですが、こちらのNote記事に定量的に検証してくださった結果が載っていました。

https://note.com/ocdp10ply/n/n02b9cce5e45c

Hollylandからの出走者はLark Duo Maxではなくより新しいLark M2ですが、やはりWireless Proよりは遅延が大きい。さらに安価なBOYA製品はもっとヒドい、という結果だったようです。大変参考になりました。やはりTx側でデジタルエンコードしてRxでデコードするというプロセルが生じる以上、プロセッサの処理能力が如実に出るという感じでしょうか。最近のLarkはノイズキャンセル機能もあるので、そちらも負荷として遅延原因になり得るのかも知れません。またRODEが全般に優秀なのか特に上位モデルのWireless Pro故の結果なのかも気になります。

実はまた来月同じく5名の音声をミックスする案件があるんですが、Lark Max Duoは引退させてWireless Proをもう1組買うか借りるかしようかなと思案中です。というのも前回は自分のMacBook Pro+ Audio Hijackで帳尻を合わせられたんですが、次回は別のモデレーターが使用する場面があるんですよね。なのでPCに入れる前の状態でハードウェア処理で遅延まで解決している必要があります。

なので最近使ってなかった6chミキサー+オーディオI/FのZOOM F6を起こしてきてワイヤレスマイク4台+固定マイク1台を入れてやろうかと。これなら本体前面のフェーダーツマミを別個にひねるだけでバランス調節ができます。ただF6内蔵のディレイは30msまでなのでLark Duo Maxだと厳しい可能性があります。

ZOOM ズーム 32bitフロート録音対応 6chフィールドレコーダー F6

ZOOM ズーム 32bitフロート録音対応 6chフィールドレコーダー F6

71,455円(12/02 00:35時点)
Amazonの情報を掲載しています

■Auditionで追加検証

あらためてF6で検証してみました。マルチトラックでAdobe Auditionで録音した結果がこちら。拍手の瞬間を撮ったもので、上から

  • RODE Wireless Pro(緑)
  • Hollyland Lark Max Duo(紫)
  • XLR有線入力のマイク(黄色)
  • LRにミックスしたトラック(青)

という感じ。それぞれ記事執筆時点の最新ファームウェアを入れています。

やはり紫のLark Max Duoが明らかに遅く、Wireless Proは有線マイクとの中間という感じ。ピークの瞬間を速い方からタイムコードでみると、有線 0.962s、Wireless Pro 0.970s、Lark Max Duo 0.984sという感じなので、遅延量でいうと

  • Wireless Pro: 8ms
  • Lark Max Duo: 22ms

で、ワイヤレス同士で14msのズレがあるという感じですね。上記noteの記事の値とほぼ一致する結果となりました。

これくらいズレがあると、耳で聞いても拍手がパン!ではなくパララ!と複数人が「せぇの」で叩いたかなって聞こえ方になります。これで何言ってるかわからないくらい聞きづらいかっていうと微妙なところではありますが、やはり長時間集中して聞いたり、同時通訳しないといけないといった時にはこの差が疲労となってのしかかってくるんじゃないかと。

このミームと化している画像を貼らせていただきたい。

逆算してWireless Proに14ms、XLRマイクに22msの遅延をいれてやると波形もほぼ揃い違和感はなくなりました。拍手が乾いた「パン!」になります。F6のトラック別ディレイは30msまでですがなんとかその範囲で調整できたので良かったです。60msとか遅れるBOYAでは厳しかったところです。

■まとめ

互いの声を拾わないような距離の状況なら漏話リスクも少ないんでしょうが、静かなインタビュールームでテーブルを囲んで、みたいな状況だとこの遅延が致命的なエコーにつながる可能性があります。

そんな状況で複数のマイク、特に2.4GHzデジタルワイヤレスマイクを組み合わせて使う時はできるだけ機種を揃えましょう(同一機種で混線しないかという懸念もありますが、むしろメーカー側で検証して推奨台数なども出してれば安心かなというのと、実際に混線が問題になったことはないので、現時点では機種を揃える方がメリットは大きそう)。

遅延の大きい安価な製品でもむしろそれで同士で組み合わせて他を混ぜないなら問題は小さいかも知れません。

そしてとりあえず予算が許すならRODE Wireless Proは低遅延さでもかなり優秀らしいぞと。完全遅延無しの業務用のB帯アナログワイヤレスマイクよりはお安い。ただノイズキャンセル機能がないので、PC側やZoom側でなんとかする必要はあるかも知れません。

また今回は5マイクなのでたぶん買わないと思いますが最大4chで足りるのであれば、マイク子機4台の製品も見つけました。

これの遅延具合は不明ですが、この4台で完結する分には問題ないでしょうし、ノイズキャンセルもあるみたいで、それでいて4台で4万円はなかなかコスパヨサゲです。ただマイク個別の音量調節ができるか明記されてないのでできない気も。できたとしても小さい送信機の画面と少ないボタンを駆使して操作するのはインタビュー実査中にするのは厳しいかも知れません。

今年UT/インタビューに導入して良かった機材紹介 2021

今年は後半にちょいちょい会場実査を実施できるようになってきたものの、やはりトータルとしてはリモートが多かったです。基本、会場だとハード、リモートだとソフト面での機材やノウハウが中心になりますが、それぞれについて「今年これが役に立った!」というのを紹介してみたいと思います。

■ハードウェア編

OBSBot Tiny(パンチルト制御できるWebカメラ)

まだ2実査ほどしか使ってないですが、個別記事をまだ書いてなかったのでここでトップに挙げておきます。

Webカメラです。普通のWebカメラとの違いはパンチルト(上下左右に向く)機構がついている点と、それを使ってAI画像処理で人物を自動で追いかけてくれる点。アギレルゴの川口氏が使ってみたけどイマイチだったということで譲り受けました。

通常UTやインタビューでビデオカメラ撮影する時、三脚雲台でアングルを調整したりすると思います。しかし参加者が姿勢やデバイスの持ち方を変えるとちょいちょい画角から外れてしまい再調整を余儀なくされがち。そういう時に、電動でリモート制御できるPTZ(パンチルトズーム)カメラだと便利です。UTラボなんかだと天井についていたりしますね。あぁいう製品は監視用カメラの流用だったりして大変お高いですし、一般会議室にポっとつけられるものでもありません。映像信号やコントロール信号も特殊でPCに直接つなげられないことも多いです。

ところがこのOBSBot TinyはUSBケーブル1本で映像音声は普通のUVC/UAC接続のWebカメラである上、専用ユーティリティをPC/Macにインストールすれば簡単に操作ができます。ありそうでなかった大変レアな製品です。映像音声とパンチルト制御は独立しているので、映像音声をOBS StudioやTeams/Zoomなどに入力しているのと全く独立に制御可能です。OSB Studiの場合、映像ソースのプロパティ画面からもPTZ操作可能です。さらに専用ユーティリティで各操作にキーボードショートカットがついていますので、Bluetoohtキーボードや後述のマクロキーパッドを使って離れたところから操作もできます。例えば、OBSBot Tinyと録画配信用PCはインタビュールームに置きつつ、Bluetoothが届く隣の部屋から見学者がカメラ操作する、なんてユーザビリティラボみたいなことが実現できるのです。少なくともPCがモデレーターの手の届くところにあれば、カメラ+三脚のところまで歩いていって調整する必要はなくなります。

実のところAI自動追尾機能はまだ実務では使用していません。誤動作したらイヤだなと。ざっと試した限り、追跡自体はそこそこ正確だと感じますが、顔を画面のどのいちに持ってくるのかが制御できません。通常UTやインタビューでは身体全体ではなく顔だけを抜いて画面の片隅に入れたりすることが多いですが、こいつのAIが顔を画面の中心にもってくるのか、身体全体でセンタリングするのか、みたいなところがコントローラブルではない上に、仕様でもあまり触れられていません。川口氏曰く身体を基準にしてるっぽいとのこと。なんで、画面の一部を切り抜いて使用するには厳しいかなと。顔の位置を決まったサイズ、決まった位置にして追ってくれるなら有り難いんですけど。

なおユーティリティで自動追尾は無効にできるので、完全にPTZ Webカメラとして使うことができます。この状態で使ってみましたが、途中で不具合を起こすこともなく快適に使用できました。デジカメ+HDMIキャプチャなんかよりよっぽど安定感あります。これで光学ズームがあれば最高ですが、最近海外で販売開始された4Kモデルならば電子ズームでも充分な解像度が出ると思うので、国内販売が始まったら買ってみようかと思っています。

ちなみに海外ではパンチルトズームに使えるリモコンも売られてるようですが、Bluetoothで技適をとってないのか国内の代理店からは販売されていないようです。またOBSとついてますばOBS Studioとはなんの関係もありません。

USBの規格上の制限としてケーブル長を4mくらいまでしか延ばせないという問題がありますが、それ以外ではもうビデオカメラいらなくね?と思える優秀な製品です。

RODE Wireless GO2(ワイヤレスマイク)

今年一番活躍しました。詳細は個別記事にて。簡単にいうと、1つの受信機で2台の小型ワイヤレスマイクを受けられるインタビュー向けのマイクシステムです。進行役と参加者それぞれが胸元に装着しておけば、バウンダリーマイクよりも明瞭に音声を拾えます。またマイク内にメモリが内蔵されて録音もできるので別途バックアップ用ICレコーダーを用意しなくて済みます。

AZ Macro (マクロキーパッド)

テンキーより更に少ないボタン数に絞った特定用途向けの小型キーボードのことをマクロキーパッドと呼びます。PhotoshopやPremereのようなやたらツールがたくさんあるソフトやゲームなどの操作を支援するものです。多くの製品はUSBキーボードとして固定のキーコードを発するもので、ソフト側でショートカットアサインをあわせたり、AutoHotKeyのようなユーティリティを使って変換したりします。一部の製品はファームウェアをいじって設定を書き込める場合もあります。

しかしこのAZ Macroは手軽なWebベースの設定システムを持っていてブラウザから簡単に各キーがどんなキーコードを送出するかをカスタムできます。

これを使って、

  • OBS Studioのシーンを切り替えたり録画開始
  • 上記OBSBotのパンチルト操作
  • Zoom、資料パワポ、進行シート、記録エディタなど狭い画面に様々なウインドウがひしめくオンラインインタビューで、「(例えパワポがバックグラウンドにいても)1キーでスライドを1ページめくる」みたいなマクロを実行

などの操作を1ボタンで実行できるようになり、よりスムーズなセッション進行を手助けしてくれました。さらにこの製品はBluetoothキーボードとして動作するので、少し離れた場所から進行役以外の人がさりげなく操作をすることができたりもします。同人ハードなどで入手性にやや難ありですが利用シーンがピンとくる方は是非チャレンジしてみてください。自分でハンダ付けするDIYキットと完成品が選べます。

■ソフトウェア編

XSplit VCam、Audio Hijack + Loopback

今年は久ぶりにメインPCをMacにしたので、いままでWindowsで愛用していたNVIDIA Broadcastが使えなくなりました。そこで、単体のバーチャル背景ツールとしてXSplit VCam、マイクノイズ除去ツールとしてAudio HijackとLoopbackの組み合わせを導入。これでリモート案件もMacでつつんがなくこなせるようになりました。(バーチャル背景なんて今時ZoomにもTeamsにもビルトインで実装されてるじゃないか、とお思いかも知れませんが、業務用のインタビューシステムではついていないことも多いのです…)

AutoHotKey

Windows専用になりますが、あるキー入力に対し、別のキーイベントや特定の操作をプログラムできるフリーソフトです。カメラや配信ツールの制御をしたり、オンライン会議のミュート操作、インタビューに相手に提示する写真や動画、スライドの切り替えなど、色々な制御を自動化、ショートカット化できます。きちんと体制の整ったチームで仕事をするなら作業分担もできますが、私はワンオペなことも多く、事前にこういうツールを駆使して仕込みをしておくと本番中に楽ができます。AutoHotKeyはプログラミング的な素養が必要かも知れませんが、とても多くのことができる良ツールです。

動画眼Lite

手前味噌で恐縮ですが、動画ファイルに頭出し用のインデックスをつける拙作「動画眼」シリーズに、専用アプリのインストールを必要とせずブラウザ上で簡単に閲覧(のみ)できる「動画眼Lite」をリリースしました。

動画眼でデータを作る必要がありますが、Lite形式出力したhtmlファイルを動画といっしょに渡すだけで、相手方は動画眼をインストールせずとも、またMacであってもチャプター付き再生をすることができます。ソフトウェアのインストール制限がある企業さんで重宝するかなと思って作成し、実際にいくつかの案件で納品ビデオデータにこれでチャプターを入れてお渡ししたところ便利だとご評価いただきました。

現在、このデータを作成するための動画眼もWin/Mac両対応となるVer3を準備中です。年内に出したかったけどちょっと厳しい雲行きになってきたかな…もう少々お待ち下さいませ。

■まとめ

コロナ禍で急遽リモートでユーザーテストをしなくちゃとなった昨年からだいぶ経って、自分達も、リクルーティング会社もそして参加してくださる方達やリモート見学するクライアント側も色々と知見が貯まって色々とスムーズに回るようになってきた感があります。それでも、より会場実査に近い形で例えばハードウェア製品を使って評価してもらうことはできるか?などと意欲的な要望もいただいたりとチャレンジは続きます。

会場実査は会場実査で、感染対策をしつつ見やすい/聞きやすい配信を見学者にお届けする工夫や新しい技術は毎回頭をひねりながら試行錯誤しています。

上に紹介したような製品は良さげだけど使いこなせる自身がないという方は是非ご相談いただければと思います。リサーチ案件としてだけでなく機材支援のみでもお受けしておりますので、「タスク設計や進行役は自前でやれるので、配信だけ手伝って」みたいな案件も歓迎です。

来年もどうぞよろしくお願いいたします。