NVIDIA BroadcastのないMacでもWeb会議にノイズキャンセルを使いたい

M1MaxのMacBook Proを導入し、自宅デスクトップとしても当面はメインに使うことになりそうなわけです。今のご時世大抵のサービスはWinows/Mac両対応でほぼ問題ないのですが、悩ましいのがWeb会議で活用しまくっていたNVIDIA Broadcastです。NVIDIAのグラフィックボードRTXシリーズのコンピューティングパワーを活かして音声ノイズキャンセルやWebカメラの背景ぼかし処理、オートフレーミング処理などを行ってくれる仮想デバイスツールです。こればっかりは将来に渡ってMac版が提供されることはなさそう。UT実査などでWireless Go2をなどダイナミックマイク系の特性(近くの大きな音だけ拾う)のマイクを使う時はまぁなくてもいいかなと思いますが、自宅のコンデンサマイクはエアコンなどの微細なノイズも拾いまくってしまうので、なんらかのノイズ除去が必要です(ダイナミックマイクをカメラの画角に入ってしまうような口元にマイクスタンドで持ってくるのは避けたい)。これにはNVIDIA Broadcastがうってつけだったのですが、、

■札束で殴る方法は自重

以前から気になっていたのはUNIVERSAL AUDIO(以下UA)のオーディオI/FにC Suite C-Vox Noise & Ambient Reduction(以下C-Vox)プラグインを組み合わせる方法。UA社のオーディオI/FはDSP搭載で各種フィルターをハードウェア処理でかけることができる特長をもっています。そのひとつに超強力なノイズ軽減フィルターであるC-Voxがあります。ほぼ遅延なしで声を削ることなく綺麗にノイズを消せるらしいし、PC側に処理負荷もかからないので良さげなんですが、なにせハードが最低でも数万、C-Voxプラグインが$349もするのでうっかりすると10万円コースです。なかなか日本でのレビューもなく、ちょっとギャンブルでもあるのでなかなか特攻もしづらい。しかも今回はMac本体に多額の出費をしたばかりなのでさすがに自重。

UAのApolloシリーズは値段でDSPコア数が違うんですが、C-Voxをきっちり動かすのに何コアあればいいのかとかも公式サイトみてもよくわからず。基本1つのプラグインは1つのDSPコアがあれば動くんでしょうかね?

■ソフトの力でなんとかしてみる

Audio Hijack

そこで見つけたのがRogue Amoeba社(読めない)のAudio Hijackとうソフトウェア製品です。Web会議用ツールではなく、どちらかといえばソフトウエア・オーディオミキサー?エフェクター?兼レコーダーという感じ。様々な入力ソースはアプリの出力音声に色々なエフェクトをかけて録音したり、別デバイスに出力したりできます。この中に学習型のノイズ低減フィルターが入っており、最大3秒のノイズサンプルを覚えさせることで同種の音を消してくれます。ざっと試した感じノイズ以外の音声の劣化は少なそう。グラフィカルなUIでエフェクターブロックをつないでいく形で構成を作っていきます。エフェクターをかけるごとに遅延は伸びていきますが、低遅延モード(処理が追いつかないと音が飛ぶらしい)にしてNCと音量調整をかける程度ならWeb会議には充分でした(M1 Maxだしというのもあるかも?)。また途中の好きな時点のレコーダーブロックを挿入できるので、例えばエフェクトをかける前の生音をバックアップで録画しておくということがOBSで無駄にソースを増やして例のチェック間違えるとエラいことになるミキサー設定でやりくりしなくて済みます。音声もOBSのマルチトラックで録ってしまうとバックアップトラックが含まれた動画ファイルになってしまい、即渡しには不便になってしまいます。そういう時に万一のバックアップ録音はAudio Hijack側で録っておきつつ完成トラックだけをOBSに渡す、みたいな使い方もできるかなと。NC学習は一瞬ですが毎回環境がかわるような使い方だと地味にひと手間あるかも知れません。でもまぁそれで精度が上がるのならむしろアリかなと(現時点では)思っています。例えば空調音だけでなく打鍵音も除去したければ3秒の学習中にキーをガチャガチャしてやればキーも割と消えます。NVIDIA Broadcastは問答無用で人間の声以外の全てを除去するので、手を叩いたりスイッチを押す音がなくなって場合によっては映像とあわないなんてこともありました。そう考えると、「この音を消せ」とその場で教え込めるのは過不足なくていいのかも知れません。ちなみにグライコやハイパスフィルターなどは普通に揃っているので少し組み合わせてみましたが、結局とNCとボリューム調整だけでいいかなという印象。重ねると遅延も出やすくなりますし。ただDeEsser(サ行の音の余計な成分を消す)があると良かったなと思います(ざっとみて見付からなかっただけで同等のフィルターはあるかも)。

LoopBack

ただしAudio Hijack単体ではエフェクトをかけた後の音声を他ソフトからみた音声入力(仮想マイクデバイス)にアサインすることはできず、更に別のツールを組み合わせる必要があります。同じRogue Amoeba社からはLoopBackというツールが出ています(有償)。フリー昔だとBlackholeというのがメジャーっぽいです。オープンソースでM1にも対応済みだとか。今回はAudio Hijackとバンドル購入ができ、同じソフトハウス同士相性問題もまずないだろうということで安全牌としてLoopBackにしておきました。こういった仮想デバイスなどハードウェアやOSに密接に絡むツールはOSのセキュリティの仕組みが変わるごとに互換性の問題が出たりするので、きちんとサポートが継続されそうなところがいいかなと。実際、インストール手順は少し面倒です。Audio HijackとLoopBackは共通のドライバーレイヤーがACEとかいう名前で独立していて、M1のMacの場合インストールするにはリカバリーモードで起動してセキュリティレベルを落とす(サードパーティの署名付きドライバーを許可する)設定変更が必要になります。こちら英語画面ながらスクリーンキャプチャ付きの紙芝居形式で説明がありわかりやすかった気がします。

Audio Hijackが$65、LoopBackが$109(前者の方が多機能で高そうなイメージあるけど)で、セットで買うと割引きが効いて$143でした。安くはないですが、M1Max買った勢いで少し金銭感覚麻痺してる中で特攻してしまいました。

オススメは一旦Audio HijackをBlackholeで試用してみて不都合なさろうならAudio Hijackのみ購入、ダメならLoopBackとセット購入、という感じですかね。

■カメラの背景ぼかしとフレームトラッキングはどうしよう?

背景ボカシは質を問わなければまぁZoomにもTeams、Meetなどにも一応機能はありますね。ただ個人的にはあの品質はちと許しがたい。こちらもハード製品として気になっているのはOBSBot社のMeet 4K。ソフト処理より綺麗に人物抜き、フレームトラッキングができるようです。カメラのセンサーも今使っているLogicool Brioよりも大きいので画質も良さげ。現在クラウドファンディングで先行予約受付中。ここで安く買うか、日本代理店での発売を待って買うか悩ましいところですが、いずれにせよ最短で来年初頭です…既製モデルをみると日本の代理店は並行輸入品はサポート対象外のようなので、後のことを考えると国内販売を待つ方がいいのかも知れません。

あとはATEM MINI Proでキッチリとグリーンバック用意してガチでクロマキー合成するかとかですね。これ買うか、、、