RODECaster Videoをテストしてわかったことメモ

RODECaster Video(以下RCV)が液晶保護フィルム製作から返ってきたので色々検証を始めています。

実査投入の時のために色々判明したことをメモしていこうと思います。

■ストレージ周り

本機は内蔵ストレージ、microSDカードスロット、USBポート3にSSD接続という3つのストレージがあります。マニュアルによると内蔵ストレージは基本的に設定を保存したりファームウェア更新に使用するためで、挿入用のメディアファイルはSDカード、録画はUSBストレージにしてね、ということぽいです。microSDに録画できないのは残念ですが、書き込みスピード的に難しいのでしょう。今は1TBのmicroSDとかもあるのでISOは無理にしてもPROGRAM出力だけでも録画できたら良かったんですが。逆に挿入用メディアファイルはmicroSDからしか読み出さないようです。

ATEM MINIでは相性があってSanDiskのSSDが認識しなくて(途中まで使えてた気もするけどどこかのアップデートでNGになった記憶j)、SamsungのT5やT7 Touchを買い足すなどしていました。そこら辺の動作検証をしておきたいと思います。

本機はATEM MINI Extreme ISOと同様、合成後のPROGRAM映像と別に各映像ソース、音声ソースの生ストリームを個別に録画しておくこともできます。あとで編集で映像切換をしたり、音声のリバランスをしたりができるわけです。特にUTでは参加者毎の音量差がある時にあとで補正できるのは安心材料です。

このISO記録を有効にすると当然ながら書き込み速度は何倍も必要になるので、こちらでテストをしておけば、ISO OFF時は余裕と考えてよいでしょう。

なお録画用ストレージはexFATでフォーマットしてある必要があります。今のところPCでフォーマットしたものが普通に使えているようです。

テストに使ったSSDは、

  • SanDisk Extreme Pro 500GB (Model No.SDSSDE80-500G)
  • Samsung T5 2TB (Model: MU-PT2TB0B)
  • Samsung T7 Touch 500GB(Model: MU-PC500K)

の3モデル。

(↑リンク先は1TBモデル。今はもっと後継モデルが安く手に入るはず)

(↑リンク先は2TBモデル)

特にATEMで使えなかったものの速度は最も速いSanDiskと、指紋認証ロックがかけられるT7 Touchの挙動が気になります。PCレスで指紋認証がかけられるT7 Touchは録画して持ち帰る時に紛失しても安心なので、引き続きメイン録画ストレージとして使いたいものです。

結果としてはどれも大丈夫そうです。T7 TouchはATEMの時と同じで、USB接続して電力供給された後で指紋センサーにタッチすればランプがグリーンになり録画可能になります。

映像のISO録画オンの状態で、500GBのT7 Touchの録画可能時間は12時間以上と出ます。これだけあれば通常のUT実査では問題なさそう。少なくとも1日分撮れないということはないでしょう。そもそもUTでは映像のISOはオンにすることはあまりないですし。

2時間くらい録画して、PROGRAM出力のmp4が7GB位でした。Windows11のExplorer読みで8Mbpsくらいのようです(1080@30p)。ちょっとそのまま納品ってサイズじゃないですね。編集耐性も考えるとまずまず良いバランスかなと思います。

■音声遅延周り(映像 vs 音声)

RCVでは遅延しがちな映像に対して、音声を揃えるために意図して遅延を入れる設定があります。さすがに音声ソース毎は無理ですが、Mix音声に対してフレームまたはミリ秒単位で遅延をさせて映像とあわせることができます。この辺りも自前のカメラ、マイクで最適値を探っておきたいと思います。

テスト環境はRCVに直接ペアリングしたRODE Wireless Proです。XLRなど有線マイクなら更に遅延が少なく映像と差が開くのかも知れませんが、現状自分の利用シーンではほぼWireless Proを使うことになると思うので、当面それ基準で行きます。

映像デバイスとして使ったのは、Webカメラ2台とHDMI出力のついた書画カメラです。

  • Logicool Brio
  • OBSBot Tiny2
  • iPEVO VZ-R

RCVはUVC準拠のWebカメラが使えるといっても非圧縮(YUV)伝送ができるものに限られるので、国内で手に入る対応Webカメラは10種類に満たないレベルで、ややお高いものが多いのは仕方ないです。

書画カメラはスマホを操作する手も含めて画面収録するのに使います。これもUSB(UVC)出力がありますが非圧縮ではないのでHDMIで接続する必要があります。

VZ-Rはフリッカー防止スイッチを60Hzにすると1080@60p、50Hzにすると1080@50pになりました。GoProみたいですね。フリッカー観点だと関東だと50Hzにするべきなんですが、1080@60pで撮ったり最終的に15や30フレームに落とすのであれば60Hzにしておきたところ。どのみち今時はLED照明器具なので、関東関西はあまり関係なく、その場でチラつかない方を選ぶ感じになるかとも思います。

さて遅延としては24フレーム/秒止まりのBrioがもっとも大きく、Tiny2と並べると明らかに1テンポ遅れがある感じです。どうしてもカメラが足りない時でないとBrioは使わないかな。

で、Wireless Pro音声との差ですが、HDMI入力のVZ-Rは0遅延といって良いレベル。Tiny2は1フレームだけ音声を遅延させると合う感じ。ただ1フレームなんて波形を見なければ気にならないレベルです。

次にマイク入力のあるFX30にRode Wireless Proを3.5mmアナログケーブルで接続し、映像と音をHDMIソースとして入力した時は2フレの遅延がありミックス音声はエコーのような状態になってダメでした。そこでRCVの遅延設定で+2フレームにしてやったところ改善。これは全ての音声ソースにかかるものの、HDMIソースの音声は対象外で、結果としてHDMI経由の音声とそれ以外の音声のタイミングが揃えられるみたいです。HDMI音声はLRをスプリットして独立音声トラック扱いにできるので、本体操作パネルで個別に音量調整ができたり、ISO録音ファイルも別個になるので、RODE Wirelessシリーズのように2子機の音がステレオで入るケースではこの遅延設定でズレを解消しつつ活用できそう。

現時点の結論として、

  • UVCはモデルによるが、Tiny2は実質気にしなくて良いレベル
    • Webカメラにマイクが内蔵されていても音は入らなそう(未確認)
  • HDMIは音声ともども遅延があるが、本機のディレイ設定でほぼ解消できる

という感じ。ちなみにたぶんデフォルト状態だと思うんですが+5フレームの遅延が設定されていました。

■音声遅延周り(音声ソース間)

続いて、音声をマルチトラックで録音して、トラック間のズレがどうなるか実験してみました。機材構成は、

  • XLR接続のガンマイク(ベリンガーC-2)
  • 直接ペアリングしたWireless Pro x2
  • USB接続のWireless Pro x2

の4トラック。USB接続のWireless Proはステレオトラックとして認識されました。ATEMのように設定でセパレートトラックとして扱えないかと思ったんですが見当たりませんでした(HDMIとコンボのみ可能ぽい)。Premiere Proで個別調整する時は手動で左右分離をしないとならずひと手間かかりそうです。今回はステレオペアのままで比較しました。ちなみに表示上「Wireless Pro」と表示されるので、USBデバイス名などから認識はしてるらしいです。もしかしたら同機種固有にチューニングもなにかしらされてるかも?

また音声ディレイは0設定です。

結果はこんな感じ。青いトラックの上側がミックスされたPROGRAM OUTの音声、その下はISO録画された映像トラックに入る音声。緑のトラックが個別トラックで、上からXLR、直接ペアリングしたWireless Pro、USB接続のWireless Proです。USB接続したWireless Proはステレオ扱いになり、ATEMのようにモノラルスプリットはできなそうです。Premiere Pro等で個別バランス調整したい時はトラック分割のひと手間が必要です。

パンっと拍手をした瞬間を撮っており、マーカー(縦線)がPROGRAM映像でみて両手のひらが当たったと思えるフレーム位置です。まず前後の誤差は30fpsで1フレーム程度。個別に聞けば違和感は感じない程度です。それでもミックスした音声を聞くと「パンッ」が「パパンッ」とか「パララッ」という感じで聞こえます。

不思議なのはISO録画された個別映像トラックに入る音声の方がミックス音声よりも1フレームほど早い点。ISO録画にはミックス音声がそのまま入るということだったような?ただ映像も1フレームずれている気がするので、ISO録画は開始が1フレ遅れるということなのかも知れません(Premire上で先頭を揃えて配置している)。

次に直接ペアリングしたWireless ProはXLRに対してほぼ遅延がありません。この2トラックだけをONにして聞いてもほぼ違和感はないレベル。それに対してUSBで親機を接続したWireless Pro(一番下のステレオTr)はほんの少しだけ遅延があります。1フレ以下なので補正もできないレベルですが、やはり同時に聞くと多少のズレは感じます。気にしなければ気にならないレベルかも知れませんが、音声を長時間聞き取るユーザーテストやインタビューだと聞き疲れはどうかなというところです。3台以上のRODEワイヤレスマイクを使う時は、両方の親機(Tx)をUSBか両方アナログ(コンボジャック使用)で揃えた方が無難かも知れません。もしくは直接ペアリングとコンボジャックならさほど気にならないと思います。この辺りはまた実際にグルイン等の案件があった時に検証しようと思います。

とりあえず1on1のユーザーテストならWireless Proの直接ペアリング2台か、Wireles Pro + XLRマイクで同期処理いらずで問題なさそうなのは安心です。

■まとめ

現状、セッテイングとしてはこんな感じを基本にしていけそうです。

・PC Webのユーザーテスト

  • PCのHDMI出力をRCVに
  • 音声はWireless Pro
  • 表情カメラはTiny2、またはOBSBot Tail AirをHDMI入力
  • 遅延設定は±0

・スマホWeb/アプリのユーザーテスト

  • VZ-RのHDMI出力をRCVに
  • 音声はWireless Pro
  • 表情カメラはTiny2、またはOBSBot Tail AirをHDMI入力
  • 遅延設定は±0

・カーナビ等のユーザーテスト

  • FX30に距離に応じたレンズをつけてHDMI出力をRCVに
  • 音声はWireless Pro
  • 表情カメラはTiny2、またはOBSBot Tail AirをHDMI入力
  • 遅延設定は±0

・グループインタビュー

  • 4名までなら2台のWireless Pro。ただし直接ペアリングは使わず、親機をUSB接続して遅延を揃える。コンボジャックだと充電時に(グラウンドループ)ノイズが心配。ただUSB接続しても親機が充電されないっぽいので、定期的に外して充電する必要がある。だったらアナログノイズ対策をした上で充電しながらコンボジャック入力もありかなぁ。カメラがFX30ならそちらのマイク入力に入れて、HDMI音声をスプリットすればRCVで個別音量調整もできそう。その場合の遅延設定を2フレームとか入れると良さそう。
  • 5名以上ならXLRかUAC経由でマイクを追加。時間差が出るようなら音声はZOOM F6でまとめて遅延補正してUACで本機へ入力(オートスイッチは使えない)F6は認識しませんでした
    • おそらく直接ペアリングした場合はXLRと比較して実用上問題になる遅延は発生しなさそう。親機をUAC接続した場合の遅延をテストしておく。いっそアナログの方がマシ?
    • ただUSBマイク入力がUACならなんでもなのか、Webカメラのように要件があるか不明。RODE製マイク以外でも使えるかは別途確認。→Zoom F6はダメでした
  • 映像は必要に応じてチョイス。オートスイッチ機能を活用して話者の映像に自動切り替えしてみるのも実験したい。

・ストレージ周り

録画ストレージは手元のどのSSDでも良さそう。セキュリティを考えるとT7 Touchをメインに。容量が不足しそうな案件ならT5 2TB。

・安定性

現状、映像3、音声2のISO録画程度ではなんの不具合もなく収録できてそうでひと安心です。発熱も底面もほんわり温かい程度で、これなら普通に室温が維持された室内ならなんの問題もなさそうです。プロセッサーは不明ですがATEM MINI Extreme ISOの時代から進んでよりプロセスルールの細かいものに進化して電力効率上がってるのかも知れません。とりあえずここまで書いたあと、録画回しっぱなしで2時間くらい出かけてみたいと思います。>問題ありませんでした。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)