動画眼3のアップデート 2022年4月

2021年末に公開した動画眼3をちょこっとアップデートしました。

コードサインができたら正式に3.0にしようかなと思い2.9.9としてましたがまだWindowsで実現できてないので2.9.10とします(笑)。なんかよくよく調べても安い証明書でコードサインしたところでWindows上でのセキュリティ警告の出方はほとんどかわらないっぽいのと、現状での反響をみるとデジタル証明書の費用が見合わない気がして…

Mac版は後述の必要性があってデジタル署名してみました。MacとWindowsで別個に年1万円くらいするのが地味に痛いです。なんせ無料配布のソフトなのでご勘弁ください。未署名だと会社のPCにインストールできないよとか具体的なデメリットをご連絡いただければモチベーションになるかも知れません。

ともあれ変更内容と修正内容について説明していきます。

■新機能

SRT形式の字幕ファイルのインポートに対応

SRT形式とは字幕の形式の1つで、実は動画眼2ではこの形式の読み込みに対応していました。Premiere Proが音声テキスト書き起こしにベータ対応した時点で実装したんですが、その後、話者識別フラグ(「話者 1」「話者 2」)が書き出されるテキスト形式を使った方が便利だと気付いて動画眼3ではそちらを使う用にし、SRT形式でのインポートはつけていませんでした。

しかし先日試したNottaというクラウド書き起こしサービスでもSRT形式出力が可能で、より様々な書き起こし手段への対応という観点で復活させた形です。

使い方はPremiere Proテキストの追加読み込みと同じで、「ファイル」メニューの「ログを追加する(インポート)」を開きます(今回「インポート」という文言を足してみました)。「ファイルを開く」ダイアログが開くの下部のプルダウンメニューでSRT形式を選択します。Windows版なら最初から形式選択プルダウンメニューが見えていますが、macOSの場合は左下の「オプション」を押さないと出て来ないのでご注意ください。

macOSでのダイアログ例

SRT形式には話者識別の情報が含まれないので、インポート時点ではすべて話者コード0になります。

自動スクロールの抑制チェックボックスを追加

動画眼3では動画の再生に伴ってメモ一覧が連動してスクロールします。ただ手動でメモ一覧をスクロールした際に、強制的に元の再生位置に戻るのがフラストレーションに感じることもありました。

そこで今バージョンでは自動スクロールをON/OFFするチェックボックスをつけてみました。設定は保存されます。

  • 手動スクロールしたら自動スクロールが解除される
  • 再生地点を移動したらまた自動スクロールが再開される

みたいな制御も検討していますが、どういう形が便利か詰め切れてないので、一旦任意でON/OFFという形にしてみました。ご意見いただければ幸いです。

ちなみに従来でもメモ内容を編集している時は自動スクロールは抑止されていました。

動画編集ソフトライクなJ/K/Lショートカットに対応

Premiere ProやDaVinci Resolve、frame.IOといった動画編集ソフトで一般的なJ/K/Lキーを使った再生制御ショートカットを実装してみました。再生速度をシームレスに加減速しながら視聴するためのシャトルダイヤル的な操作方法です。

  • Lキー:押す度に加速。停止中に押すと1倍速再生。
  • Kキー:停止キー(等倍再生に戻る)。停止中に押すと1倍速再生。
  • Jキー:押す度に減速。停止中に押すと0.75倍速再生。

文で読んでもイメージしづらいかもですが、指3本を横並びのJ/K/Lキーに置いて下記操作をすると幸せになれるかも知れません。

ちなみに動画再生ソフトではJキーで1xから更に減速していくとスローではなく逆方向再生に切り替わります。しかし動画眼3が使用するChromeブラウザのVideoコンポーネントが逆方向再生に対応しておらず、苦肉の策としてスローとなるようにしてみました。必要かどうかは微妙です。

またPremiere ProではKキーは常に停止。frame.IOでは停止からの再生もできるという違いがありました。わかってれば後者の方が便利かなと思いそちらに倣いました。

また各種テキストボックスにフォーカスがある時は聞きません(文字入力になる)。

■不具合修正

ログのインポート後に動作が不安定になるのを修正

別ファイルから追加読み込みした後に件数が多いと重くなってしまう不具合がありました。動作を最適化したのでPremiere Proからの書き出しファイルなど行数の多いデータでも瞬時に終わるようになったかと思います。

Premiere Proの書き起こしデータを読み込む際、話者名を標準の「話者 1」などから変更してあるケースに対応

Premiere Proの書き起こしデータ(テキスト形式)は標準で「話者 1」のようなフラグをもっています。従来この数字の部分を識別して動画眼3上での話者コード(色分け)情報に置き換えていました。しかしこれをPremiere側で事前に変更してしまうと正常に読み込めずクラッシュしてしまうバグをもっていました。

今回、もし数字を拾えなかった場合は一律で0を割り当て、正常にデータを最後まで読み込めるように修正しました。

M1 (Appleシリコン)用バイナリが実行できない問題の修正

macOS用として、M1 (Appleシリコン)搭載機用とIntel搭載機にわけてインストーラーを配布していましたが、前者が「壊れている」といったエラーになり使えない状態でした。現行macOSの仕様で、dmgファイルをローカルで生成してそこからインストールする分には動くのですが、一度サーバーにアップして、ダウンロードしたものを使うとセキュリティでひっかかるという仕様のようです。しかもM1のみ。ので、自分の環境では気付きませんでした。

今回コードサイン(デジタル署名)によって実行可能になったんじゃないかと思います。

言ってもそんなに重いソフトではないのでたいした差はないかもですが、とりあえず初回起動時の最適化がない分、起動が速い気がするくらいです。

内部ライブラリの更新(セキュリティ向上)

直接はユーザが意識することはないですが、内部のChromeコンポーネントが100系となるElectron 18系に更新されました。最適化やセキュリティアップデートも含まれるので、特に新機能の追加がなくても定期的にやっておきたいところです。

OBS Studioでリアルタイム日時を挿入する

先日OBS Studioを使った録画案件でリアルタイムの日時(時計)を入れてほしいという要望がありました。

以前も紹介しましたが、Windowsの場合はSnazという時刻やストップウォッチをテキストデータとして保存しつづけるユーティリティを動かし、そのファイルをテキストソースで読み込む方法がありました。

しかし最近MacBook Proを使うようになり、改めてmacOSでも同様のツールがないか探してみたんですが見付からず。ちょっとしたスクリプトを書けば済みそうな気がしたんですが、ならばと思いついてWebページとしてJavaScript + CSSでデザインも込みで実装しOBSの「ブラウザ」ソースで読み込んでしまえと。

同様の考え方は既にあったみたいで、こちらなど表示形式もカスタマイズできていい感じです。

ただ今回要望のあった日付は入れられないし、CSSもOBS上に設定が必要だったので、URL一発で日時表示ができるページを作ってしまいました。

URLはこちら。>https://do-gugan.com/obs_clock/

デザインはこんな感じです。位置やサイズはOBS側で好きに変更可能。

OBSにブラウザソースを使って日時を挿入

OBS Studioの「ブラウザ」ソースをシーンに追加し、上記URLを指定するだけです。

「ブラウザ」ソース設定例

OBSの内蔵ブラウザでJavaScriptを実行するので、最初に読み込んで表示されてしまえばあとはインターネット通信はなくても良いはず。1秒毎にサーバーに読みに行ったりすることはありません。フォントはGoogleフォントで丸ゴシック系のものを使ってます。白い背景でも見えるよう黒縁をつけています。

現状カスタム性はまったくありませんが、要望があれば日付のON/OFFや曜日表示、カラー変更くらいはつけてもいいかも知れません。あとローカルにファイル一式をおいて読み込むこともできそうな気がするので、GitHubにでも公開しましょうかね。

取り急ぎ現状のものでよろしければご自由にお使いください。(サーバー不調などで予告なく停止していたらごめんなさい)

2022.10.27追記:カラーなどスタイルの上書き方法について

フォントカラーの変更についてコメントいただいたので、OBS側の設定でスタイルを変更する方法について補足します。

OBSのブラウザソースにはCSS(スタイルシート)を上書きすることができ、ここでフォント、色、サイズ、配置などを自由にカスタムできます。「ブラウザ」ソースのプロパティ欄を下にスクロールすると、「カスタムCSS」欄があるはずです。

ここに例えば写真のように「body {color:red;}」などと入れれば赤色になります。

「ブラウザ」ソースのプロパティ画面

CSSの書き方は割愛しますが、現状のソースは以下のようになっているので、必要な部分を上書きする形で記載いただければ良いと思います。

「body{〜}」が全体共通、日付だけの指定は「#date{〜}」、時刻は「#time{〜}」をいじれば個別に調整可能です。

カラーコードはこちらなどでお調べください。

2023.10.19追記:秒表示バージョン

だいぶ前に作ったんですがここに掲載してなかったようです。秒表示が必要な方はこちらをご利用ください。

https://do-gugan.com/obs_clock/with_sec.html

年度末のヘビーなモデレーター業にはコレが効く

皆様、年度末のUT/インタビューラッシュをいかがお過ごしでしょう。

企業の皆様におかれましては年度末の予算消化的駆け込み実査ラッシュにならぬよう、年間計画で実査ペースの平準化を御検討いただけますようよろしくお願いいたします。

ということで恒例の年度末実査祭りで連日喉が潤うヒマもありません。そんな中で最近気に入って使っているのがこちら。

【第3類医薬品】龍角散ダイレクトスティックピーチ 16包

【第3類医薬品】龍角散ダイレクトスティックピーチ 16包

484円(11/24 01:53時点)
Amazonの情報を掲載しています

過去には、ヴィックスドロップやボイスケアのど飴がお気に入りでしたが、実のところ飴の当分でごまかしているだけでさほど効果はないぞ、と教えられ宗旨替えをしました。

カンロ ボイスケア のど飴 70g×4個

カンロ ボイスケア のど飴 70g×4個

945円(11/24 01:53時点)
Amazonの情報を掲載しています

オッサン的には龍角散といえば小麦粉のように細かい散剤のイメージですが、最近の、というか少なくとも「龍角散ダイレクト」のスティックタイプ(2022年2月現在ピーチとミント。マンゴーはトローチタイプなのでご注意ください)については飲みやすい顆粒タイプ。水なしでさっと喉に流し込むと唾液の水分でじわっと溶けてく感じ。飴だと舐めきるのに時間がかかるのであと1分でセッション開始!などという時には口に入れられませんが、本品は飲んだ瞬間に溶けて消える感じなので2,3秒で投入可能です。十数秒喉のあたりに粉っぽさが感じられますが、そのまましゃべることも可能な程度でセッションが始まっても問題ないレベル。眠気の原因になる成分も未配合なのが有り難い。

終日しゃべりっぱなしで喉に負担を感じるモデレーター/インタビューワーの皆様、一度試してみてください。

3画面以上合成できるATEM MINI Extreme ISOを導入しました

最近のUT録画/配信案件ではゲーミングノートPCやM1Max MacBook Proなど高性能ノートPCとOBS Studioを使って実施することが多かったです。特にHDMI-UVC変換がいらないWebカメラのOBSBot TinyシリーズがUTにかなり便利だとわかってからは4Kモデルも追加購入し、かなりシンプルに構成が組めるようになっていました。

ただ今回100セッション超の大規模調査をお手伝いすることになり、さすがに1人で回せないので進行役と機材操作をワンオペでシフト制で回すことなったので、「なるべく決まったスイッチON/OFF」だけで録画管理を済ませられる環境を構築することを目指し久しぶりにATEM MINIシリーズを活用することにしました。ちなみに配信は無し。結果的にOBSもバックアップ系として構築することになりました。

■3カメ合成にはEXTREME/ISOが必要

今回収録する映像は、PC画面(参加者に見せているプロダクト)+2カメラ(表情+α)でした。ATEM MINI/Pro/ISOはHDMI入力が4系統ですが、実のところ一度に画面に配置して合成できるのは2画面までです。1つがベースとして全画面表示、もうひとつはPinPで合成となります。位置やサイズは自由に変えられるものの、ベース画面のどこかに重ねる感じ。これでは今回の要求を満たせません。

これができるのは8入力の上位機種ATEM MINI ExtremeまたはATEM MINI Extreme ISO(以下まとめてExtreme/ISO)が必要です。

発売から2月でちょうど1年。そろそろ新型出るんじゃないかとドキドキでしたが、まぁ同等の機能を4Kでやろうとしたら同じ価格、サイズでは1年では無理だろうと信じて、新型出るとしてもマイナーチェンジ程度じゃないかと思いイヤな時期だけど購入することに。まぁ最悪そこまで値落ちもしないんじゃないかなとか。

Extreme 無印とISOの違いは個別系統の同時録画ができるかどうかです。Extreme無印ではスイッチング操作やテロップを入れた最終結果(PGM出力)のみが録画されますが、ISOだと8入力が独立のMP4ファイルとして残り、後の編集素材、バックアップとして使えます。録画/ストップは完全に連動で、例えば一部を常時録画して取り忘れを防ぐ、みたいな使い方はできないので使う機会はあまりないかなと思ったんですが、各チャンネルの音声も独立でWAVで保存されることがわかったので、そっちは割とあとで「別のマイクの方が音声が聞きやすかった」「うっかり複数マイクをミキシングしたら時間差でエコーになってしまった」みたいなことで役に立つかもと思い、どうせこんだけ出すならということでISOを選びました。購入時はさほど差額がなかったのもあります。残念ながらチャンネル毎に録画するかしないかを選ぶことはできず、なにも繋がっていない系統も真っ黒映像のMP4ができちゃうみたいです。まぁ途中から信号がくるソースもあるかもなので、妥当なところかもですが、なんかストレージと帯域の無駄遣いな気がしますね。それなりに高速なUSB SSDが必要になる点も注意。最近の動作保証リストをみるとSAMSUNGではいつのまにかT7が消えてT5 1TBのみになってるようです。T7の方がスペックは上なんですが掲示板みてるとトラブルが多かったみたいですね。ウチはT5 512GBとT7 Touchしかなくて微妙ですが、ISO録画しない分には今のところどちらもきちんと使えています。

容量的に1TBはいらないですが一般にSSDは容量で書き込み速度がかわることがあるので、これから買うならメーカーが対応を謳っている1TBが無難かも知れません(まぁ以前リストにあったT7がひっそり消されてたりするようですが…)。

・スーパーソースで4画面合成

で、Extreme/ISOはただ端子数が増えただけでなく、内部的にスーパーソースという機能がついたことで4画面を好きにレイアウトすることが可能になりました。1つ1つのHDMI映像やメディアプレーヤーからの画像や動画が”ソース”という呼称なのに対し、スーパーソースはそれの1つ上というかメタな存在であり仮想的なソースでもあります。スーパーソース上に任意の4ボックスを配置し、それぞれに好きなソースを割り当てられます。その結果できた映像を1つのソースとして扱うことができます(スイッチャーの並びの中に「S/SRC」ボタンがあり出力としては同格)。試してないですが、スーパーソースで4画面合成したのをソースとしてPinPなどすれば理論上5画面以上もできるぽいです。

スーパーソース(S/SRC)はソースの1つとして再入力できる

ともあれ、8入力ってなかなかUTでは使い道ないからイラネって思いがちですが、合成が3画面以上というのは割と普通になるので、筐体がデカいのとお値段が張るのが難ですが、やはりExtreme/ISOは汎用性が大きいなと。

・設定の保持により専門外のスタッフで運用しやすくなった

初期のATEM MINIシリーズは本体に設定を保存することができず、毎回ATEM Software Controlから流し込んでやる想定でした。つまり機材に弱いスタッフにいきなり使わせるのはやや壁が高い感じでしたが、今は本体にきちんと設定を保存でき、電源を入れ直しても同じ状態(最後に保存した状態)で立ち上がるので、事前にセッテイングするスタッフがいれば、実査当日は電源オン、RECボタンポチ、で運用しやすくなりました。初代無印だけ保存ができないのか、今はアップデートで対応したのかわかりません。ExtremeでないProでも今は保存ができています。

また少し凝ったことをしようとするとATEM Software Control(PCソフト)から操作する必要があることが多いATEM MINIシリーズですが、Extreme/ISOではマクロボタンが6つ装備されました。マクロ機能は元々ATEM Software Controlからならたくさん作って呼び出すことができましたが、本体からダイレクトボタンで呼び出すことができるようになったのがポイントです。これで大抵のことは操作スタッフがPCソフトを使わずにできるようになります。欲を言えばもう少し複雑なスクリプトが組めるとなおよいのですが。例えばテロップでセッション番号を入れたい、なんて時に「P01」から「P10」というテロップをあらかじめ画像で作ったとして、それを「次へ」「前へ」的に切り替えるマクロは書けません。あくまで「指定した画像を表示する」マクロしか作れないので10個個別につくりボタンも10個必要になります。今回は100セッション超なのでセッション番号を入れるのは諦めましたw。

・ヘッドフォン(モニタ)端子がついた

これがめちゃめちゃ重宝します。マイクの音がどのように拾えて収録でできているか、いままでは

  • 録画してみて、SSDをPCに刺し替えて再生してみる
  • HDMIに外付けモニタ(イヤホン端子付き)をつける
  • USBでPCに入れてOBSなどで聞く(基本PC入力音声をリアルタイムでスピーカーに出すのに向いてない

などが必要でした。Extreme/ISOでは本体背面に直接ヘッドフォンを挿すことができます。

・USBとHDMI出力も2つずつに増えた!

これも地味に制限を取り払ってくれます。USBが1つだと、SSD録画とPCへの映像(UVC出力)のどちらか片方しか使えませんでした。Zoomで中継しながら録画したい、とかは普通にあるので、いままではUSBで録画して、HDMI出力からのPGM出力をHDMIキャプチャアダプタ経由でPCへ、とかやっていましたが、USBケーブルだけで済むようになりました。

しかもHDMIが2系統になったことで、M/Vによる全ソースモニターと、最終出力であるPGMを別々のモニターに映し出せるようになりました。ATEM自体には映像をモニタできるところはないのでM/Vで全体をウォッチするのは重要です(ストレージ残量、録画時間、配信ステータス、レベルメーターなどもM/Vをみておく必要があります)。M/Vのレイアウトも8入力になったことで細分化、カスタマイズ対応していますが、残念ながらレベルメーターなどのステータス画像は大きく表示することができなさそう。

■使ってみて。熱暴走はあるのか?

Extreme/ISOでもっともアイコニックな特徴はHDMI入力が8系統に増えたことですが、実はそこはあまり重要ではなく、上記のスーパーソース、ヘッドフォン端子、USBとHDMI出力が2系統ずつに増えた、といったところが実用性向上に寄与していると思います。正直、入力4のままでいいから中間サイズ/価格みたいなモデルが理想な気もします。Extreme/ISOは多機能なのは良いですが、フットプリントはボタン数がハンパないことになってて、機材弱い人に使ってもらうにはちょっとビビらせてしまうレベルです。カメラコントロール系のボタンもBlackmagic Designのカメラを使ってない環境では無駄でしかありません。でもまぁとにかく入手して設置してみると、あれもこれもできるぜ!な万能感はあります。

もうひとつ懸念だった熱暴走ですが、確かに背面からの排熱はかなりあります。3入力をスーパーソースで合成し、非ISOで録画している状態ですが、背面の排熱はかなりムラがあります。全然熱くないこともあれば温風が出ていることも。室温との相関もあまりないように思います。映像機器なのでファンノイズを嫌って静音ファンにしてあるのでしょうがいささか不安。購入していきなり実戦投入なので安全第一で先人の例に倣ってこちらのファンを同時購入してみました。

これをサイドの吸気口(排気口?)に密着させパーマセルテープで固定して使っています。このファン、吸い出し専用なので、ATEMのエアフローに逆らってる気がしなくもないですが、冷えてる実感はあります。電源を入れるとデフォルトで風量が7になり少し音が聞こえます。たいていはそこまで必要無くて2とか3くらいに落としてほぼ無音にしてても平気。

そもそも一度も熱暴走、熱停止を経験していないので本当に必要かもわかりませんが、処理内容、季節(室温)、設置環境の風通しなどにもよるでしょう。今の現場から回収してきたら自宅であれこで検証してみたいと思います。

■リモート操作に便利なiOSアプリ「MixEffect」

ATEMにしろOBSにしろ、世界中にユーザがいて、サードパーティの支援ソリューションが充実している点も見逃せません。今回、録画機材は衝立の陰に隠して設置し、進行役が自席からREC操作をリモートでできるようにするため、iPad/iPhoneアプリのMixEffectを活用しました。ネットワーク経由での操作になるので、ATEM Miniもネットワークにつなぐ必要があります。客先のゲストWi-Fiを利用する時は有線接続がなかったりするので、自前でルーター持ち込んだり、イーサネットメディアコンバーターが必要かも知れません。

進行役席にスマホスタンドをおいてiPhoneを写真のように置くことで、席を立たずに録画操作ができるようになりました。録画ステータスも目立って確認しやすいです(まぁそれでも見落として録画漏れしちゃいましたがw)。

MixEffectの録画操作画面

ミキサー画面では録音レベルメーターがリアルタイムで確認できるので、これを持ち歩いて実際の参加者席、モデレーター席で声を発しながらレベル調整ができます。写真はiPhone13ProMaxです。iPhone7/8/SE 2世代目など4.7インチ級の画面サイズだとちょっと手狭で上のRECステータスと下のRECボタンをスクロール無しで見渡すのは無理でした。Plus系やホームボタンがない機種の方が良いかも知れません。

MixEffectのミキサー画面

またスーパーソースの画面レイアウトも純正PCソフトのATEM Software Controlよりグラフィカルで使いやすい気がしました。詳しい技術スタッフ以外が操作する時はiPad + MixEffectが良いかも知れません。

6,000円くらいしますがそれだけの価値を感じます。Androidではここまでできるものは見つけられていません(ご存じでしたら是非教えてください!)。

■まとめ

発売当初から「いやいやさすがにこのサイズと値段は…」と敬遠していたATEM MINI Extreme ISOをついに買ってしまいました。ちょうど1年で新型が出ないことを祈るばかりです。

持ち出しにはかなり厳しいサイズなのは間違いないです。非ExtremeシリーズはNintendo Switchのケースがピッタリという話が知られていますが、Extreme/ISOについてはそういう話がなく今後運搬をどうしていくかも課題です。とりあえずこのカバーは注文しましたが納期が長いようです。

ともあれ機能的には大満足。自分のPCを持ち込んで、自分が目の前にいて操作/サポートできるならOBS Studioの方が自由度は高いですが、何日も設営しっぱなしになるような現場で自分のデータを満載したPCを置いていくのは憚られます(さすがに貸し出し専用の高性能PCは常備しづらい)。その点ATEM + SSDなら録画データ以外に現場に残ることはないので安心して残して帰れます。また自分がモデレーターやっていて、録画操作やスイッチング操作を見学者などと分担したいという時や、今回の案件のようにそもそもシフト制で自分がいない日もあるなんて時、あらかじめ設定を組んで保存しておけば電源ONでスタンバイになり、RECボタンで録画開始できるのはOBSよりずっと楽です。

仮にクライアントが自社で一式揃えたいという場合、たぶんまずはOBSを進めると思います。ATEMは複雑な設定に必要なATEM Software Controlがやや専門的でリサーチが本業の人に薦めるのはやや躊躇われます。とはいってもPCもOBSの要求仕様を満足する機種選定から、常にアップデート管理をして正常稼働することを保証するのはそれなりに大変ですし、PCを買うとなると情シスが絡んできて面倒という企業さんも多いのは確か。誰か1人根性いれて操作をマスターして、事前に設定を作れる人がいるのであれば、逆に組まれた設定で起動してRECポチするまではATEMの方が断然楽。そんな事情毎の最適解があるような気がします。

道具眼ではそうした機材コンサルや設定補助、操作方法の勉強会なども随時受け付けておりますので、是非ご相談ください。

OBS StudioをUTで初めて導入したい人向けの資料も公開してますが、そのうちATEM MINI版も作れるといいなと思います。

■次期モデルに期待すること

一番欲しいのはXLR入力かなぁ。同社のカメラみたいにミニXLR端子でいいので今のマイク入力の代わりにつけるか、なにかしら外部拡張ポートみたいなので対応してくれると有り難い。なんだったらUSB端子にオーディオI/Fでつくようにしてもいいかも。

USBといえばWebカメラ入力もできたら神。絶対買い換える。HDMI x4 USB(UVC) x2くらいで。究極全部USBでWebカメラとUSBマイクつなぎまくれるようなのも面白いかも。

あとMixEffectのようなツールがより手軽に使えるようWi-Fiは載せてほしい。そしてプレビュー画面もストリーミングで流せるとなお良し。

また実務ではあまり必要ないですが、個人的には4K対応は欲しいなと思います。仮に合成や録画、配信は4K非対応だとしてもHDMI入力は4K対応でクロップして使えたりするだけでも意味はあるかなと。でもまぁ仮にExtremeの機能をすべて4K対応しようとすると値段は当たり前ですが処理プロセッサの発熱がエラいことになるので冷却系統にも余裕をもたせる必要が出てきて巨大化したり、爆音化してしまいそうな気はします。今のサイズでやろうとしたら3-5年はかかりそう。

最適化という意味ではスーパーソースついて、USBとHDMI出力が2系統、ヘッドフォンを維持しつつHDMI入力は5系統止まりくらいのちょい小型モデルがあると嬉しいですね。

YoloBoxみたいなモニタ一体型ソリューションも考えてたりするんですかね。これはこれでいいかも。

YOLOLIV YoloBox Pro ライブストリーミングエンコーダー

YOLOLIV YoloBox Pro ライブストリーミングエンコーダー

125,400円(11/24 22:30時点)
Amazonの情報を掲載しています

Raspberry Pi 4でUSBカメラ映像をHDMIに変換できるか実験(ATEM Miniと使いたい)

最近、ユーザテストの撮影用カメラとしてOBSBot Tinyが小さくて画角調整がしやすくて大変気に入っています。この製品はUSB接続のWebカメラなので、PCでOBS Studioなどで録画/配信するには適していますが、HDMI入力しかないATEM Miniシリーズには使えません。

そこで、Raspberry Pi 4(以下RP4)でUSBカメラとして認識してそのリアルタイムスルー画をHDMIというかX上でフルスクリーン表示すればATEM Miniシリーズでキャプチャできるんじゃないかという発想です。しかもRP4にはHDMI出力が2つあります。複数のUSBカメラを接続し、それぞれを個別のHDMI出力に出せれば、2カメを1台のRP4で変換できるんじゃないか、とか。

■RP4の設定

今RP4は半導体不足の煽りで品不足、価格高騰気味なようですが、幸い少し買ったものがありました。

確か1万強くらいだったと思うので、お急ぎでない方は価格が落ち着いてから買った方がよろしいかと思います。

ケースはこちら。RP4のボードより一回り大きくなりますが、内部変換ケーブルによってフルサイズのHDMIポートが2つになる点が魅力です。

+1,000円でUSB電源アダプタが付属するセットもあるようです。自分は当初適当なUSB充電器を使えばいいやと買わなかったんですが、実際にUSBにWebカメラを接続してキャプチャしたりすると電圧不足警告が表示されました。一般的な非PDの5V充電器だと2.0Aが上限なので、やはりRP4に売られている3.0Aのものを買った方が良さそうということで結局追加しました。少し割安なので最初からセットで買うのがオススメです。

また派生モデルとして下部にM2 SSD(USB接続)を追加したモデルもあるようです。録画なども考える場合はこちらも良さげです。

ウチはとりあえずこちらのSDカードでセットアップしました。

小さいmicroSDは「あれ、どこいった?」となりがちですが、そんな時この水色のカラーが目立つので扱い易いです。

■OSインストール

ちょうどRaspiOSの64bit版が正式扱いになったというニュースをみたので、これを機に新規セットアップしました。公式から2022-01-28-raspios-bullseye-arm64.zipを落としてきて解凍し、これまた公式ツールのRaspberry Pi Imagerを使ってSDカードに展開しました。

当初X-WindowのないLiteで軽量なシステムを構築できないかもトライしましたが、色々ツールを入れるのが大変で断念。キーボードやらネットワーク設定やらもひと手間です。結局あきらめてフルバージョン(X-Windowsあり)で仕切り直し。結果的に必要なツールは揃っており苦労なく表示できました。

■USBカメラの映像をウインドウに表示する

当たり前っちゃ当たり前ですが、OBSBot tinyの初代および4Kモデル双方とも差すだけで認識しました。

表示ツールはVLCなども試したんですが遅延が大きく、ffplayがマシという感じです。ただしフルHDにするとかなり遅延が出てATEM Miniへの入力ソースとしては致命的。1280×720ならほぼ気にならないですがフレームレートは10fpsに強制的に落とされてしまいました。

起動はターミナルからこんな感じ。

-iで入力デバイス。OBSBot Tiny初代と4Kを同時に挿した場合、それぞれ/dev/video0と/dev/video2にアサインされました。

-video_sizeは1280×720や1920×1080のように書いてもいいですし、hd720、hd1080のような略記も使えます。

-anは音声無効化、-fsは全画面表示です(ESCで終了)。

-framerate 30などとつけるとフレームレート指定ができますが、hd720でも強制的に10fpsに落とすよ、というウォーニングが出て上書きされてしまいます。

実験したところ、サイズをwvgaにすると950×540になり15fps、vgaなら640×360で30fpsになりました。30fpsあると明らかに残像感がなく綺麗ですが、遅延としては差は感じません。HD720/10fpsかWVGA/15fpsが実用上バランスが良いかなと思います。

正直もうちょっと行けるかと思ってたんですが微妙な結果でした。もしかするとハードウェアデコーダーを使うなど何かしら設定で改善する余地もあるかもですが、吊しの状態だとこれが限度でした。

追記:

オプションでMotionJPEGを明示したところ改善がありました。v4l2-ctlコマンドで対応コーデックを調べたところ、こんな結果が。

先に書いた上限値はYUYVモードのもののようで、MotionJPEGとH.264ならばMax 60fpsが目指せそうだったので追加検証してみた結果、

  • H.264は重く、MotionJPEGが良いカンジ
  • それでもフルHDは遅延発生

ということで、現状のベストコマンドは、

ということになりそうです。これで30fpsになりました。-framerate 60を明示的につけるとlow voltage警告が出て絵が止まったりシステムがフリーズしたので、こちらは別途3A電源が届いてから実験します。とりあえず720p/30fpsが出ればATEMなどでPinPするソースとしては充分かなと思います。

・デュアルディスプレイに同時表示は無理そう

残念ながら1台のRP4でHDMI 2系統にそれぞれWebカメラ映像を出すことは現状ダメぽいです。上記の限界があるので単純に負荷2倍だと厳しいというのもありそうですが、どもそもffplayが現状マルチストリームに対応してないようです。別々のターミナルから同時起動しても、最初のプロセスを閉じるまで2つ目が開かない感じです。

■まとめ

Raspberry Pi 4を使って、USB接続のWebカメラを簡単にHDMI出力デバイスとして扱うことができました。ただしせっかくHDMI出力が2系統あるRP4でも並行出力は無理そう。そろそろ日本でも出回るRaspberry Pi Zero 2で同等のことができるなら、Webカメラ1台ごとにこちらを装着するのも良いかも知れません。結局電源がいるという意味ではビデオカメラを使うのとかわらないですが、物理サイズが大きく違うので、運搬が楽になったり、撮影中の存在感を減らすことができる点はメリットかと思います。なにか3DプリンターでOBSBot Tinyと一緒にマウントできるケースを作ってみたいです。

今後の課題としては、

  • 電源オンでHDMIに全画面出力が出るところまで起動処理の自動化
  • SDカードを損耗を防ぐためにシステムのRead Only化
  • 長時間耐久テスト

などを行っていきたいと思います。

Wireless GOを首から下げるアダプタDIY

前記事でWireless GOの新クリップオプションも評価しましたが、やはり次々と使用者が入れ替わるユーザーテストや商品インタビューのような用途ではネックストラップが一番手早いなということで、ワイゴーを首から吊すための方法を検討しました。

なお、UT/インタビューが捗りまくりなRODE Wireless GO2のレビューはこちらをどうぞ。

■首から下げるための様々なトライアル

Wireless GOシリーズは背面に胸ポケットなどに留めるクリップがついています。ぶっちゃけ適当な紐をここにひっかけて首に下げれば済むっちゃ済む。

ただマイクをできるだけ口元近くに持ち上げる為、こういう長さ調節機能のあるストラップを使いたかったのです。

ソニック ストラップ 多機能 丸ひも ストラップ 青 MH-223-B

ソニック ストラップ 多機能 丸ひも ストラップ 青 MH-223-B

390円(11/24 21:27時点)
Amazonの情報を掲載しています

このストラップは本来社員証やカードキーを首にぶら下げるためのもので、先端の様々なパーツが選択可能になっているのですが、Wireless GOに留めるにはどれもイマイチでした。

(余談ですがこのストラップの紐は材質がPETとなっています。ポリエステル記事にアレルギーがある人にはあまり適さないかも知れません。そういう対象者が現れ、かつ襟のない服だった時のために代替手段を用意しておくと良いでしょう。自分も綿とかの素材のものを探してみようと思います。)

まず簡単なのはマグネットでつける方法。Wireless GO用のオプションでMagClip GOというのがあります(上述のFlexClip Goにも含まれます)。

これはクリップ部分にとりつける金属プレートカバーが含まれており、取り付ければ下の写真の白いRODEロゴがある部分が磁石のくっつく鉄板になります。

ホームセンターで入手できるパーツで自作したアダプタ

ということで、それを利用したものが上の試作治具です。右はただの金属プレートにリングを通したもの。これ自体に磁石がつくので、MagClip Goの磁石の両面にこれとWireless Go本体をサンドしてくっつけます。MagClip Goの磁石はかなり強力なのでバチーンと固定できます。ただ金属プレート+金属リングがカチャカチャ鳴ってマイクが拾ってしまう可能性がありそうで微妙。

次に作ったのが左のネームプレートに磁石を両面テープ止めしたもの。

ソニック 白 番号札 小 無地 10個入NF-751-W

ソニック 白 番号札 小 無地 10個入NF-751-W

184円(11/24 17:37時点)
Amazonの情報を掲載しています

MagClip Goが2,300円ほどすることを別にすればかなり安上がりです。見た目はアレですがプレートを黒く塗ればマシになるでしょう。逆に初代Wireless GOのホワイトモデルの人はこれもアリ?

既にMagClip GOをもっている自分だけならここで満足するのもアリでしたが、ちょいちょいクライアントにも推奨機材として紹介するので、MagClip GO抜きで実現できるソリューションを開発したいと思いました。また強力なマグネットは時としてトラブルの元にもなるので、マグネットフリーにしたかったという理由も。

■3Dプリンターで自作!

といことでお正月休みを使って久々にCADソフトを使って設計してみました。ワンオフなのでプラ板や金属板などをカットして作ればいっか、と思っていたんですが、よくよくWireless GOを眺めると背面のクリップ付け根部分は無駄に(?)複雑な造形をしていて、綺麗に沿わせるにはCAD使った方がいいかなと。

FreeCADを使用。昔使ったFusion360よりとっつきづらかった…

3Dプリンターはないので.STLデータをDMM.makeのプリントサービスにアップロードして出力注文。毎度素材選びには悩みまくりですが、とりあえずある程度弾性があって割れにくそうなもので、短納期、低価格だったMJFという素材をチョイスしてみました。ナイロンベースの粉末素材を薬剤で固めてつくるようで、積層痕も目立ちにくいようです。研磨オプションは素材の厚み的にギリギリだったのでつけずで、表面は結構ザラザラしています。お値段は1,890円でした。量産品ではないのでまぁこんなものでしょうか。最近は機材を自前で揃えたいクライアントの相談に乗ることも多いので、その時にWireless GOリシーズを選定させていただいたお客さんには1つサービスで進呈してもいいかなくらいの価格です。

3Dプリンターで自作したアダプタ(Do-guganロゴ刻印入り)

上述のストラップと組み合わせてWireless GOに取り付けてみた感じ。横幅を本体幅にあわせたのでいい感じ。ストラップに付属しているフックやループパーツは使用せず、直接固定されているプラリングを使ってぶら下げています。

WirelessGO2に装着した状態

ロゴの部分をクリップで挟み込んでいる感じなのでガタついたりもしない感じ。ただ長時間身につけていると多少はズレて傾いたりはするかも。穴のサイズをもう少しギリギリに狭めればいいんでしょうが、手元に3Dプリンターがなく、毎回上記コストと数日の時間がかかるので一旦はこのままかな…壊れたりなくしたりして再発注する際にはもう少し調整するかも知れません。

首下げイメージ

実際に首に下げてみた感じ、しっかり上面のマイクが常に上を向く感じで良いです。

実際に実務で使ってみて、

  • すぐに壊れてしまわないか
  • マイクに擦れ音などノイズが入らないか
  • 向きがズレていったりしないか

などを評価していく予定ですが、とりあえず欲しい!という方のために、DMM.makeのクリエーターズマーケットというサービスがあり、3Dプリンターの知識がない人でも簡単に素材や色を選んで注文できるようになっていますので、そちらでの出品しておきます。

またご自身で3Dプリントできる環境がある方向けに生STLデータはGitHubに公開しておきます。充分な検証はしていませんが、as isでお使いになりた方はどうぞ。

2023.2.7追記:自宅量産可能になったので頒布受付します

自宅に3Dプリンターを導入しまして、簡単に出力できるようになりました。ご希望の方には送料程度で頒布したいと思いますので、コメントなどでご連絡いただければと思います。

材質はいまのところPETGというペットボトルなどにも使う透明樹脂で出力しています。一般的なPLA素材よりは弾力があって割れにくいんじゃないかという判断です。ので半透明というか濁った白です。使える素材、色はその時のフィラメントの在庫にもよるのでご相談となります。

Wireless GOの追加クリップ3種 FLEXCLIP GO

昨年の実査でも大活躍だったRODEの小型ワイヤレスマイクシステムWireless GOシリーズに新しいクリップパーツが追加されました。既発売だったマグネット式おMagClip GOを含む3種類の固定具がセットになったFLEXGCLIP GOです。

MagClip GOは単品で販売されていたものとほぼ同じですが、マグネットプレート側の質感、デザインがやや変わっています。

CrossClipは前留めのシャツの合わせ目にはさんで留めるタイプのクリップで、右前でも左前でも対応できるように左右にクリップが対になってついています。

VampireClipは安全ピンが2本、牙のように生えていることに由来するネーミングなんでしょうが、ちょい微妙でした。

自分がそうでしたが写真ではどう使うかいまいちイメージがわかない方もいると思い、元旦早々動画撮ってみました。

一日に何人も参加者が入れ替わるユーザテストや製品調査系のインタビュー業務では、標準クリップも含めどれもイマイチで、結局ネックストラップで首からさげてもらうことが多いです。ただこれだとWireless GO本体がおじぎしてマイクが口を向かなくなってしまったり、ストラップを付け外しするさいにWireless GOが外れて床に落ちたりということが頻繁に起きるので、今年は自作のストラップ吊り下げ治具を作成したいと思っています。

動画眼3の公開ベータ版をリリースしました

2022年、あけましておめでとうございます。

秋ごろから取り組んでいた動画眼の新バージョン、動画眼3の公開ベータ版をリリースしました。なんとか2021年末を目標にしていましたが、やたら仕事が立て込んできて、仕事納め後に最終調整して大晦日も作業していたんですが、結局日をまたいでしまったので元旦リリースとしました。

残念ながら正式版としての公開は間に合いいませんでしたが、機能的にはほぼ完成していて、この後は配布方法の調整(ストアで配布するかとか)になりそうなので、まずは気軽に試せるインストーラー形式でも配布しておくという意味もあって一旦ベータ版として出すことにしてみました。是非お試しいただきフィードバックいただければと思います。

2022.1.7追記:

GitHubリポジトリも公開しました。改善要望やバグレポートなどはこちらのIssuesに直接投稿していただいてもOKです。

■ついにMacに対応!

2019年にフルスクラッチで再構築した動画眼2から2年半でまたもフルスクラッチした動画眼3の最大の見どころは、ついにmacOSに対応した点です。ElectronというWeb技術をベースにしたプログラミング環境に移植することで、ほとんど追加の手間なくWindows用とMac用に両対応させることができるようになりました。自分でもMacを使うことが増えてきていて、Windowsでしか使えない動画眼2をメンテナンスするよりも、ここで頑張ってまたゼロから作り直す手間をかけてもElectronベースに移行しておこうと決心したのです。現時点ではようやく動画眼2相当の機能を盛り込んだというレベルで、2->3になって新しくできるようになったことはそれほどないんですが…

両対応するにあたって、各OS標準のキーボードショートカットとのコンフリクトを避ける意図で、従来シリーズのショートカットから一部変更になったものがあります。特に再生、一時停止のCtrl + SpaceはmacOSではIMEの切り替えなどで使われるので、今回、前後スキップのCtrl + Q/Wと並んでCtrl + Eに変更してみました。個人的には左手小指をCtrlキーにおき、薬指、中指、人差し指をQ/W/Rキーにおいておくとなかなか効率が良いかなと思います。ただし左Ctrlキーが左Shiftキーの上にないWindowsの日本語キーボードユーザも多いと思うので、今後なんらかの手当(ユーザカスタマイズなど)を検討したいと思っています。

またElectronは内部的にはブラウザのChromeを丸まる抱えているような構造で、メディア再生周りもHTML5技術ベースになります。その影響で、対応可能な動画形式がかなり限定される結果となりました。ただデファクト中のデファクトであるmp4は問題なく扱えるので現実としてそう困ることもないかなという割り切りです。またブラウザベースでインストール不要の動画眼Liteを活用するための推奨動画フォーマットはmp4となるので、ご理解いただければと思います。

正式版までの目標

今後、動作検証も兼ねて自分でも実務で使い、細かい調整やバグ修正をしていきつつ、正式版では以下の点を目指しています。

  • コードサイニング証明書によるデジタル署名
  • 自動アップデート機能の実装

1つ目は主にインストール時の警告抑止のためです。Windowsだと結局ダウンロード実績がないとSmart Screen警告が出てはしまうのですが、一応身元表示が出るだけいいかなと。また最終的にMicrosoftストアやMac AppStoreなどでの配布も視野にいれており、そのためのマイルストーンとして念願のコードサイニング証明書取得にむけて手続きを進めているところです。

2つ目は、やはり当サイトを熱心にチェックいただいてる方ばかりではないと思うので、アプリを起動するたびに自動的に新バージョンをチェックしてお知らせするようにしたいと思います。実はこのためにもコードサインが必要だったりして、1つ目とセットで今後の課題としています。

■動画眼のその次

動画眼は基本的に動画ファイルに対してメモをチャプターとして打ち込んでいくツールで、UTやインタビューの事後分析のためのツールです。セッション中にリアルタイムで入力するために動画眼Noteがありますが、今後はこれを大幅に刷新していく予定です。単にセッション中の記録だけでなく、事前のタスク設計や事後のまとめ作業などUT実務のより広いプロセスをカバーする統合ツールを構想しています。これこそWin/Mac両対応にしたいと思っての、その練習として先に動画眼3に着手したようなものです。Electronにもだいぶ慣れてきたので、今年はいよいよこちらの新ツールにも取り組んでいきたいと思います。

今年もよろしくお願いいたします。

今年UT/インタビューに導入して良かった機材紹介 2021

今年は後半にちょいちょい会場実査を実施できるようになってきたものの、やはりトータルとしてはリモートが多かったです。基本、会場だとハード、リモートだとソフト面での機材やノウハウが中心になりますが、それぞれについて「今年これが役に立った!」というのを紹介してみたいと思います。

■ハードウェア編

OBSBot Tiny(パンチルト制御できるWebカメラ)

まだ2実査ほどしか使ってないですが、個別記事をまだ書いてなかったのでここでトップに挙げておきます。

Webカメラです。普通のWebカメラとの違いはパンチルト(上下左右に向く)機構がついている点と、それを使ってAI画像処理で人物を自動で追いかけてくれる点。アギレルゴの川口氏が使ってみたけどイマイチだったということで譲り受けました。

通常UTやインタビューでビデオカメラ撮影する時、三脚雲台でアングルを調整したりすると思います。しかし参加者が姿勢やデバイスの持ち方を変えるとちょいちょい画角から外れてしまい再調整を余儀なくされがち。そういう時に、電動でリモート制御できるPTZ(パンチルトズーム)カメラだと便利です。UTラボなんかだと天井についていたりしますね。あぁいう製品は監視用カメラの流用だったりして大変お高いですし、一般会議室にポっとつけられるものでもありません。映像信号やコントロール信号も特殊でPCに直接つなげられないことも多いです。

ところがこのOBSBot TinyはUSBケーブル1本で映像音声は普通のUVC/UAC接続のWebカメラである上、専用ユーティリティをPC/Macにインストールすれば簡単に操作ができます。ありそうでなかった大変レアな製品です。映像音声とパンチルト制御は独立しているので、映像音声をOBS StudioやTeams/Zoomなどに入力しているのと全く独立に制御可能です。OSB Studiの場合、映像ソースのプロパティ画面からもPTZ操作可能です。さらに専用ユーティリティで各操作にキーボードショートカットがついていますので、Bluetoohtキーボードや後述のマクロキーパッドを使って離れたところから操作もできます。例えば、OBSBot Tinyと録画配信用PCはインタビュールームに置きつつ、Bluetoothが届く隣の部屋から見学者がカメラ操作する、なんてユーザビリティラボみたいなことが実現できるのです。少なくともPCがモデレーターの手の届くところにあれば、カメラ+三脚のところまで歩いていって調整する必要はなくなります。

実のところAI自動追尾機能はまだ実務では使用していません。誤動作したらイヤだなと。ざっと試した限り、追跡自体はそこそこ正確だと感じますが、顔を画面のどのいちに持ってくるのかが制御できません。通常UTやインタビューでは身体全体ではなく顔だけを抜いて画面の片隅に入れたりすることが多いですが、こいつのAIが顔を画面の中心にもってくるのか、身体全体でセンタリングするのか、みたいなところがコントローラブルではない上に、仕様でもあまり触れられていません。川口氏曰く身体を基準にしてるっぽいとのこと。なんで、画面の一部を切り抜いて使用するには厳しいかなと。顔の位置を決まったサイズ、決まった位置にして追ってくれるなら有り難いんですけど。

なおユーティリティで自動追尾は無効にできるので、完全にPTZ Webカメラとして使うことができます。この状態で使ってみましたが、途中で不具合を起こすこともなく快適に使用できました。デジカメ+HDMIキャプチャなんかよりよっぽど安定感あります。これで光学ズームがあれば最高ですが、最近海外で販売開始された4Kモデルならば電子ズームでも充分な解像度が出ると思うので、国内販売が始まったら買ってみようかと思っています。

ちなみに海外ではパンチルトズームに使えるリモコンも売られてるようですが、Bluetoothで技適をとってないのか国内の代理店からは販売されていないようです。またOBSとついてますばOBS Studioとはなんの関係もありません。

USBの規格上の制限としてケーブル長を4mくらいまでしか延ばせないという問題がありますが、それ以外ではもうビデオカメラいらなくね?と思える優秀な製品です。

RODE Wireless GO2(ワイヤレスマイク)

今年一番活躍しました。詳細は個別記事にて。簡単にいうと、1つの受信機で2台の小型ワイヤレスマイクを受けられるインタビュー向けのマイクシステムです。進行役と参加者それぞれが胸元に装着しておけば、バウンダリーマイクよりも明瞭に音声を拾えます。またマイク内にメモリが内蔵されて録音もできるので別途バックアップ用ICレコーダーを用意しなくて済みます。

AZ Macro (マクロキーパッド)

テンキーより更に少ないボタン数に絞った特定用途向けの小型キーボードのことをマクロキーパッドと呼びます。PhotoshopやPremereのようなやたらツールがたくさんあるソフトやゲームなどの操作を支援するものです。多くの製品はUSBキーボードとして固定のキーコードを発するもので、ソフト側でショートカットアサインをあわせたり、AutoHotKeyのようなユーティリティを使って変換したりします。一部の製品はファームウェアをいじって設定を書き込める場合もあります。

しかしこのAZ Macroは手軽なWebベースの設定システムを持っていてブラウザから簡単に各キーがどんなキーコードを送出するかをカスタムできます。

これを使って、

  • OBS Studioのシーンを切り替えたり録画開始
  • 上記OBSBotのパンチルト操作
  • Zoom、資料パワポ、進行シート、記録エディタなど狭い画面に様々なウインドウがひしめくオンラインインタビューで、「(例えパワポがバックグラウンドにいても)1キーでスライドを1ページめくる」みたいなマクロを実行

などの操作を1ボタンで実行できるようになり、よりスムーズなセッション進行を手助けしてくれました。さらにこの製品はBluetoothキーボードとして動作するので、少し離れた場所から進行役以外の人がさりげなく操作をすることができたりもします。同人ハードなどで入手性にやや難ありですが利用シーンがピンとくる方は是非チャレンジしてみてください。自分でハンダ付けするDIYキットと完成品が選べます。

■ソフトウェア編

XSplit VCam、Audio Hijack + Loopback

今年は久ぶりにメインPCをMacにしたので、いままでWindowsで愛用していたNVIDIA Broadcastが使えなくなりました。そこで、単体のバーチャル背景ツールとしてXSplit VCam、マイクノイズ除去ツールとしてAudio HijackとLoopbackの組み合わせを導入。これでリモート案件もMacでつつんがなくこなせるようになりました。(バーチャル背景なんて今時ZoomにもTeamsにもビルトインで実装されてるじゃないか、とお思いかも知れませんが、業務用のインタビューシステムではついていないことも多いのです…)

AutoHotKey

Windows専用になりますが、あるキー入力に対し、別のキーイベントや特定の操作をプログラムできるフリーソフトです。カメラや配信ツールの制御をしたり、オンライン会議のミュート操作、インタビューに相手に提示する写真や動画、スライドの切り替えなど、色々な制御を自動化、ショートカット化できます。きちんと体制の整ったチームで仕事をするなら作業分担もできますが、私はワンオペなことも多く、事前にこういうツールを駆使して仕込みをしておくと本番中に楽ができます。AutoHotKeyはプログラミング的な素養が必要かも知れませんが、とても多くのことができる良ツールです。

動画眼Lite

手前味噌で恐縮ですが、動画ファイルに頭出し用のインデックスをつける拙作「動画眼」シリーズに、専用アプリのインストールを必要とせずブラウザ上で簡単に閲覧(のみ)できる「動画眼Lite」をリリースしました。

動画眼でデータを作る必要がありますが、Lite形式出力したhtmlファイルを動画といっしょに渡すだけで、相手方は動画眼をインストールせずとも、またMacであってもチャプター付き再生をすることができます。ソフトウェアのインストール制限がある企業さんで重宝するかなと思って作成し、実際にいくつかの案件で納品ビデオデータにこれでチャプターを入れてお渡ししたところ便利だとご評価いただきました。

現在、このデータを作成するための動画眼もWin/Mac両対応となるVer3を準備中です。年内に出したかったけどちょっと厳しい雲行きになってきたかな…もう少々お待ち下さいませ。

■まとめ

コロナ禍で急遽リモートでユーザーテストをしなくちゃとなった昨年からだいぶ経って、自分達も、リクルーティング会社もそして参加してくださる方達やリモート見学するクライアント側も色々と知見が貯まって色々とスムーズに回るようになってきた感があります。それでも、より会場実査に近い形で例えばハードウェア製品を使って評価してもらうことはできるか?などと意欲的な要望もいただいたりとチャレンジは続きます。

会場実査は会場実査で、感染対策をしつつ見やすい/聞きやすい配信を見学者にお届けする工夫や新しい技術は毎回頭をひねりながら試行錯誤しています。

上に紹介したような製品は良さげだけど使いこなせる自身がないという方は是非ご相談いただければと思います。リサーチ案件としてだけでなく機材支援のみでもお受けしておりますので、「タスク設計や進行役は自前でやれるので、配信だけ手伝って」みたいな案件も歓迎です。

来年もどうぞよろしくお願いいたします。

『ユーザーインタビューのやさしい教科書』連動動画Vol.2公開と裏話

『ユーザーインタビューのやさしい教科書』の連動解説動画の第二弾公開しました!

今回もなかなか見る機会がないと思われる、インタビューガイドの作成(仕上げ)の模様をライブっぽく収録したものになります。著者の1人、奥泉さんが作ったドラフトを元に、他の著者陣で議論をしながらブラッシュアップしていくという内容。第一弾では割と事前に打ち合わせをして、どこをどう直すというのをシナリオで決めておいてコンパクトにまとめましたが、その過程で、「この打ち合わせ自体をコンテンツにした方が有益なんじゃね?」という気付きがあり、今回は打ち合わせなしのぶっつけ本番で撮ってみました。おかげで90分くらいのボリュームになってしまい、編集担当の私は大変でした、、それでも40分とかになってしまい恐縮ですが、一言一句漏らさず聞くというよりは、現場ってこんな風に改善してくのねという雰囲気だけでも感じでもらえればと。一応ポイント的なところも頑張ってチャプターを切りましたので、概要欄にあるリンクから見返したいところにとんでいただければと思います。

■技術的な裏話というかメモ

今回も緊急事態宣言下で完全リモート収録だったんですが、話者が2人->4人に増えたりして色々大変だったので次回のためにも記録を残しておこうと思います。内容に関係ない技術的なお話なのでご興味のある方だけどうぞ。

収録はTeamsのNDIエクスポートを使用

普段著者陣の会議はZoomですが、この時だけは慣れないTeamsを使ってもらいました。その理由はTeamsがNDIというIPベースの映像出力規格に対応しているからです。しかも参加者毎、および画面共有の個別で取り出せます。

やり方は以前の記事で紹介しています。

普通にZoomやTeamsの録画機能で撮ったり、会議画面をスクリーンキャプチャで撮ると、レイアウトの自由度が制限されてしまいます。そこでNDI経由で個別のストリームをOBS Studioに入れ、今回のようなレイアウトを組んだ状態で(OBSで)録画しました。通信量や処理的には結構重たそうですが、光回線 + Ryzen 3900 + RTX3070機で割と普通にいけました。

回線状況で受信解像度が変化しても表示サイズを一定に保つ

Teamsの仕様上、通信速度が遅いと解像度が動的に変化してしまい、OBSに入力されるストリームの解像度も大きくなったり小さくなったりするので、OBS上で常に固定サイズ、固定位置で表示されるように設定に苦慮しました。

各参加者のNDIソースを右クリックして「変換の編集」ダイアログを出し、位置揃え、バウンディングボックスの種類/配置をそれぞれ「左上」「境界の幅に合わせる」「中央」にしました。

OBSの「変換の編集」内容

あくまで個別ストリームなのはTeams->OBS間の話で、それぞれを個別に録画をしたわけではないので、後の編集耐性のため、OBSのキャンバスは4Kにして、極力高解像度のまま録画するようにしました。

音声周り

最近のOBS StudioはRTX Broadcastの強力はノイズキャンセルをフィルターとして活用できるようになっています。なので、周辺雑音がひどい参加者がいる場合、個別にフィルターをかけることができます(同時処理ストリーム数が不明で、何人まで個別にかけられるかは不明)。ただTeamsのNDI出力の場合、音声は各ストリームに録画者以外の声が全員分載ってきてしまうようです。なので、後から「この人の声だけ大きく」ということは基本できません。ナノで音量バランスは事前に確認をして各自の送信音量を調整してもらう必要がありました。

また「録画者以外」と書きましたが、当然ながらローカルでしゃべってる自分の声は送信されることはあれど受信で返ってはきません。なので自分の声だけは別途OBSにも取り込んでミックスする必要がありました。自分の声だけはネットワーク経由しないのでもしかすると若干音質が良かったりするかも知れません。ちなみに画面共有も録画者のPCからはできない制約があります。完璧を期すのであれば、参加者と録画者のPC/Teamsアカウントは独立にした方がいいかもです。

結局、OBS上では、

  • 話者1のNDIストリーム音声
  • 話者2のNDIストリーム音声
  • 画面共有NDIストリーム音声
  • ローカルのマイク音声(自分の声)

くらいをマルチトラックで録った気がします。NDIストリームの音声は基本どれも同じ(自分以外の全員の声)なんですが、フィルターの掛け方を変えたり、音ズレがあったりで保険として機能した感じです。別トラックに録ったので、後で個別に取捨調整ができます。間違えてもこれらをミックスで録らないのが重要。

例えばノイズキャンセルですがRTX Broadcastは強力すぎてキー打鍵音はマウスクリック音も完璧に消し去ります。今回は画面共有したWordファイルを編集しながらという映像なので、逆に打鍵音やクリック音はあった方が自然だなと思い、結局NCかけなかったトラックを採用し、後処理で可能な範囲でノイズを低減しました。

画面共有ストリームのズレ

どのストリームがどれだけズレてたのか正確に記憶してませんでしたが、OBS Studioに集約して録画したデータをみると、画面共有ストリームだけズレがあることがわかりました。顔同士はピッタリ、音同士もズレはなく、画面共有か顔映像のどちらかが音声にあってるような状態でした。音は独立でズラせるのでどっち基準でもいいんですが、リップシンクをとると、同じ音声トラックに入っている打鍵音はクリック音がどうしても画面共有とズレてしまい違和感が出ます。

これはPremiere Pro側で映像を2レイヤーに複製し、画面共有部分だけをくり抜いたものを時間的にズラして重ねる、という技で凌ぎました。つまり4K映像x2枚(実質1.6枚くらい?)くらいの処理が必要になり、先述のスペックのPCでもかなりしんどかったです。編集時のタイムライン移動時にもデコードが追いつかずカクカクしたし、最終の4Kエンコードも40分ソースが10時間くらいかかりました…(なぜかGPUが使われずほぼCPUエンコードされてたっぽい)。普段の編集時は画面のズレには目をつぶって補正したレイヤーを非表示にして作業し、最後のエンコード段階でのみ表示に戻すという感じで凌ぎましたが、次はプロキシを作ってしまった方がいいかも。

Adobe StockでBGMを購入

いつもなら無料BGM素材を「甘茶の音楽工房」さんなどでいただいてくるところですが、今回は少しこだわろうと思ったのと、先日受講したPremiere ProのセミナーでAdobe Stockからの直接インポートを学んだのを使ってみたくてAdobe Stockを使ってみました。Premiere Proの画面上で直接映像とあわせて色々なBGMを試聴できるので強力です。楽曲自体のバラエティや品質もやはり有料なだけあるという実感。キーワードも日本語で売ってもきちんと英訳された候補が挙がってくるので、かなりの選択肢があります。

とはいえ1曲実質1,200円ほどするのは個人の趣味範囲で利用頻度も一定しない身からするとちょい高いですね。クレジットパックも6ヶ月の利用期限があるので、あまりお得だからと大きなものを買っても使い切れるかというところです。CCのサブスクリプションに月1本分でいいからライセンス付与してくれないですかねー…

あと面倒なのはAdobe上はきちんと料金を支払ってあっても、Youtubeでは一旦不正使用の疑いがかかり、Adobe側で取得できる認証キーをコピペして権利を証明しないとフラグが消えない点です。公開が差し止められたりまではしないですが、管理画面上に出続けるのでなんとなく気分を悪いです。

でもこの便利さ、ラインナップはクセになります。通常業務ではBGMをつけることはないですが、他の映像素材も買えるのでなんか活用方法を考えたいなと思いました。

■まとめ

などとまぁ趣味で培った技術の機材を投入して頑張って編集しました。4Kでアップしてあるので高解像度環境で見ていただければWordの文字などもクッキリ鮮明かと思います。是非ご覧いただければと思います。

Vol.3はまたかなり濃縮されたコンパクトなコンテンツになる予定です。