見出し画像

音声は遅れるよりも、早い方が違和感が大きい、を試してみた(ライブ配信の音ズレ検証)

今回のテーマは音声です。

配信で重要なテーマである「音ズレ」。実は、音が遅れるよりも、早く聞こえる方が違和感を感じやすいのだそうです。

これは本当なのでしょうか。実際に試してみると、確かに早い方が違和感を感じやすいことが分かりました。

今回は実際の検証結果を交えながらご紹介をします。


今回のきっかけ

お話のきっかけは、先日公開したこちらの記事です。私が使うYoloBox Proは音声の方が遅延するという内容でした。

このお話をした複数の方からいただいたのが、今回のテーマとなるお話です。なんと、音声は遅れるよりも早い方が違和感があるらしいのです。

どの方も「音声が遅れることは自然界でもあるから」と仰っていました。確かに、言われてみればその通りですよね。

興味深い文献

Webでこのテーマを検索すると、一つ興味深い文献を見つけました。その文献によれば、音声ズレの基準について以下の記載がありました。

音声遅れを負として、
[-185ms、 +90ms]を許容限界、(中略)
[-125ms、 +45ms]を検知限界、(中略)
[-95ms、 +22.5ms]を検知不能範囲としている

マルチメディアにおける同期/池田宏明、由雄淳一

これは1998年に日本、スイス、オーストリアで行われた研究を参照した内容です。ただ20年以上経った今でも参考にできる内容なのではないでしょうか。

これを参考にすると、音声が遅れる分には185msまでは許容できますが、速まる方は90msまでしか許容できないようです。実に2倍以上の許容差がありますね。

実際に試してみた

そこで実際に検証を行ってみました。私がカメラのマイクで撮影した動画を、敢えて動画編集で音声をズラしています。

音声遅れを負として
[0ms、+83ms、+166ms、-83ms、-166ms、-250ms、-333ms]
の7パターンで用意しています。
※おおよそのズレであることをご了承ください

※動画はメールのリンクでは再生ができず、noteの記事上で再生ができます

いかがでしょうか。これは私の感覚になりますが、早い方は+83msでも若干の違和感が。。+166msだと明らかにズレているのを感じますね。

遅い方に関しては、さすがに-333msは違和感に気づくのですが、それでも+166msよりも違和感は小さいです。-250msまでなら、気づかないかもしれません。

確かに早い方が違和感は大きかった!

以上の結果からは、確かに音声のズレが早い方が、許容できる幅が短いことが分かりました。

私の主観ではありますが、他の皆さんも同じような感想を抱くのではないでしょうか。ぜひ違う印象を覚えた方は、コメントをいただければ嬉しいです!

そしてこの結果は、配信前に遅延調整する際にとても参考になるものでした。遅れに関してはある程度許容できることを理解しながら、明日からも配信に臨みたいと思います。

ここから先は

0字