「蒼弓ノート」 別館

非可逆オーディオコーデックの評価

最終更新:

匿名ユーザー

- view
メンバー限定 登録/ログイン
#blognavi
 今や圧縮音声全盛の時代です。MP3はあらゆる普及型プレイヤーに広がり、デジタルテレビや映画などでも標準的に圧縮音声が使われています。そこで、持ち上がるのは音質に関する議論であったり、文句であったりします。
 音質を評価するにあたって、テストの信頼性を確保する方法の一つとしてダブルブラインドテスト(二重盲検法)があります。これは思い込みにる誤判断を防ぐには良い方法で広く用いられています。ただ、非可逆圧縮のプロセスから、多くの環境・多くの人でのテストが望ましいのです。
 現在の非可逆圧縮オーディオの基本的な考え方は、人の耳に聞こえにくい音の情報を削減することにあります。これは主に耳の蝸牛の特性に拠るもので、現在の高圧縮コーデックの理論のベースと言えるでしょう。上記のある音が別の音に隠蔽される現象を一般にマスキング効果と言います。
 このマスキング効果は周波数と音の大きさに関連する非線形の現象です。しかし、実際には耳の内部の感度以前に、耳の外耳・内耳の形やリスニング環境によっても周波数特性は大きく変化してしまいます。例えばフラットな特性を持ったスピーカーなどありませんし、部屋の状態や聞く位置などによっても、同様なことが起こります。つまり結果的に耳の内部に届くまでの周波数毎の音量が変化してしまう要因が多くある訳です。そうなると、ある環境では隠蔽されて聞こえなかったノイズが、他の環境では聞こえる、若しくは目立つという可能性が出てきます。これが一つの環境でのテストが十分でない理由です。また、"多くの人"というのは一人一人の耳が違うのはもちろんのこと、人によって注意を向ける部分が違うことが重要です。実際、歌ものを聴く時に人声にしか意識が行かない方も多いと思います。一方で楽器などをやっていた方はその楽器の音に意識がより行きやすいでしょう。
 もし、本当に有意な評価が必要ならば、そのためのテストはそれなりに大規模なものにならざるを得ません。そしてそれが非可逆圧縮オーディオコーデックの定量的な評価が難しい理由です。

おまけ - 特定のサンプルを取り上げて、このフォーマット(エンコーダ)はダメだと結論付けることはできません。まずフォーマットによって得て不得手は前提としてあります。エンコーダのアルゴリズムによっても変わります。そして別のサンプルでは全く逆の評価になるかも知れません(それは決して珍しいことではありません)。ただ、自分にとって良いかどうかは簡単に判別できるでしょう。それは自身で聞いて判断することです。人によって聞こえる聞こえないというだけでは無く、気になる気にならないといった好みや環境の差も無視できない以上、結局は自前の環境で聞いて判断するのが最善です。

ぼやき - とはいえ、全体ではエンコーダやフォーマットを選択出来ない状況のほうが多いような気がするので、あまり一般的には意味の無い話かも知れず。


カテゴリ: [音声圧縮] - &trackback() - 2005年06月27日 21:38:37
名前: コメント:
#blognavi
記事メニュー
目安箱バナー