EVRCとAMR

CDMA方式を現実のものとした「鍵」の一つに新手の音声符号化方式…音声をデジタル信号に変換する方法…の登場がある。cdmaOneでは EVRC(“Enhanced Variable Rate CODEC”の略)、W-CDMAではAMR(Adaptive multi-rate)が用いられているが、これらは「可変速度符号化」を軸にした音声符号化方式であり、その狙いは発信するデータを時々刻々の最小限に抑えて他のユーザーがうける干渉を減らすところにある。
CDMA方式の通信ではたいていの場合、アナログの音声をデジタルに変換してから、スペクトル拡散を行う。都合2回操作を行うが、「可変速符号化」では1段目のアナ→デジ変換のスピードを変える。いや、間引くというべきか。


[image]
声を出している時は素早く、返事程度の時はゆっくりとアナ→デジ変換を行う、または信号を間引く。EVRCでは4段階にスピードを変えていて、最高スピードの時以外は信号が「間引き」されている。一番遅いときには8回に1回の割合でだけ信号を出す。AMRでも、送ろうとする音によって4.75~12.2Kbpsまでアナ→デジ変換速度が8段階に変わるほか、無音時には1.8Kbpsで「無音である」情報のみを送っている。
この操作は「相手の話を聞いている間は、信号を出す必要はない」という考え方に基づいている。とある統計に「電話をかけている間で実際に声を出しているのは全体の4割程度の時間にすぎない」というデータがあるという位だ。余分な信号を出さないことで、送信される電波も最低限のものとなり、結果として他のユーザーの電波が干渉を受けにくくなる他、CDMA方式では拡散率が上昇して干渉波の排除能力が増す、という効能もついてくる。
可変速符号化はQCELP(Qualcomm Code Exited Liner Predictive-coding)という規格で初めて実用化されたが、EVRCでは可変速符号化に加えて「ノイズ・サプレッション」も行うようにした。いわばQCELPの改良版である。
人間の音声と、周囲などから出る雑音はそれぞれ異なった特徴をもつ。それぞれについてスペクトル拡散でも登場した「信号の周波数スペクトル」を取ってみると、異なる形になる。「信号にも指紋があり、それぞれ異なる」といったところ。
このことを利用して、音声のデジタル化前の段階で雑音を取り除くと、送信する信号中の音声信号の割合が高くなるため、音質がよくなる。別な言い方をすると、デジタル信号に圧縮変換する前に雑音を取り除くことで音声信号の圧縮率を低くする、ということもできる。
同じサンドイッチを弁当箱に入れるにしても、ゆとりを持って入れたものとぎゅうぎゅう詰めで押し込んだものでは、弁当箱から出したサンドイッチのおいしさが違ってくる、と言い換えることもできるだろうか。つぶしたサンドイッチがおいしいという人もいるかもしれないがそれは別のお話。