第12回 【発展編】周波数の解析
離散フーリエ変換
音声データの周波数を解析するには、離散フーリエ変換という手法を用います。
音声が波として表現できることは、
第2回で説明しました。この波は、周波数成分の和で表現することができます。
左の方に、音声データの波が赤で描かれています。その後ろ側に、周波数の異なるいくつもの紫色の単純な波があります。これは、
赤い音声データの波は、幾つもの紫色の単純な波の合成で表現できることを示しています。
紫色の波は単純なサイン波です。この紫色の波ひとつは、周波数(Frequency)と、その波の強さ(波の上がり下がりの大きさで、これを振幅(Amplitude)という)で表すことができます。
単純なサイン波は、振幅(A)と周波数(f)だけで表現できる
(図はこちらを元に筆者作成)
ですので、このA(振幅)をグラフの縦軸、f(周波数)をグラフの横軸とすれば、幾つもの紫色の波を1つのグラフで表現できます。このグラフが、先の「離散フーリエ変換の概念」の図の、右の青色のグラフです。これが離散フーリエ変換による周波数解析の結果となります。
要するに、離散フーリエ変換とは、次の1.から3.までを一飛に行う計算です。
- 赤色の波(パソコンやCDに記録されている音声データの波で、離散デジタル信号という)を、
- 幾つもの単純な紫色の波に分解して、
-
各紫色の波(周波数成分)ごとの強さを表現する青色のグラフを作る。
フーリエ変換の理論によれば、どのような複雑な波も、単純な波の組み合わせへと分解できるというのです。そのため、音声信号から周波数を取り出すということが可能になっています。理屈ではそうなんだろうとは分かるのですが、
実際これを計算する方法を考えた人は天才だと思います。
ちなみに、「どのような複雑な波も、単純な波の組み合わせへと分解できる」ということを、動画で理解したい方は、次の3分46秒から5分12秒までをご覧ください。複雑な波が、単純な波の合成で作られていく様子がわかります。
» 続きはこちらから
イランカラプテ♪(こんにちは、あなたの魂にそっと触れさせてください)