重畳加算法

重畳加算法 (ちょうじょうかさんほう、英語: OverLap-Add method, OA, OLA) とは、非常に長い信号 x {\displaystyle \mathbf {x} } FIRフィルタ h {\displaystyle \mathbf {h} } の 離散畳み込み h x {\displaystyle \mathbf {h} *\mathbf {x} } を分割して(効率的に)処理する手法である。

y [ n ] = ( h x ) [ n ] = m = 0 M 1 h [ m ] x [ n m ] {\displaystyle {\begin{aligned}y[n]=(\mathbf {h} *\mathbf {x} )[n]=\sum _{m=0}^{M-1}h[m]\cdot x[n-m]\end{aligned}}}

ここで 信号 x [ n ] {\displaystyle x[n]} n = 1 , , N x {\displaystyle n=1,\ldots ,N_{x}} 、フィルタ h [ m ] {\displaystyle h[m]} m = 0 , , M 1 {\displaystyle m=0,\ldots ,M-1} 以外で0、また M < N x {\displaystyle M<N_{x}} である。

重畳加算法の基本アイデアは、長い信号 x {\displaystyle \mathbf {x} } を区間長 L {\displaystyle L} で区切り、複数の短い断片 x k {\displaystyle \mathbf {x} _{k}} と フィルタ h {\displaystyle \mathbf {h} } に関する複数の畳み込みに分割して、訳注: 適切なブロック長のFFTの積として効率的に計算することにある。

x k [ n ]   = d e f   { x [ n + k L ] , n = 1 , 2 , , L 0 , otherwise x [ n ] = k x k [ n k L ] , {\displaystyle {\begin{aligned}x_{k}[n]\ &{\stackrel {\mathrm {def} }{=}}\ {\begin{cases}x[n+kL],&n=1,2,\ldots ,L\\0,&{\textrm {otherwise}}\end{cases}}\\x[n]&=\sum _{k}x_{k}[n-kL],\\\end{aligned}}}

離散畳み込み ( h x ) [ n ] {\displaystyle (\mathbf {h} *\mathbf {x} )[n]} は、各区間の畳み込みの総和で表せる:

y [ n ] = ( h x ) [ n ] = m = 0 M 1 ( h [ m ] k x k [ n m k L ] ) = k ( h x k ) [ n k L ] {\displaystyle {\begin{aligned}y[n]=(\mathbf {h} *\mathbf {x} )[n]&=\sum _{m=0}^{M-1}\left(h[m]\cdot \sum _{k}x_{k}[n-m-kL]\right)\\&=\sum _{k}(\mathbf {h} *\mathbf {x} _{k})[n-kL]\\\end{aligned}}}

ここで各区間の畳み込み y k [ n ]   = d e f   ( h x k ) [ n ] {\displaystyle y_{k}[n]\ {\stackrel {\mathrm {def} }{=}}\ (\mathbf {h} *\mathbf {x} _{k})[n]} は 領域 [1, L+M-1] 以外で 0 であり、任意の N ( L + M 1 ) {\displaystyle N\geq (L+M-1)} に関し、領域 [1, N] における x k {\displaystyle \mathbf {x} _{k}} h {\displaystyle \mathbf {h} } N {\displaystyle N} 巡回畳み込みと等価である。

重畳加算法のアドバンテージは、この巡回畳み込みが畳み込み定理により、次のような FFTの積の逆FFT として効率的に計算できる事にある:

y k [ n ] = IFFT ( FFT ( x k ) FFT ( h ) ) [ n ] {\displaystyle y_{k}[n]={\textrm {IFFT}}\left({\textrm {FFT}}\left(\mathbf {x} _{k}\right)\cdot {\textrm {FFT}}\left(\mathbf {h} \right)\right)[n]}
(式1)

ここで FFT {\displaystyle {\textrm {FFT}}} IFFT {\displaystyle {\textrm {IFFT}}} は(ブロック長 N {\displaystyle N} の)高速フーリエ変換と逆高速フーリエ変換である。 FFTアルゴリズムによっては、(巡回畳み込み計算のために)FFTブロック長 N {\displaystyle N} を調整する事が理に適っている。例えばCooley-Tukey型FFTアルゴリズム (radix-2アルゴリズム) を使う場合、2の冪乗のブロック長を選ぶと有利である:

N = L + M 1 = 2 p , p N {\displaystyle N=L+M-1=2^{p},\quad p\in \mathbb {N} }

アルゴリズム

図1: 重畳加算法

図1に、重畳加算法のアイデアを示す。

  1. 信号 x {\displaystyle \mathbf {x} } (長さNx) を区間長 L {\displaystyle L} で区切り、オーバーラップの無いk個の断片の列 x k {\displaystyle \mathbf {x} _{k}} を得る。
  2. 各区間について、断片 x k {\displaystyle \mathbf {x} _{k}} (長さ≦L) と フィルタ h {\displaystyle \mathbf {h} } (長さM) のFFT結果の積をとり逆FFTして、区間毎の畳み込み結果 y k {\displaystyle \mathbf {y} _{k}} (長さ≦L+M-1) を得る。
    (なお畳み込み結果は、元信号(区間長L)と比べ (フィルタの長さ-1) だけ長くなり、オーバーラップが生じる)
  3. 最終的な出力信号は、図に示すように、各区間の結果 y k {\displaystyle \mathbf {y} _{k}} のオーバーラップ(重畳)部を加算しながら連結して得られる。

区間長 L {\displaystyle L} は、FFT開発初期にはしばしば効率上の理由でFFTのブロック長 N {\displaystyle N} が2の冪乗をとるよう調整されたが、更なる研究開発の結果、Nを大きな素数で素因数分解する効率的変換方法が明らかにされ、このパラメータに対する計算上の敏感さは低減された。[要説明] (訳注: FFTのブロック長 N {\displaystyle N} が2の冪乗の場合の計算量は O ( N log 2 N ) {\displaystyle O(N\log _{2}{N})} 、一般にブロック長が N = Π n i {\displaystyle N=\Pi {n_{i}}} と素因数分解できる場合の計算量は O ( N n i ) {\displaystyle O(N\sum {n_{i}})} であり、ブロック長 N {\displaystyle N} をゼロ・パディングで調整して計算量を最適化できる。) アルゴリズムの疑似コードは以下の通り:

   アルゴリズム 1 (重畳加算法(OLA)による線形畳み込み)
   使用するFFTアルゴリズムに応じてFFTブロック長 N と 分割区間長 L に最適値を設定
   H = FFT(h,N)       (ゼロ・パディングしたFFT )
   i = 1
   while i <= Nx
       il = min(i+L-1,Nx)
       yt = IFFT( FFT(x(i:il),N) * H, N)
       k  = min(i+M-1,Nx)
       y(i:k) = y(i:k) + yt    (オーバーラップ区間を加算 )
       i = i+L
   end

巡回畳み込みへの応用

一般に信号 x {\displaystyle \mathbf {x} } が周期的でその周期が N x {\displaystyle N_{x}} の場合、畳み込み結果 y [ n ] {\displaystyle y[n]} も周期的で同じ周期をとる。

  1. 1周期分の y [ n ] {\displaystyle y[n]} は、ちょうど1周期分の信号 x [ n ] {\displaystyle x[n]} (長さNx) と フィルタ h [ n ] {\displaystyle h[n]} (長さM) の畳み込みで得られる。ここでは前述のアルゴリズム 1を使う。
    畳み込み結果 y [ n ] {\displaystyle y[n]} は、区間 [M, Nx] で正しい。
  2. 先頭のM-1個(区間[1, M-1])の値に、末尾のM-1個(区間[Nx+1, Nx+M-1])の値を加算すれば、区間 [1, Nx] が正しい畳み込み結果を表すようになる。

変更した疑似コードは以下の通り:[要検証 – ノート]

   アルゴリズム 2 (重畳加算法(OLA)による巡回畳み込み)
   アルゴリズム 1 を評価
   y(1:M-1) = y(1:M-1) + y(Nx+1:Nx+M-1)
   y = y(1:Nx)
   end
  【参考】英語版記事初版のアルゴリズム 2
   (アルゴリズム 1 の必要範囲を引用 )
       使用するFFTアルゴリズムに応じてFFTブロック長 N と 分割区間長 L に最適値を設定
       H = FFT(h,N)       (ゼロ・パディングしたFFT )
   (ここまで引用 )
   ML = floor((N-1)/L)    (未使用 )
   i = Nx-L+1
   k = N - L
   while k >= 1
       il = i+L-1
       yt = IFFT( FFT(x(i:il,N)) * H )
       y(1:k) = y(1:k) + yt(N-k+1:N)
       k  = k-L
       i  = i-L
   end

計算量

畳み込みの計算コストは、操作に関わる複素数乗算の回数と関連付ける事ができる。主要な計算量はFFT演算によるもので、Radix-2アルゴリズム(訳注: ブロック長 N {\displaystyle N} が2の冪乗のアルゴリズム)を長さ N x = N {\displaystyle N_{x}=N} の信号に適用する場合およそ C = ( N log 2 N ) / 2 {\displaystyle C=(N\log _{2}{N})/2} 回の複素数乗算が行われる。重畳加算法における複素数乗算の回数は、FFTとフィルタ乗算とIFFTを考慮して:

C O A = N x N M + 1 N ( log 2 N + 1 ) {\displaystyle C_{OA}=\left\lceil {\frac {N_{x}}{N-M+1}}\right\rceil N\left(\log _{2}N+1\right)\,} [要検証 – ノート]

なお巡回行列版の M L {\displaystyle M_{L}} セクション (訳注: 先頭と末尾の長さ(M-1)の区間?) の追加コストは、通常とても小さいので単純化のために無視できる。

FFTのブロック長 N {\displaystyle N} の最適値は、 log 2 M n log 2 N x {\displaystyle \log _{2}{M}\leq n\leq \log _{2}{N_{x}}} の範囲で動かして C O A ( N = 2 n ) {\displaystyle C_{OA}\left(N=2^{n}\right)} の最小値を整数 n {\displaystyle n} を(数値的に)探す事で得られる。 N {\displaystyle N} が2の冪乗であれば、FFTを効率的に計算できる。 N {\displaystyle N} の値が定まれば、信号 x {\displaystyle \mathbf {x} } を最適に区切る区間長 L = N M + 1 {\displaystyle L=N-M+1} が定まる。 比較のため、普通の巡回畳み込みの計算量も示しておく:

C S = N x ( log 2 N x + 1 ) {\displaystyle C_{S}=N_{x}\left(\log _{2}N_{x}+1\right)\,} [要検証 – ノート]

したがって重畳加算法の計算量はほぼ O ( N x log 2 N ) {\displaystyle O(N_{x}\log _{2}{N})} でスケールし、他方、普通の巡回畳み込みの計算量はほぼ O ( N x log 2 N x ) {\displaystyle O(N_{x}\log _{2}{N_{x}})} である。(訳注: N > N x {\displaystyle N>N_{x}} なので重畳加算法の方が計算量が多い事になってしまう。2つの計算量は要検証) しかしながら、この種の推計は複素数乗算の計算量だけ考慮しており、アルゴリズムに関わる他の処理は度外視している。各アルゴリズムに要する計算時間の直接測定こそ、より大きな関心事である。 図2に、式1による標準的な巡回畳み込み[要説明]の計算時間と、アルゴリズム 2の形の重畳加算法による同様な畳み込みの計算時間の比を示す; 縦軸は信号長 N x {\displaystyle N_{x}} の対数表示、横軸はフィルタ長 N h = M {\displaystyle N_{h}=M} の対数表示で、計算時間の比を等高線で示している。両アルゴリズムはMatlabで実装した。青い太線は、重畳加算法の方が標準巡回畳み込みより速い(比>1)領域の境界線である。このケースでは重畳加算法は標準的手法より最大約3倍高速だった。[要検証 – ノート]

図2: 式1の計算時間と、重畳加算法アルゴリズム 2の計算時間の比; 縦軸は信号長 N x {\displaystyle N_{x}} の対数表示、横軸はフィルタ長 N h = M {\displaystyle N_{h}=M} の対数表示

関連項目

  • 重畳保留法() (Overlap-save method)

参考文献

  • Rabiner, Lawrence R.; Gold, Bernard (1975). Theory and application of digital signal processing. Englewood Cliffs, N.J.: Prentice-Hall. pp. 63–67. ISBN 0-13-914101-4 
  • Oppenheim, Alan V.; Schafer, Ronald W. (1975). Digital signal processing. Englewood Cliffs, N.J.: Prentice-Hall. ISBN 0-13-214635-5 
  • Hayes, M. Horace (1999). Digital Signal Processing. Schaum's Outline Series. New York: McGraw Hill. ISBN 0-07-027389-8 

外部リンク