リッジ回帰

リッジ回帰（リッジかいき、Ridge regression）は、独立変数が強く相関している場合に、重回帰モデルの係数を推定する方法^[1]。計量経済学、化学、工学などの分野で使用されている^[2]。

この理論は、1970年に Hoerl とケナードが Technometrics の論文「RIDGE regressions: biased estimation of nonorthogonal problems」と「RIDGE regressions: applications in nonorthogonal problems」で初めて紹介した^[3]^[4]^[1]。これは、リッジ分析の分野における 10 年間の研究の結果だった^[5]。

リッジ回帰は、線形回帰モデルに多重共線性がある（強く相関する独立変数がある）場合に最小二乗推定量が不正確になることを解決するために開発された。リッジ回帰推定量は、最小二乗推定量よりも精度が高い^[6]^[2]。

数学的詳細

${\textstyle n\times 1}$ の列ベクトル ${\textstyle y}$ は ${\textstyle n\times p}$ の計画行列 ${\textstyle X}$ （通常は ${\textstyle p\ll n}$ ）の列空間に射影され、その列は高度に相関しているものとする。正射影 ${\textstyle X\beta }$ を得るための係数 ${\textstyle \beta \in \mathbb {R} ^{p\times 1}}$ の最小二乗推定量 ${\widehat {\beta }}$ は

{\widehat {\beta }}=(X'X)^{-1}X'y

それに対して、リッジ回帰推定量 ${\widehat {\beta }}_{\text{ridge}}$ は

{\widehat {\beta }}_{\text{ridge}}=(X^{\top }X+kI_{p})^{-1}X^{\top }y

ここで、 ${\textstyle I_{p}}$ は ${\textstyle p\times p}$ の単位行列であり、 ${\textstyle k>0}$ は小さい値である。

脚注

[脚注の使い方]

^ ^a ^b Hilt (1977年). “Ridge, a computer program for calculating ridge regression estimates”. 2021年6月25日閲覧。
^ ^a ^b Gruber, Marvin (26 February 1998). Improving Efficiency by Shrinkage: The James–Stein and Ridge Regression Estimators. ISBN 9780824701567. https://books.google.com/books?id=wmA_R3ZFrXYC&pg=PA2
^ Hoerl, Arthur E., and Robert W. Kennard. “Ridge Regression: Biased Estimation for Nonorthogonal Problems.” Technometrics, vol. 12, no. 1, 1970, pp. 55–67. [www.jstor.org/stable/1267351 JSTOR]. Accessed 13 March 2021.
^ Hoerl, Arthur E., and Robert W. Kennard. “Ridge Regression: Applications to Nonorthogonal Problems.” Technometrics, volume 12, number 1, 1970, pp. 69–82. [www.jstor.org/stable/1267352 JSTOR]. Accessed 13 March 2021.
^ Beck, James Vere; Arnold, Kenneth J. (1977). Parameter Estimation in Engineering and Science. ISBN 9780471061182. https://books.google.com/books?id=_qAYgYN87UQC&pg=PA287
^ Jolliffe, I. T. (9 May 2006). Principal Component Analysis. ISBN 9780387224404. https://books.google.com/books?id=6ZUMBwAAQBAJ&pg=PA178

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

頻度
分割表

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像