線型代数

第19講 最小二乗法

直交射影と最短距離 $(V,(\cdot,\cdot))$ を内積空間とし,$W$ を $V$ の部分空間,$W^\bot$ をその直交補空間とるするとき,任意の $\mathbf{v}\in V$ は
$\mathbf{v}=\mathbf{w}+\mathbf{w}^\bot\quad(\mathbf{w}\in W,\ \mathbf{w}^\bot\in W^\bot)$
と一意的に表され,$\mathbf{v}$ にこの $\mathbf{w}$ を対応させる線型写像を $V$ から $W$ への直交射影といい,$f_{P_W}$ と表わすのであった(第18講).
ところで,内積空間においては
$\|\mathbf{v}\|=\sqrt{(\mathbf{v},\mathbf{v})}$
によりノルム $\|\cdot\|$ が自然に定義され(第13講), $\|\mathbf{v}-\mathbf{w}\|$ は二つのベクトル $\mathbf{v}$ と $\mathbf{w}$ との「距離(近さ)」を表すと考えられるから,この意味で,$f_{P_W}(\mathbf{v})$ は $W$ のベクトルの中で $\mathbf{v}$ に最も「近い」ベクトルということができる. さらに
$\|\mathbf{v}-f_{P_W}(\mathbf{v})\|=\|f_{P_{W^\bot}}(\mathbf{v})\|$
より,$\|f_{P_{W^\bot}}(\mathbf{v})\|$ はベクトル $\mathbf{v}$ から部分空間 $W$ への「最短距離」を与えることになる詳しく!
最小二乗法 実 $m\times n$ 行列 $A$ とベクトル $\mathbf{b}\in\mathbf{R}^n$ により
$A\mathbf{x}=\mathbf{b}$
と表わされる連立一次方程式を考えよう. この連立一次方程式が解をもつための必要十分条件は $\mathbf{b}\in\mathrm{Im}f_A$ となることであった(第17講).従って
$\mathbf{b}\notin\mathrm{Im}f_A$
ならば,この連立一次方程式は解をもたないのであるが, 次善の策として,$\mathbf{b}$ に最も「近い」$\mathrm{Im}f_A$ のベクトル
$\mathbf{b}'=P_{\mathrm{Im}f_A}\mathbf{b}$
により新しい連立一次方程式
$A\mathbf{x}=\mathbf{b}'$
を考えればこの方程式は解をもつ.これが最小二乗法と呼ばれる方法であり, こうして得られる解を最小二乗解という.
正規方程式 連立一次方程式 $A\mathbf{x}=\mathbf{b}$ の最小二乗解は
${}^t\!AA\mathbf{x}={}^t\!A\mathbf{b}$
を解いても得られる証明 この方程式は正規方程式と呼ばれ,応用上はこれを利用することが多い.
応用例として,次の問題を考える:
3点 $\mathrm{A}(1,1),\ \mathrm{B}(2,2),\ \mathrm{C}(3,5)$ を通る直線を求めよ
もちろんそんな直線はない.しかしともかく求める直線を $y=a_0+a_1x$ とおくと,満たすべき条件は
$a_0+a_1=1\\ a_0+2a_1=2\\ a_0+3a_1=5$
すなわち
$\left(\begin{array}{cc}1&1\\1&2\\1&3\end{array}\right)\left(\begin{array}{c}a_0\\a_1\end{array}\right)=\left(\begin{array}{c}1\\2\\5\end{array}\right)$
である.この連立一次方程式は解をもたないので,次善の策として最小二乗解を考える.正規方程式は
$\left(\begin{array}{ccc}1&1&1\\1&2&3\end{array}\right)\left(\begin{array}{cc}1&1\\1&2\\1&3\end{array}\right)\left(\begin{array}{c}a_0\\a_1\end{array}\right)=\left(\begin{array}{ccc}1&1&1\\1&2&3\end{array}\right)\left(\begin{array}{c}1\\2\\5\end{array}\right)$
から
$\left(\begin{array}{cc}3&6\\6&14\end{array}\right)\left(\begin{array}{c}a_0\\a_1\end{array}\right)=\left(\begin{array}{c}8\\20\end{array}\right)$
これを解いて $a_0=-\dfrac{4}{3},\ a_1=2$,従って
$y=-\dfrac{4}{3}+2x$
が得られる.この直線は与えられた3点のどれも通らないが
$(1,\frac{2}{3}),\ (2,\frac{8}{3}),\ (3,\frac{14}{3})$
とそれらの「近く」を通る直線である.この $y$ 座標の誤差の二乗和が最小という意味で,これは一つの最適解と言えるのである.