Rで母相関の信頼区間を求めるConfidence interval for population correlations on R

母相関の信頼区間

2 変数のサンプルデータ (X_1,Y_1),\ldots,(X_n,Y_n) が与えられた時の相関係数 \rho_X_Y について考えます。

この時、サンプルデータにおける相関係数 r=\frac{s_X_Y}{s_Xs_Y} について、

    \[z(r)=\frac{1}{2}\log\frac{1+r}{1-r}\]

という変換をフィッシャーの \boldsymbol{z} 変換と言います。

そして z(r) は平均 z(\rho_X_Y)=\frac{1}{2}\log\frac{1+\rho_X_Y}{1-\rho_X_Y} 、分散 \frac{1}{n-3} の正規分布に近似できることが一般的に知られています。

この性質を用いることで、

    \[P\left(z(\rho_{XY})-\frac{z_{\alpha/2}}{\sqrt{n-3}}<z(r)<z(\rho_{XY})+\frac{z_{\alpha/2}}{\sqrt{n-3}}\right){\approx} 1-\alpha\]

が成り立ちます。

関数 z(r) の逆関数 z^{-1}(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}} を用いると、信頼係数 \alpha における \rho の信頼区間は

    \[z^{-1}\left(z(r)-\frac{z_{\alpha/2}}{\sqrt{n-3}}\right)<\rho_{XY}<z^{-1}\left(z(r)+\frac{z_{\alpha/2}}{\sqrt{n-3}}\right)\]

のように、サンプルから計算された r を代入して求めることができます。

R

GitHub: https://github.com/Gin04gh/samples_r/blob/master/Non-CorrelationTest.ipynb