使い方・解説
基本的な使い方
-
1
変数名を入力
X・Y それぞれの変数名(例: 身長・体重)を入力します。省略可能です。 -
2
データを貼り付け
ExcelやスプレッドシートのX列・Y列をそれぞれのテキストエリアにコピペします。1行に1つの数値を入力してください(最大200件)。 -
3
「相関係数を計算」をクリック
ピアソン相関係数・決定係数・t統計量・p値・回帰式・散布図が一括表示されます。
初めての方は「サンプルデータを入力」ボタンで身長・体重の例データを確認できます。
相関係数の読み方と注意点
相関係数の強度の目安
| |r| の値 | 解釈 |
|---|---|
| 0.9 〜 1.0 | 非常に強い相関 |
| 0.7 〜 0.9 | 強い相関 |
| 0.4 〜 0.7 | 中程度の相関 |
| 0.2 〜 0.4 | 弱い相関 |
| 0.0 〜 0.2 | ほぼ相関なし |
相関と因果は別物
相関係数が高くても、それは2変数が関係していることを示すだけで、「AがBの原因である」という因果関係を証明するものではありません。たとえば「アイスクリームの売上と溺死者数」には正の相関がありますが、原因は第三の変数(気温・夏)です。このような現象を見かけ上の相関(疑似相関)と呼びます。因果関係の特定には実験デザインや交絡因子の制御が必要です。
外れ値の影響
ピアソン相関係数は外れ値(外れたデータ点)の影響を強く受けます。散布図で外れ値を確認し、外れ値が多い場合はスピアマン順位相関係数の使用も検討してください。
ピアソン相関とスピアマン相関の違い
| 項目 | ピアソン相関 | スピアマン相関 |
|---|---|---|
| 対象データ | 連続量・比率尺度 | 順序尺度・非正規分布 |
| 計算方法 | 元の数値で計算 | 順位に変換して計算 |
| 外れ値への耐性 | 低い | 高い |
| 検出できる関係 | 線形関係のみ | 単調関係(非線形も) |
| 前提条件 | 正規分布が望ましい | 前提条件が緩い |
身長・体重など連続的で正規分布に近いデータにはピアソン相関が適しています。アンケートの5段階評価など順序尺度のデータや外れ値が多いデータにはスピアマン相関を検討してください。
ビジネスでの活用例
-
マーケティング
広告費と売上の相関を分析して、広告効果を定量化する。 -
品質管理
製造工程の温度・圧力と不良率の相関を把握して、品質改善の優先順位を決める。 -
人事・組織
研修時間と成果指標の相関を分析して、研修投資の有効性を評価する。 -
医療・ヘルスケア
生活習慣(運動量・食事)と健康指標の相関を調査して、予防医学の根拠とする。 -
金融・投資
2つの株式・資産クラスの価格変動の相関を求めて、ポートフォリオの分散効果を評価する。
よくある質問(FAQ)
相関係数とは何ですか?
相関係数(ピアソン積率相関係数)は、2つの変数の線形的な関係の強さを-1から+1の範囲で表す統計量です。+1に近いほど強い正の相関、-1に近いほど強い負の相関、0に近いほど相関がないことを意味します。
相関係数の値の目安はどう読みますか?
一般的な目安として、|r|が0.7以上で強い相関、0.4〜0.7で中程度の相関、0.2〜0.4で弱い相関、0.2未満でほぼ相関なし、と解釈されます。ただし分野や文脈によって基準が異なります。
p値とは何ですか?有意水準の判断方法を教えてください。
p値は「相関が偶然生じる確率」を表します。p<0.05(5%未満)であれば「統計的に有意な相関あり」と判断するのが一般的です。ただし有意差があっても実用的な意味があるかどうかは別途判断が必要です。
相関係数と因果関係の違いは何ですか?
相関係数は2変数の関係の強さを示すだけで、因果関係(原因と結果)を証明するものではありません。第三の変数が両方に影響しているケース(疑似相関)もあります。因果関係の証明には実験や追加的な分析が必要です。
ピアソン相関とスピアマン相関の違いは何ですか?
ピアソン相関係数は連続変数間の線形関係を測り、正規分布を前提とします。スピアマン順位相関係数はデータを順位に変換してから計算するため、外れ値の影響を受けにくく、非線形の単調関係も検出できます。
決定係数R²はどのように解釈しますか?
決定係数R²はrの二乗で、「Y変数の変動のうちX変数で説明できる割合」を表します。例えばR²=0.64であれば、Yの変動の64%がXによって説明できることを意味します。
何件のデータがあれば相関係数は信頼できますか?
一般的にはデータ数n≥30以上が推奨されます。データ数が少ないと偶然に高い相関係数が出やすく、有意性検定の検出力も低下します。p値とデータ数を合わせて確認してください。
参照・免責事項
- 本ツールはピアソン積率相関係数の計算に基づいています。
- p値はt分布によるJavaScript実装の近似値です。厳密な統計解析にはRやPythonなどの統計専門ソフトの使用を推奨します。
- 計算結果の解釈・活用はご自身の責任でお願いします。医療・法律・投資等の重要な判断には専門家にご相談ください。
- 本ツールは無料でご利用いただけますが、計算結果の正確性を保証するものではありません。