各都道府県のデータを使って、各変数間の散布図の描画と相関係数の計算を行いましょう。まず、データを読み込みます。
> pref <- read.csv("prefectures.csv")
prefと入力すると、prefに代入されたデータが表示されます。
県コ..ド 県名 面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有
1 1 北海道 83408 5666 54 694 543 63 8623 2065
2 2 青森 9606 1507 72 234 113 22 2128 459
3 3 岩手 15274 1429 73 239 118 21 2088 464
4 4 宮城 7284 2287 61 159 234 30 3468 812
5 5 秋田 11613 1227 80 216 101 20 1733 404
以下では各県の「面積」~「自動車保有」の列だけを利用して分析を進めていくので、必要な列だけを取り出します。
> pref2 <- pref[3:10]
上の命令は変数prefの3列目から10列目をとりだし、変数pref2に代入せよという意味です。
> pref2
面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有
1 83408 5666 54 694 543 63 8623 2065
2 9606 1507 72 234 113 22 2128 459
3 15274 1429 73 239 118 21 2088 464
4 7284 2287 61 159 234 30 3468 812
5 11613 1227 80 216 101 20 1733 404
各変数間の散布図を作成します。pairsという関数を利用します。
> pairs(pref[3:10],gap=0) #gap=0 は各散布図間の空白を0にする
各変数間の相関係数を計算します。相関係数を計算する関数はcorです。
> cor(pref2)
面積 人口 持家比率 地方交付税 地方税収 商店数 電力消費量 自動車保有
面積 1.00000000 0.1121399 -0.10981581 0.86357637 0.01554832 0.09766679 0.04847636 0.1749191
人口 0.11213987 1.0000000 -0.80391731 -0.15413683 0.72394462 0.97563958 0.99193483 0.9689834
持家比率 -0.10981581 -0.8039173 1.00000000 0.05355635 -0.50281434 -0.81125287 -0.80544938 -0.7503827
地方交付税 0.86357637 -0.1541368 0.05355635 1.00000000 -0.18031202 -0.15466839 -0.22705848 -0.1073727
地方税収 0.01554832 0.7239446 -0.50281434 -0.18031202 1.00000000 0.76653324 0.75725724 0.6397272
商店数 0.09766679 0.9756396 -0.81125287 -0.15466839 0.76653324 1.00000000 0.98409466 0.9264742
電力消費量 0.04847636 0.9919348 -0.80544938 -0.22705848 0.75725724 0.98409466 1.00000000 0.9407229
自動車保有 0.17491910 0.9689834 -0.75038274 -0.10737274 0.63972724 0.92647417 0.94072291 1.0000000
