1. 変数間の相関
- (※参考1:多変数の相関を可視化する方法メモ)
- (※参考2:pairs.panels() – (ソフトウェア品質技術者のための)データ分析勉強会)
- (※参考3:Rのグラフィックスパラメータ – RjpWiki)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | library(psych) dat <- read.table( "clipboard" , header = T, sep = "\t" ) #データに欠損がある場合はsep = "\t" (タブ区切り) pairs.panels (dat) #smooth : 平滑線の描画 #density : ヒストグラムでの密度カーブの描画 #ellipses : 散布図上での相関円の描画 #scale : 相関係数の文字の大きさを相関の強さで変えるか #pch = "." : サンプル数が多い場合に素早く描画 #lm = T : 線形モデリングによる回帰直線を追加 #stars : 相関係数の有意水準表示 #show.points : ドットの表示 (相関円のみ表示した方がわかりやすいこともある) #ci : 95%信頼区間の表示 #hist.col : ヒストグラムの色 #col : ドットの色 #相関係数の95%信頼区間 cor.test (dat $x , dat $y ) #対角線つき散布図を作る plot (dat $x , dat $y ) reg <- lm (y~x, data = dat) abline (reg, col = "red" , lty = "dotted" ) abline (0, 1, lty = 3) #各データポイントにラベルを付ける library (maptools) label <- c( "T1" , "T2" , "T3" , "T4" , "T5" , "T6" ) x <- c(1, 2, 3, 4, 5, 6) y <- c(1, 2, 3, 4, 5, 6) dat <- data.frame (x, y) rownames (dat) <- label plot (x, y, xlab = "xxx" , ylab = "yyy" ) pointLabel (x = x, y = y, labels = rownames (dat)) |
2. ヒストグラムの作成
1 2 3 4 5 6 7 | hist ( dat $aa , col = "white" , border = "black" , breaks = seq(x, y, z) #階級をX~Yまでの範囲でZ刻みにする ) abline(v = mean(dat $aa ), col = "red" ) |