かずのたしなみ(統計環境Rによる) @Wiki

パターン1

最終更新:

rmemo

- view
管理者のみ編集可

パターン1(1変数、1グループの場合)




データ例(ウェイトレスの時給)

800円 1000円 1100円 950円 1200円 900円 1050円 800円

Rにデータ入力

x <- c(800,1000,1100,950,1200,900,1050,800)

パターン1で使える統計処理の方法


グラフ表示

> barplot(x) #棒グラフをかく


画面にグラフを出すなら上記の命令1行だけで済む。
今回はjpegファイルを貼付けているが、
jpegファイルにグラフを書き出すのは以下の通り。

> jpeg("myplot.jpg") #jpegファイルで出力
> barplot(x) #棒グラフをかく
> dev.off()         #出力を標準に戻す

基礎等計量

> summary(x)
  Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   800     875     975     975    1062    1200 

度数分布表とヒストグラム


> hist(x)


母平均の区間推定

母平均の検定

つまり今手にしたデータは、母集団から無作為抽出したものと考えるのである。
母平均の区間推定と母平均の検定の二つは、1つの命令で一気に解決する。

>t.test(x,mu=975)

       One Sample t-test

data:  x 
t = 0, df = 7, p-value = 1
alternative hypothesis: true mean is not equal to 975 
95 percent confidence interval:
  856.7688 1093.2312 
sample estimates:
mean of x 
     975 

95 percent confidence interval:
とは、母集団の平均値(母平均)がこの区間(856.7688〜1093.2312)のどこかにある確率が95%の確率ということ。逆に言うと、この区間から母平均がはみ出す確率は5%以下だということ。

サンプルの平均値975と、母集団の平均値が等しくないという対立仮説は、p値=1>0.05で棄却できない。
サンプルが少なすぎるのである。


石村貞夫(1994)『すぐわかる統計処理』(東京図書)トップページに戻る

目安箱バナー