かずのたしなみ(統計環境Rによる) @Wiki
パターン1
最終更新:
rmemo
-
view
パターン1(1変数、1グループの場合)
データ例(ウェイトレスの時給)
800円 1000円 1100円 950円 1200円 900円 1050円 800円
Rにデータ入力
x <- c(800,1000,1100,950,1200,900,1050,800)
パターン1で使える統計処理の方法
グラフ表示
> barplot(x) #棒グラフをかく
画面にグラフを出すなら上記の命令1行だけで済む。
今回はjpegファイルを貼付けているが、
jpegファイルにグラフを書き出すのは以下の通り。
今回はjpegファイルを貼付けているが、
jpegファイルにグラフを書き出すのは以下の通り。
> jpeg("myplot.jpg") #jpegファイルで出力 > barplot(x) #棒グラフをかく > dev.off() #出力を標準に戻す
基礎等計量
> summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 800 875 975 975 1062 1200
度数分布表とヒストグラム
> hist(x)
母平均の区間推定
母平均の検定
つまり今手にしたデータは、母集団から無作為抽出したものと考えるのである。
母平均の区間推定と母平均の検定の二つは、1つの命令で一気に解決する。
母平均の区間推定と母平均の検定の二つは、1つの命令で一気に解決する。
>t.test(x,mu=975) One Sample t-test data: x t = 0, df = 7, p-value = 1 alternative hypothesis: true mean is not equal to 975 95 percent confidence interval: 856.7688 1093.2312 sample estimates: mean of x 975
95 percent confidence interval:
とは、母集団の平均値(母平均)がこの区間(856.7688〜1093.2312)のどこかにある確率が95%の確率ということ。逆に言うと、この区間から母平均がはみ出す確率は5%以下だということ。
とは、母集団の平均値(母平均)がこの区間(856.7688〜1093.2312)のどこかにある確率が95%の確率ということ。逆に言うと、この区間から母平均がはみ出す確率は5%以下だということ。
サンプルの平均値975と、母集団の平均値が等しくないという対立仮説は、p値=1>0.05で棄却できない。
サンプルが少なすぎるのである。
サンプルが少なすぎるのである。