R による基本統計量の計算

summary() コマンドを使い、平均や標準偏差などの基本統計量を計算する。

通常は Excel 等で作成した CSV ファイルを R に読み込んで分析する。しかし、ここでは便宜的に以下の簡単なデータフレームを作成し、data という変数に格納しておく。

data = data.frame(術者 = c("太郎","花子","太郎","花子","太郎","花子"), 手術方法 = c("内視鏡","開腹","開腹","内視鏡","内視鏡","内視鏡"), 手術時間 = c(60,50,100,90,30,40), 出血量 = c(15,25,35,55,45,25))

data の内容を確認する。

data

summary() コマンドで平均などの基本統計量を表示する。

summary(data)

tapply() コマンドで、手術時間の統計量を術者毎に出す。

tapply(data$手術時間, data$術者, summary)

summary() コマンド以外の方法による基本統計量の計算。

nrow(data) #行数 = サンプルサイズ
table(data$術者) #それぞれの術者が何件の手術を行っているかカウント
sum(data$手術時間) #手術時間の合計
mean(data$手術時間) #手術時間の平均
var(data$手術時間) #手術時間の不偏分散
sd(data$手術時間) #手術時間の標準偏差(不偏分散の平方根)
max(data$手術時間) #手術時間の最大値
min(data$手術時間) #手術時間の最小値
median(data$手術時間) #手術時間の中央値