summary() コマンドを使い、平均や標準偏差などの基本統計量を計算する。
通常は Excel 等で作成した CSV ファイルを R に読み込んで分析する。しかし、ここでは便宜的に以下の簡単なデータフレームを作成し、data という変数に格納しておく。
data = data.frame(術者 = c("太郎","花子","太郎","花子","太郎","花子"), 手術方法 = c("内視鏡","開腹","開腹","内視鏡","内視鏡","内視鏡"), 手術時間 = c(60,50,100,90,30,40), 出血量 = c(15,25,35,55,45,25))
data の内容を確認する。
data
summary() コマンドで平均などの基本統計量を表示する。
summary(data)
tapply() コマンドで、手術時間の統計量を術者毎に出す。
tapply(data$手術時間, data$術者, summary)
summary() コマンド以外の方法による基本統計量の計算。
nrow(data) #行数 = サンプルサイズ table(data$術者) #それぞれの術者が何件の手術を行っているかカウント sum(data$手術時間) #手術時間の合計 mean(data$手術時間) #手術時間の平均 var(data$手術時間) #手術時間の不偏分散 sd(data$手術時間) #手術時間の標準偏差(不偏分散の平方根) max(data$手術時間) #手術時間の最大値 min(data$手術時間) #手術時間の最小値 median(data$手術時間) #手術時間の中央値