R によるクロス集計表

taplly() コマンド、table() コマンドを使い、クロス集計表を作成する。

通常は Excel 等で作成した CSV ファイルを R に読み込んで分析する。しかし、ここでは便宜的に以下の簡単なデータフレームを作成し、data という変数に格納しておく。

data = data.frame(術者 = c("太郎","花子","太郎","花子","太郎","花子"), 手術方法 = c("内視鏡","開腹","開腹","内視鏡","内視鏡","内視鏡"), 手術時間 = c(60,50,100,90,30,40), 出血量 = c(15,25,35,55,45,25))

data の内容を確認する。

data

術者と手術方法で、手術時間の平均や、出血量の合計がどう異なるかを集計する。

tapply(data$手術時間, list(data$術者, data$手術方法), mean) #手術時間の平均
tapply(data$出血量, list(data$術者, data$手術方法), sum) #出血量の合計

件数をみるだけの通常のクロス集計は table() コマンドを使って行う。

table(data$術者, data$手術方法)