본문 바로가기
9.유용한 함수모음/계산관련 함수

[R코딩] 서브그룹의 통계량을 구해주는 aggregate 함수

by makhimh 2020. 12. 25.
반응형

사용 형식 : aggregate(종속변수, by=범주형 독립변수, 적용함수)

 

출력 결과 : 데이터프레임 

 

범주형 독립변수는 리스트 형태로 입력합니다. 예를 들어봅시다.

 

아래와 같은 데이터프레임이 있다고 합시다. A,B,C 반 학생의 수학점수입니다. 

 

> dt=data.frame(score=c(75,73,79,83,85,92,99,100,72,83),class=c('A','A','A','B','B','B','C','C','C','C'))
> dt
   score class
1     75     A
2     73     A
3     79     A
4     83     B
5     85     B
6     92     B
7     99     C
8    100     C
9     72     C
10    83     C

 

각 반별로 따로 평균을 구하고 싶다고 합시다. 이런 경우 사용하는 함수가 aggregate 함수입니다. 아래와 같이 사용합니다. by는 반드시 리스트로 입력해야합니다. 

 

> aggregate(dt$score,by=list(dt$class),mean)
  Group.1        x
1       A 75.66667
2       B 86.66667
3       C 88.50000

결과가 데이터프레임 형태로 출력됩니다. 

반응형

댓글