상위 80% 합격자의 정보는 유의미한 정보일까? 물량공급의 잡다한이야기

상위 80% 합격자의 정보는 유의미한 정보일까?

대학 입시/입시분석2015.04.23 02:45물량공급

많은 대학에서는 자기 대학의 입시정보를 제공하면서, 최종합격자의 Cut라인을 숨기기위해

'평균점수'를 제공하고 있습니다. 그런데 이 평균점수라는것이 정말 유의미한 입시정보일까?

단순한 호기심에 직접 Simulation을 해보았습니다.

 

 

통계에서 '평균'를 구하는것은 대표적인 모수로 데이터를 요약하는데 효과적인 방법중에 하나입니다.

 

매년 합격자의 표본을 모으고 있기는 하지만, 표본회수율이 생각보다 낮으며, 특히 불합격자의 표본은 거의 없어 상당히 Bias된 표본만 있기에 몇가지 가정을하 여 Excel을 통해 시뮬레이션을 해보았습니다.

 

 

 

[1] 가정

 

- 100명을 모집하는 학과에서 400명이 지원, 즉 4:1의 경쟁률의 상황을 가정하였습니다.

- 400명의 환산점수는 평균이 100점, 표준편차가 20점인 '정규분포'를 따른다고 가정합니다.

(실제 상황에서는 배치표 및 불합격Risk, 훌리 등의 영향에 따라 분포의 차이가 있습니다.)

- 추가합격자의 회전율은 60%, 즉 최종합격자는 100+60명인 160명에 해당합니다.

 

 

[2] Simulation 절차

 

 

1. Excel의 분석도구 이용하여 평균이 100, 표준편차가 20인 정규분포를 따르는 400개의 난수를 생성합니다.

 

 

 

 

2.  생성된 난수를 내림차순 한 후에 다음과 같은 항목에 대하여  Excel에서 제공하는 함수를 이용하여 값을 구합니다.

 

우리가 알아야할 정보는 아래 항목에 해당하는 '점수' , 지원자 기준 상위%, 최종합격자 기준 상위% 세가지 정보입니다.

 

지원자 평균

지원자 상위 50% 점수

최초합격자 평균
최초합격자 상위50% Cut
최초합격자 Cut
최초합격자 상위80% Cut
최초합격자 상위80% 평균
최종합격자 평균
최종합격자 Cut
최종합격자 상위80% Cut
최종합격자 상위80% 평균
지원자 평균
지원자 상위50% Cut

 

3. 이를 막대그래프로 정리합니다.

 

[3] Simulation 결과

 

난수생성을 통해 생성된 400개의 평균은 98.824, 모표준편차는 18.850, 지원자 상위 50%의 값은 98.733으로

 

지원자 평균 = 지원자 상위 50% 임을 알 수 있습니다.

 

그래프를 통해 입학기관에서 사용하는 여러 항목에 대한 Simulation 값을 나타내면 다음과 같습니다.

 

 

 

 

최종합격자의 상위 80% 평균과 최초합격자의 Cut은 상당히 차이가 남을 알 수있습니다.

 

 

 

 

4:1 경쟁률 상황에서 최종합격자 80% 평균과, 최종합격자 cut, 최종합격자 평균은 상당히 차이가 있습니다.

 

 

 


최초합격자의 평균점수에 해당하는 누적백분위는, 최종합격자의 상위 23.6%

최종합격자의 평균점수에 해당하는 누적백분위는, 최종합격자의 상위 43.3%

최종합격자 상위 80% 평균점수에 해당하는 누적백분위는 최종합격자 상위 31.5%로

 

4:1의 경쟁률 상황에서, 추가합격 회전율이 60%일때 정규분포를 따른다면

최종합격자 80% 평균점수에 해당하는 점수가, 최초합격자 Cut을 훨신 상회하는 결과가 나왔습니다.

 

 

[4] 기타

 

- 표준편차를 20에서 10으로 줄이고 다시 시뮬레이션을 하면 다음과 같은 결과가 나옵니다.

 

 

 

 

 

블로그 주인 사진Author물량공급
대학입시, 수시, 정시, IT, 맛집탐방,리뷰 등 다양한 이야기를 다루는 개인 블로그입니다.
  1. 프로필사진2017.11.06 14:04 + 

    비밀댓글입니다