올해 연경제에 대한 최종 분석
게시글 주소: https://io.orbi.kr/00026836238
해당년도 | 2016 | 2017 | 2018 | 2019 | 2020 |
모집인원=a | 83 | 86 | 99 | 78 | 76 |
지원자수=b | 295 | 286 | 393 | 257 | 199 |
추가합격인원=c | 56 | 49 | 55 | 42 | x |
점공이용자수=d | ? | 242 | 160 | 128 | |
최초합격자=e | 1등~90등 | 1등~70등 | y | ||
추가합격자=f | 91등~138등 | 71등~106등 | z |
우리는 과거 입시 결과를 통해 올해, 더 나아가 미래까지 예측할 수 있습니다. 여기서 예측은 단순한 예측이 아닌 과거 입시 결과 즉 빅데이터에 기반한 예측입니다. 그렇기에 필자는 통계적인 방법을 사용하여 올해 연경제를 분석하기로 했습니다.
제가 예전에 작성했었던 게시글 중 '모집 인원의 중요성' 이라는 글이 있는데 그 글에서 대형 모집 단위의 특징은 안정성이라고 말씀드린적이 있습니다. 이런 안정적인 데이터들이 쌓이고 쌓이면 비로소 통계적인 방법을 사용할 수 있고 신뢰도도 매우 높을 것입니다.
그러나 통계적인 방법을 사용하여 올해 연경제를 분석하기에 앞서 변수들간의 상관 관계를 체크하는 과정에서 소위 말하는 '튀는 값'들을 발견했습니다. 통계에서 튀는 값들을 발견하면 골때리게 되는데 여기서 튀는 값들이란 쉽게 말해서 이질적인 값이라 할 수 있습니다.
위 표에서 모집인원, 지원자 수 등은 변수이며 x, y 등은 우리가 알고자 하는 값들이니 미지수가 됩니다. a, b는 편의를 위해 변수를 문자화한 것이고요. 그럼 표를 이용해 튀는 값을 한번 찾아 보도록 하죠.
우선, 총 합격자 수/지원자 수=a+c/b라고 정의할 수 있는데 편의를 위해 이를 문자 k로 나타내겠습니다. 즉 변수들의 상관 관계 k가 정의되는겁니다. 이 k값을 4개년의 데이터들을 이용해 표로 나타내니 다음과 같은 결과가 도출되었습니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
k=a+c/b | 0.47 | 0.47 | 0.39 | 0.47 |
놀랍게도 2018년도를 제외한 나머지 k값들은 동일하게 0.47로 나타났습니다. 이것이 바로 대형 모집 단위의 특징인 안정성을 나타내는 지표입니다. 안정적이기 때문에 변수들간의 상관 관계가 동일하게 나오는 것입니다. 그렇지만 유독 2018년도에만 0.39라는 이질적인 값이 나왔는데 이것이 바로 튀는 값입니다.
만약 2018년도의 k값이 0.47이 나왔다면 올해 2020년도의 k값도 0.47일 것이므로 올해 2020년도 연경제의 추가 합격 인원인 x값은 18이 됩니다.
엥? 올해 연경제 추합 인원이 18명이 될거라고요?
여기서 튀는 값의 중요성을 알게 됩니다. 만약 2018년도의 k값이 0.39가 아닌 0.47로 나타났다면 우리는 곧이곧대로 올해 2020년도 연경제의 추합 인원을 18명이라고 단정지어 버릴 것입니다.
그러나 현재 연경제의 점공 상황을 봤을 때 서울대로 빠질 인원은 적어도 35명으로 보입니다. 이 말은 k값의 신뢰도가 높지 않다는 것을 의미합니다. 즉 튀는 값이 있기에 k값의 신뢰도가 높지 않음을 추정할 수 있는 것입니다.
우리는 이제 k값의 신뢰도가 낮으니 k값이 쓸모가 없다는 것을 알게 됩니다. 그런데 왜 k값에서 튀는 값이 발생할까요? 그 이유는 바로 k값에는 경쟁률이라는 외적 변수가 영향을 주는데 우리가 그것을 간과했기 때문입니다.
k의 정의를 다시 살펴보면 k=모집 인원+추합 인원/지원자 수이므로 나누는 수인 지원자 수에 따라 k값이 천차만별로 바뀐다는거죠. 즉 우리는 지원자 수 즉 경쟁률이 k값에 주는 영향력을 간과한겁니다. 실제로 2018년도에만 경쟁률이 약 4:1이었고 나머지 년도의 경쟁률은 약 3:1이었습니다.
지금부터 본격적으로 x, y, z, 값들을 구해보도록 하겠습니다.
우선 k값처럼 경쟁률 등 외적 변수에 최대한 영향을 안 받도록 변수들간의 상관 관계를 다시 정의해야합니다. 즉 외적 변수라 할 수 있는 경쟁률에 영향을 크게 받는 변수인 b값을 제외한 변수 a, 변수 c를 이용해 이 둘의 상관 관계를 정의하면 됩니다. 여기서 또 주의해야 할점은 변수 a와 변수 c가 외적 변수에 영향을 받는지를 살펴봐야 합니다.
우선 변수 a는 모집 인원이므로 외적 변수에 영향을 받지 않는다는 것을 쉽게 알 수 있습니다. 문제는 변수 c입니다. 변수 c는 연경제의 추합 인원인데 연경제의 추합 인원은 서울대 입결에 영향을 받지만 그 영향력은 미미하기에 변수 a와 변수 c의 상관 관계를 정의하면 됩니다.
이것을 e로 정의하면 e=c/a가 됩니다.
해당년도 | 2016 | 2017 | 2018 | 2019 |
e=c/a | 0.67 | 0.57 | 0.54 | 0.56 |
이번에도 튀는 값이 발견됬습니다. 하지만 괜찮습니다. 2016 연경제는 빵구가 발생했기에 우리는 정상 입결을 기록한 2017, 2018, 2019년도의 e값을 사용하면 됩니다. 지금까지의 내용들을 종합하자면 다음과 같습니다.
1. 외적 변수인 경쟁률을 고려하지 않고 k값을 정의하여 2020 연경제의 추합 인원을 예상하려니 2018년도의 k값이 튀므로 2016년도, 2017년도, 2019년도의 k값만을 이용하려 했으나 올해 경쟁률이 2:1대이므로 과감히 k값을 버림, 만약 2016년도, 2017년도, 2019년도의 경쟁률이 올해 경쟁률과 비슷했거나 또는 올해 경쟁률이 2016년도, 2017년도, 2019년도의 경쟁률과 비슷했다면 k값을 사용했을 것
2. k값과 다르게 외적 변수의 영향을 받지 않게 e값을 정의하여 2020 연경제의 추합 인원을 예상하려니 여전히 튀는 값이 존재하지만 그 튀는 값에 해당하는 2016년도에만 빵구가 발생했으므로 2016년도의 e값만 과감히 버림
2017년도, 2018년도, 2019년도의 e값들의 평균을 구하면 0.56이므로 이 수치를 이용해 올해 연경제 추합 인원에 해당하는 x값을 구하면 x/76=0.56
x=43
이렇게 최대한 외적 변수에 영향을 받지 않도록 각 변수간의 상관 관계를 정의한 후 y,z의 값들을 구해보면 y=67, z=103이 됩니다.
따라서 올해 연경제 최종 컷은 연대식 기준으로 740.89점이 될 것입니다.
언제까지나 개인적인 예측입니다. 참고용으로만 써주시면 감사하겠습니다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
그게 궁금하다고!!
-
실모 잘침 << 캬 이궈궈둰 오르비에 자랑하러가야징 실모 조짐 << 헐 내 약점을...
-
화1특) 2
1) 풀때는 별생각 없었는데 나와서 애들 여론보니까 킬러였음 2) 다시보니까...
-
( "2025년도 의대 증원 취소 촉구"…의대교수들 삭발·단식 투쟁, "..사직할 수밖에" ) 0
P윤석열과 보건복지부는 대책없이 졸속으로 추친한 의대증원이 현재 국민 생명을...
-
메가에서 미적 선택자중에 원래 94%가 과탐 2개였는데 이제 74%가 과탐...
-
국어 실제 시험이랑 따로 문제 푸는거랑 괴리가 너무 크다…. 0
실모 하다보면 늘겠지…!
-
같은 페이스로 뛰어도 어느순간 내가 점점 뒤쳐짐 ㅋㅋㅋㅋㅋ 진짜 오래 뛰신 분들은 보법이 다르네
-
???: 왜 6장을 다 논술로만 채우려고 하나요? ㄴ 그야 내신으로는 지금 학교도...
-
4합5쓰는데 국어불이라는 전제가 있어야 1뜰수있는데
-
접수자 48000 응시자 42000~43000 예상
-
메가스터디: 9모 미적사탐 지난해 4.1%에서 올해 11.6%로 늘어 6
메가스터디교육 풀서비스 이용자 중 수리 미적분 선택자의 탐구영역 선택 과목 조합을...
-
그건바로나
-
의료수가 조절 힘들고 싫으면 세금을 올리면 그만 아님? 특정과 특정소득 이상이면 증세를 진행시켜
-
9월 4일에 시행된 25학년도 9월 모의평가 수학의 난이도는 작년 수능, 올해...
-
서울이랑 수원이 랜덤이면 우짬.. 동국대가 위험해..
-
특히 국수
-
오피셜?)올해 수능 N수생 전년대비 2천42명 증가 9
http://www.weeklytoday.com/news/articleView.htm...
-
모의고사 세트 샀더니 키링이 딸려오네 아이돌 굿즈라도 산줄
-
의대 죽이는 방법 여러가지 아님? 더 있는거 알려주세요
-
역함수 존재할려면 원함수 도함수에서 0이 되는 곳이 없어야 하는 거 아닌가요?
-
고통스럽지만 5
고통스럽지만고통을가보자
-
현재상황 2
원끼야아아아아아아악 왜 엠바고임 그정도로 심각한거임????
-
공부 한 과목이랑 안 한 과목이랑 등수괴리가 ㅈ나 큼 ㅋㅋ 좀만 더 챙길걸 후회 ㅈ나 된다
-
제발제발제발제발
-
저 9모 화작 20분 걸렸는데 이게 점수 망한 원인인 거 같아요...
-
생기부 온라인 자동 제출 동의 눌렀으면 따로 생기부 제출 안 해도 되는 거죠?
-
틀딱들 이야기가 될 날이 온건가 이제 진짜 안나올거 같네
-
왜지??
-
영어 실모 질문 3
영어 풀모의고사 중에 강사색 많이 없고 적당히 어려운 실모 추천 좀 해주세요.
-
"북한 풍선 기폭장치 추정 물체 나왔다"...김포공항 인근 공장 화재 현장 '발칵' 3
김포국제공항 인근 화재 발생 공장에서 북한 오물 풍선의 기폭장치로 보이는 물체가...
-
기하 원점수 88 실수실수 개실수해서 21틀려먹은 거 실화냐 1일 1실모 최대 단점...
-
솔직히 생명은 막전위랑 근육은 괜찮은데 유전을 너무 못해서 3을 목표로 하는게...
-
인서울 어디 라인부터 확기 못하면 떨어질 확률 높아지나요?
-
쪽지로 수학 5->3 어떻게 했냐고 질문주셔서 답드리려고 하는데 쪽지는 사진 첨부가...
-
6모 22111 9모 11111 짜피 수능 때 박을 거 같아서 걍 외대나 시립대...
-
탐구 결정해따 4
내일부터 내년 6모까지 생2 지1로 생2 하루 3시간씩 6모 결과 미적 1컷 /...
-
안나온다고 봐도 무방한가요?
-
확기를 못해서 수논 6장을 못쓴다는 슬픈이야기가 있다. 4
나는 그이야기를 무척 싫어한다
-
나같은 논술경험없는 범부에겐 에바겟지
-
리미트 완강 했는데 이 다음 남은 시간에 뭘 하는게 제일 효율적일까요?? 9모는...
-
적백 딱 한번만뜨면 성불할수있는데.ㅜㅜ
-
제가 만년 3등급에 30번대를 무자비하게 틀리는데 기출 제대로 푼적 없어서 자이...
-
전 국수영사탐 3:4:1:2:2
-
ㅈㄴ떨리네여 지금 쓰는게 1.심리적안정을 위한 공대 2.최저도 괜찮고 내신도...
-
나는 미적분 2024 만점 이번 9모 92(“ 6모는 학교 다녀서 못봄 “) 인...
-
뭔가요..?30번까지 다맞췃는데 유일하게 틀린 26번 은동전 앞나올 확률이 5...
-
5받았다고 하니까 엄마가 노력으로 3까진 다 되는거 아니야? 하시는데...
-
푸는 순서나 시간 훈련하고싶은데 쉬운 실모 추천해주세요
740.89가 누백으로 얼마정도예요?
GS 식 0.5 중반일 겁니다
0.5xx 일듯
분석글 감사드립니다
gs 코석기 예상점수가 740.9이었던걸로 기억하는데.... 재밌네요
3.3 기준으론 740.59 인데 맞다면 ㄷㄷ
정말 그분은 입시계의 거물이신 것 같아요. 저 머띵좌 도저히 따라가질 못하겠습니다.
아 바로 앞에서 끊기게 생겼다...
꼭 붙으실겁니다.
혹시 정외도 해주실 수 있나요...?
우리가 일반적으로 알고 있는 내용에 살을 덧붙이니 훨 좋네요
그리고 통계라는게 확실하게 찝어서 이야기를 할 수 없기때문에 좌우로 진동할거 생각하면 높으면 741 낮으면 30중반대까지로 볼 수 있겠네요.
공감합니다. 통계를 입시에 적용하니까 더 복잡해지더라고요. 저도 개인적으로 연경제 컷좀 내려갔으면 하는 바람입니다.
ㅊㅊ
네? 전 수험생 아닙니다.
이 글에 추천을 한다는 뜻이였습니다
그렇군요. 감사합니다.