먼저 저는 학부때 빅데이터 융합을 부전공으로하면서 데이터 및 자료구조 알고리즘 머신러닝 통계 과목을 들었습니다. 전공자만큼 많이 배운것은 아니지만 기본 베이스 과목은 들었습니다.
이어 대학원에 진학하여 머신러닝 및 특히 딥러닝에 관련해서 많은 수업을 들었습니다. 자체 프로젝트도 여럿 진행하고있고 제 블로그이름을 보면 알 수 있다시피 딥러닝을 활용한 추천시스템에 관심이 많습니다.
빅데이터 분석기사 기사라는 자격증으로 1회 나오길래 신청을 후딱 해보았습니다.
코로나때문에 무려 4달?인가 엄청 밀리고 까먹고 있다가 일주일전에 깨닫고 부랴부랴 수제비라는 책을 주문하고 책을 약 5일만에 1회독만하고 시험을 보러갔습니다.(수제비 기준 끝에 모의고사를 봤을때 평균 80문제 중에서 12~14개정도를 틀렸던 수준(합격 여부는 나중에 추후 올리겠습니다)
1. ETL
2. 데이터 수집 관련 (관계형 데이터베이스 - 크롤링 오답이었습니다)
3. 데이터 분석 절차
4. boxplot
5. 혼동행렬은 2문제정도 나왔던것 같습니다 (TP, FP 비율, 민감도, 특이도)
6. 조건부 확률을 활용한 베이즈 정리 공식
7. MDS
8. MLE(이 부분은 아예 계산문제가 나왔습니다
9. ROC관련문제도 2문제 나왔습니다(x축=1-특이도, y축=민감도 만드시 기억해두기)
10. 종속변수에 따른 모델 선정 평가
11. 지도학습/비지도학습 구분
12. 파라미터/하이퍼파라미터 구분
13. 신경망 관련 하이퍼마리피터
14. dropout
15. CNN filter stride
16. 이산확률분포, 연속확률분포 구분
17. 신뢰수준 계산
18. 단측검정 p-value(Z분포, T분포)
19. 이상치가 있을때 사용하면 좋은 대푯값
20. 데이터 거버넌스
21. SVM특징
22. 관계/비교 시각화
23. 로지스틱회귀분석 종속변수는 범주형 독립변수는 연속형
처음에 책을 보는데 데이터 적재 부분이랑 데이터 기획에서 1과목 외우는 과정이 모르는 부분이 많아서 많이 걱정했는데 생각보다 무사히 넘어가고
2, 3, 4 과목은 생각보다 딥하게 나와서 놀랐다. 책을 통해서 공부한 부분에서도 도움을 많이 받았다. 그 외적으로는 책에 없는 부분이 조금 많았고 많은 사람들이 이 부분에서 실망을 한 것 같다. 하지만 1회시험이고 집필진들도 어떻게 다 알 수있겠냐라는 생각이든다... 출제위원 마음까지는 알아보기 힘들테니...
결론적으로 나는 책에서 반정도 도움을 받고 그동안 배운 지식으로 반정도 도움을 받았던 것 같다. 나는 거의 약 3년동안 데이터 관련쪽을 공부했기 때문에.. 마치 통계시험도 코앞이라 큰 도움을 받았는데 비전공자들 입장에서는 당황스러웠을 것 같다... 결과적인 제 한줄평 느낌은 통계 / 머신러닝 학교 전공 중간,기말 고사를 간단하게 앞에 나오는 객관식문제로 본 느낌이었다.
다음 2회때 얼마나 바뀔지 모르겠으나 통계부분에서 가설 검정하는거 꼭 한번 해보고 가시고 머신러닝은 딥하게 안나왔지만 파라미터나 하이퍼파라미터 범주형인지 연속형인지 딥러닝같은 경우는 CNN이 filter stride가 나온것처럼 다음번에 도 간략한 개념을 묻는 기초 계산문제가 나올 수 있으니 이 부분도 공부하시면 좋을 것 같습니다.
다들 좋은 결과 있기를 바라겠습니다!!
5/7 높은점수는 아니지만 어떻게 일주일도 공부안하고 본거 치고는 괜찮네요!
주위 사람들보면 워낙 데이터분석쪽으로 공부를 하셨던 분들은 1과목2과목 정도만 공부해도 3,4과목은 무난한것 같습니다.
다만 비전공자이신분들은 3,4과목도 조금 더 무겁게 느껴지실테니 시간을 조금 더 투자하면 좋을것 같네요
댓글