4 minute read

비전공자 직장인 ADP(데이터분석전문가)자격증 필기, 실기 초시 합격 후기 및 노하우,Tip 전달

Chat gpt가 나오고 나서 뉴스나 유튜브에서 연신 AI에 대한 얘기가 나오고, 회사 내부에서도 AI, Data의 중요성을 강조하는 공지사항과 교육들이 생겨나면서 ‘시대가 변했구나’ 느끼며 뒤늦게 공부를 시작했네요. 대학도 공대긴하지만 전혀 코딩, 데이터와는 관련이 없고, 회사도 다른 분야라 시작이 막막했던게 2023년 새해 계획 세울 때네요. 23년 초부터 ADsP 시험을 시작으로 SQLD, 빅데이터분석기사, ADP 필기까지 내리 따고, 1년 뒤인 24년 5월에 ADP 실기까지 합격했습니다 ㅎㅎ

정보도 많이 없고 준비하기가 막막할 수 있기 때문에, 기쁜 마음도 표현하고 가이드도 드릴 수 있게 ADP 시험 후기를 적어보겠습니다.

필기

‘데이터에듀 - ADP필기 올패키지’ 이 책 한 권이면 필기는 충분합니다. ADsP를 따고 ADP를 따는 분들이 대부분일거라 많이 겹치기도 하고, 이론은 시간을 들이기만 하면 되서 넘어가겠습니다.

실기 (Python only)

ADP가 합격률 3%가 나오는 어려운 시험이라 불리는 이유가 실기에 있습니다.

통계 40점, 머신러닝 60점 으로 구성되어 있으며, 통계는 1시간 30분 안에 (총 시험시간 4시간) 만점(40점)을 받는다는 마음으로 시험에 들어가야합니다. 머신러닝에서는 문제를 풀기 전에 해야하는 전처리에서 문제 배점이 없이 요구될때도 있어서 시간이 꽤 걸리고, 또 문제도 난이도가 꽤 있기 때문에 점수를 충분히 확보하기 어려울 수 있습니다.

위를 염두해두고, 실기를 준비하는데 있어서는 제가 생각해봤을때는 3가지 소양이 필요하다고 느껴집니다.

  1. 통계, 머신러닝의 이론

  2. Python, Pandas 코딩 실력

  3. 통계, 머신러닝 문제 해결력

1. 통계, 머신러닝 이론

기본적으로 ADP 필기를 준비하면서 쌓아온 이론적 지식이 충분할거라 생각하시면 안됩니다. 통계에선, 문제를 보자마자 어떤 카테고리인지 파악이 되어야하고, 풀이 흐름이 어떻게 흘러갈지 그리고 가장 중요하게 결론을 어떻게 낼지가 그려져야 합니다. 다행히도 오픈북이라, 이 정도까지 떠오른다면 통계 코딩을 많은 능력치를 필요로 하지않고 라이브러리만 쓰면 되기 때문에 책보고 받아쓰기해서 풀고 결론만 깔끔하게 내면 됩니다.

회사에서 사내 Data 시험을 준비하면서 ‘일반통계학’을 엄청 세심히 봤고, 문제 풀이에 약하다고 느껴져서 사조사2급 책을 사서 문제를 많이 풀었습니다. 그러니 이제 ADsP, 빅분기, ADP 필기를 공부하면서 쌓았던 이론들이 체계적으로 정리가 되어서 문제를 보면 흐름이 보였습니다. 이론 공부할때, 특히나 검정 요소들 마다 전제조건들이 있고, 그 전제조건들을 검정하는 것들, 그리고 검정의 귀무가설을 기각하거나 채택했을때 흘러가는 흐름과 결론을 깔끔하게 내는 법을 꼭 익히시기 바랍니다.

머신러닝에선, 각 모델들의 이론을 아는 것은 ADP 실기 관점에서는 중요도가 떨어집니다. 그것보다 모델들의 분류 및 모델들간의 장단점을 명확하게 아는게 중요하다고 느껴집니다. (이번년도부터 머신러닝 시험유형이 바꼈다고 하는데 전 시험을 쳐본적이 없어서 어떻게 바꼈는지는 잘 모르겠습니다.) 책을 따로 이론과 코드로 나눠볼 필요가 없을 것 같아서 책소개는 조금 뒤에 하겠습니다. 그리고, 시계열 문제가 많이 출제되고 있고 해석이 다른 머신러닝들보다 어렵기 때문에, 시계열 공부는 꼭 하고 가시는걸 추천드립니다.

2. Python, Pandas 코딩 실력

R로 통계, Python으로 머신러닝 준비하는 분들이 꽤 있는데, 전 R까지 준비할 시간이 없을것 같아서 Python으로만 준비했습니다. (제 생각엔 충분한거 같네요)

Datamanim 에 들어가서 빅데이터분석기사(Python) Tab 에서 전처리 100문제 + 작업 1유형 연습문제는 반드시 반복해서 풀어보시는 것을 추천드립니다. 그러면 전처리는 웬만한건 다 할 수 있게 될겁니다. data 책에 보면 pandas와 numpy에 대해서 많이 나오는데 pandas는 완벽하게 numpy는 기초정도만 알아도 될 것 같습니다.

Python은 사내에서 몇 개 Tool들을 만들면서 기본적인 것들을 익혀서 따로 공부하지는 않았지만, Err가 나는 상황이 꽤 있고, 함수나 클래스를 다룰 줄 알면 시간이 많이 절약되므로 활용적인 측면에서 연습이 필요하다고 생각합니다.

Tip 으로, ADP는 시험 시작전 30분동안 시험 환경 Err 검사하는 시간이 30분 정도 있는데, 본시험때와 같은 server를 사용해서 함수나 클래스를 선언해놓으면 본시험때도 쓸 수 있습니다. EDA를 하는 문제는 반드시 나오므로, EDA form을 함수나 클래스로 만들어 놓으시면 시간을 절약할 수 있습니다. (생각보다 전체적인 시간이 부족하고, EDA 하는데 저는 많은 시간을 썼네요..)

3. 통계, 머신러닝 문제 해결력

통계에선, 앞의 이론을 마스터 했다는 가정하에 코드는 받아쓰기만 하시면 됩니다. 통계, 머신러닝 가장 많은 코딩 소스를 가지고 있는게 ‘핵심만 요약한 통계와 머신러닝 파이썬 코드북’ 이 책입니다. 이론을 본다기 보다는 카테고리를 찾아서 빠르게 받아쓰기를 하기에 좋은 코딩 더미 책 느낌입니다.

머신러닝에선, 일종의 풀이과정이 정해져 있습니다. ‘전처리 -> 검증 데이터 스플릿 -> 스케일링 -> 모델 fitting -> 모델 검증’ 이런 일련의 과정을 확실히 익혀야 하고, 그것을 가장 잘 알려주는게 ‘파이썬 한권으로 끝내기 : 데이터분석전문가(ADP) + 빅데이터분석기사 실기대비’ 이 책입니다. EDA 및 문제 풀이법까지 여러 기법들을 알려주기 때문에 초반에 흐름을 익히기에는 가장 좋은 것 같습니다. 그리고 머신러닝은 큰틀에서 여기서 벗어나지 않습니다. 여기서 부족한 이론과 코드, 모델들은 ‘파이썬 머신러닝 완벽 가이드’ 여기서 채우면 되는데, 처음부터 정독한다기 보다는 필요한 부분을 보완한다는 느낌으로 보셔도 될것 같습니다.

4. 기타 참고자료

ADP는 항상 복병 문제들이 많이 나오기 때문에 조금 넓게 알 필요가 있습니다. 근데 한번도 안보고 간 책은 결국 들고가도 볼 시간이 없습니다.

  • 실전 시계열 분석 : 시계열 분석이 많이 나오고 있는 추세라 시계열 공부는 꼭 하고 가시길 추천드립니다. 근데 전 볼 시간이 별로 없어서 잘 보지는 못했습니다.

  • 파이썬을 활용한 베이지안 통계 : 베이지안을 공부하기 위해 샀는데 역시 볼 시간이 없어서 코드 참고용으로 들고 갔습니다. (베이지안 자체는 따로 공부를 해서 알고 있는 상태였습니다.)

  • 이외 통계쪽 복병문제를 막고자 다양한 이론들 페이퍼로 준비해갔습니다.

참고 사이트

  • 데이터전문가포럼(네이버카페) : ADsP, SQLD, 빅분기, ADP 모두 큰 도움이 되었습니다. ADP의 경우에는 후기들을 거의 다 읽으며 필요한 책들을 준비할 수 있었고 Tip들도 얻어갈 수 있었습니다. 시험을 준비하기에 꼭 가입해서 정보를 취합하기에 가장 좋은 것 같습니다.

마치며

대단한 Tip을 줄 것 처럼 했지만 다 적고나니 꼭 그렇진 않네요. 생각나면 조금씩 수정해야겠습니다 ㅎㅎ 회사에서 이쪽으로 인정을 받고 직무를 변경하고 싶은데 따로 증명할게 없어서 자격증에 노력을 좀 한 것 같습니다. 노력하는 과정에서 인정도 받고 또 회사에서 데이터 교육을 받고 있어서 1차적인 목표는 달성했는데, 공부하면 공부할수록 갈길이 멀구나 라고 느낍니다..

이제는 자격증은 졸업하고 캐글이나 실무쪽으로 프로젝트를 해볼까 생각 중에 있습니다. 글 보시는 분들도 여러 목적으로 자격증을 딸텐데 ADP 꼭 합격하길 바라겠습니다 !

Leave a comment