🎯내가 BDA 학회를 선택한 이유
학년이 올라갈수록 앞으로 어떤 직무를 선택해야 할지 고민하는 시간이 많아졌습니다. 전공 수업을 듣다 보면 여러 진로가 눈에 들어오지만, 저는 방학 동안 참여했던 프로젝트를 계기로 데이터 분야에 대한 관심이 특히 커졌습니다. 당시에는 프론트엔드 역할로 활동했는데, 화면에 단순히 결과를 출력하는 것에서 그치지 않고, 데이터를 어떻게 다루고 분석해서 의미 있는 결과를 도출하는지가 중요하다는 걸 느끼게 되었어요. 그때부터 자연스럽게 데이터 분석과 시각화라는 분야에 한 발짝 더 다가가고 싶다는 마음이 생겼습니다.
하지만 학교 안에서 관련 학회나 동아리를 찾아보니, 아쉽게도 데이터 분석을 중심으로 하는 모임은 없었고, 전공 수업도 데이터에 직접적으로 연결된 과목이 거의 없었습니다. 그래서 자연스럽게 교외에서 활동할 수 있는 곳을 찾아보게 되었는데요. 대학생들이 대외활동이나, 자소서, 등 많은 정보를 얻을 수 있는 링커리어 라는 곳에 올라오는 교외, 연합 대학생 학회를 찾아보기 시작했습니다.
🎯내가 학회를 고를 때 중요하게 본 기준
제가 학회를 찾을 때 세운 기준은 다음과 같았습니다.
- 데이터 분석에 대해 잘 모르는 초보자도 활동할 수 있는가
- 새로운 배움을 얻을 수 있는가
- 프로젝트 경험이 없어도 참여할 수 있는 열린 분위기인가
- 조별 활동을 통해 네트워크와 인프라를 쌓을 수 있는가
- 제 일정에 맞춰 꾸준히 참여할 수 있는가
이 다섯 가지 조건을 기준으로 링커리어에서 대학생 학회들을 찾아보다가,
제 눈에 들어온 곳이 바로 **BDA학회(빅데이터 분석 학회)**였습니다.
🎯BDA 학회에서 기대되는 점 / 얻어가고 싶은 것
BDA 학회를 선택한 가장 큰 이유는, 위의 모든 기준을 충족했기 때문이에요.
저는 특히 다음과 같은 부분들을 가장 기대하고 있습니다.
- 실제 데이터 분석 경험 : 단순히 이론으로 배우는 것이 아니라 직접 데이터를 다루며, 실질적인 분석 능력을 키울 수 있다는 점.
- 조별 프로젝트와 인프라 : 다양한 대학생들과 협업하면서, 앞으로의 진로에 도움이 될 수 있는 네트워크를 만들 수 있다는 점.
- 배움의 장 : 아직 경험이 부족한 저도 차근차근 따라갈 수 있는 커리큘럼과 분위기 속에서 새로운 지식을 얻을 수 있다는 점.
- 다양한 원데이 클래스: 하나에 국한되지 않고 다양한 분야의 지식을 쌓고 경험할 수 있다는 점
🎯마무리
이번 학회에서 저는 데이터분석입문(ML) 커리큘럼에 참여하게 되었습니다. 아직은 배워야할 것이 많지만, 꾸준히 노력하면서 성장해나가고 싶네요. 또한 학회나 동아리 같은 활동에 참여하는 건 제게 처음인데, 올해는 다양한 활동에 도전해보기로 마음먹은 다짐을 차근차근 지켜가고 있는 것 같아 뿌듯합니다.
[1주차 수업 리뷰]
<데이터분석 표준 프로세스 (CRISP-DM)>
전체프로세스 부분을 벽에다가 붙여놓고 자주 보고 외워라고 하실 정도로 강사님께서 가장 강조하신 부분이었습니다.

① Business Understanding
문제를 정의하고 요인을 파악하기 위해 가설을 수립하는 단계입니다.
여기서 중요한 개념은 가설(hypothesis) 설정입니다.
- 귀무가설 : 기존 연구나 일반적으로 알려진 정설
- 대립가설 : 기존 입장을 넘어서는 새로운 연구 가설
이때 우리가 데이터분석에서 다루는 가설은
보통 대립가설입니다!
대립 가설을 수립하기 위해
- 해결해야 하는 문제 y
- 문제(y)를 설명하기 위한 요인 x
- 가설의 구조: x → y
를 정의해야 합니다.
② Data Understanding
문제를 정의했다면, 이제는 데이터를 이해하는 단계입니다.
데이터의 원본을 확인하고, 이를 어떻게 활용할 수 있을지를 구분해야 합니다.
- 있는 데이터
- 그대로 사용 가능: 추가 가공 없이 활용
- 가공 후 사용 가능: 전처리나 변환을 거쳐야 활용
- 없는 데이터
- 취득 가능: 취득 비용 산정, 과제 수행
- 취득 불가능: 정보의 의미 정의 -> 정보 분할, 최대한 가용한 데이터 영역으로 만들기
데이터를 확보했다면, 다음 단계는 데이터 셋을 분석해야합니다.
- EDA (Exploratory Data Analysis) 탐색적 데이터 분석
데이터를 직관적으로 이해하기 위해 그래프를 그리고, 통계량을 계산하며, 결측치나 이상치를 확인하는 과정입니다. - CDA (Confirmatory Data Analysis) 확증적 데이터 분석
가설을 세우고, 통계적 검정이나 실험을 통해 이를 확인하는 단계입니다.
👉 즉,
- 언제, 어떤 그래프를 그리고 어떻게 해석할지
- 언제, 어떤 통계량을 구하고 어떻게 해석할지
- 언제,어떤 가설검정 방법을 사용하고 어떻게 해석할지
를 체계적으로 수행하는 것이 목표입니다.
④ Data Preparation
모델링을 하기 전, 데이터를 준비하는 과정입니다.
- 모든 셀에 값이 존재해야 하며
- 모든 값은 숫자여야 하고
- 필요하다면 값의 범위를 일치시켜야 합니다
수행되는 작업에는
- 결측치 처리
- 가변수화
- 스케일링
- 데이터 분할
등이 있습니다.
⑤ Modeling
준비된 데이터를 활용해 예측 모델을 만드는 단계입니다.
- 중요 변수들을 선택하고
- 적절한 알고리즘을 적용하여
- 예측 모델을 생성하고
- 성능을 평가합니다.
모델링이란
- 데이터로부터 패턴을 찾는 과정
- 오차를 최소화 하는 패턴
이다.
수학식으로 표현된 모델이라는 결과물이 도출됩니다.
⑥ Evaluation
만들어진 모델이 비즈니스 목표에 부합하는지를 평가하는 단계입니다.
- 모델에 대한 데이터 분석 목표와 비즈니스 목표 달성에 대한 평가
- 모델에서 추출된 패턴이 진짜 규칙성을 가지는지, 특정 데이터에만 나타나는 특이한 성질인지 확인
- 비즈니스 목표에 부합되는지 보장
- Test Set을 이용해 모델에 대한 최종 평가를 진행하고 비즈니스 기대 가치와 비교합니다.
⑦ Deployment
마지막은 모델을 실제 운영 환경에 배포하는 단계입니다.
- 프로덕션 환경의 파이프라인, 모델 및 배포가 고객 목표를 충족하는지 확인
- 운영 시스템에서 품질 유지 기준을 정하고 모니터링 계획을 세움
- 데이터 수집 → 모델 배포 → 관리까지 파이프라인으로 구성
'BDA' 카테고리의 다른 글
| [BDA] 6주차 수치형 vs 수치형 (0) | 2025.11.23 |
|---|---|
| [BDA] 5주차 단변량 분석 범주형 (0) | 2025.11.06 |
| [BDA] 4주차 단변량 분석 (1) | 2025.10.13 |
| [BDA] 3주차 데이터 시각화 (0) | 2025.10.02 |
| [BDA] 2주차 파이썬 기초, 판다스 복습 (0) | 2025.09.29 |