Topics
- Kaggle 소개
- Kaggle competitions
- Kaggle 대회 실습
1. Kaggle 소개
❶ Kaggle code
- Data science module 설치된 Jupyter python notebook 사용 가능
- 공유가 가능하여 학습에 최적화됨
❷ Kaggle ranking
- Competitions, Datasets, Notebooks, Discussions 등을 통하여 Level 결정
- Novices ➡️ Contributor ➡️ Experts ➡️ Masters ➡️ Grandmasters 순서로 금 / 은 / 동 메달의 기준은 각각 따로 정해져 있음
- 이력서를 작성할 때 우대사항
2. Kaggle Competitions
- Dataset Hosting
- Real-time Leaderboards
- Preloaded Metrics
- Discussion Forums
- Automated Scoring
- Kaggle Notebooks
❶ 회사 관점 (대회 Hosting)
- Community : 보통 상금이 존재하지 않고, 개인이나 단체에서 주최
- Featured : 상금이 존재하고, 기업에서 주최
- Research : 상금이 적고, 비영리단체에서 주최
❷ 개인 관점 (학습, 경험, 이력, 금전)
- All competitions
- Playground
- Simulations
- Analytics...
3. Kaggle 대회 실습
- Titanic competitions 사용
- 프로그래밍 언어 측면에서 "Hello World" 와 같은 단계
- Kaggle API 는 kaggle notebook 사용하지 않고 본인의 환경에서 Modeling 하고 싶은 경우 사용함.
Titanic competitions
- train.csv : 훈련 데이터
- test.csv : 테스트 데이터
- gender_submission.csv : 제출 예제
즉, "Survived" column 을 예측하는 것이 목적.
'Bootcamp' 카테고리의 다른 글
[Week 14] Day 1 - TIL (3) | 2024.02.23 |
---|---|
[Week 11] Day 2 - TIL (1) | 2024.02.06 |
[Week 10] Day 1 - TIL (2) | 2024.02.05 |
[Week 8] Day 4 - TIL (4) | 2024.01.12 |
[Week 8] Day 1 - TIL (2) | 2024.01.08 |