[Week 11] Day 1 - TIL

Topics

  • Kaggle 소개
  • Kaggle competitions
  • Kaggle 대회 실습

1. Kaggle 소개

❶ Kaggle code

  • Data science module 설치된 Jupyter python notebook 사용 가능
  • 공유가 가능하여 학습에 최적화됨

❷ Kaggle ranking

  • Competitions, Datasets, Notebooks, Discussions 등을 통하여 Level 결정
  • Novices ➡️ Contributor ➡️ Experts ➡️ Masters ➡️ Grandmasters 순서로 금 / 은 / 동 메달의 기준은 각각 따로 정해져 있음
  • 이력서를 작성할 때 우대사항

2. Kaggle Competitions

  • Dataset Hosting
  • Real-time Leaderboards
  • Preloaded Metrics
  • Discussion Forums
  • Automated Scoring
  • Kaggle Notebooks

 

 ❶ 회사 관점 (대회 Hosting)

  • Community : 보통 상금이 존재하지 않고, 개인이나 단체에서 주최
  • Featured : 상금이 존재하고, 기업에서 주최
  • Research : 상금이 적고, 비영리단체에서 주최

❷ 개인 관점 (학습, 경험, 이력, 금전)

  • All competitions
  • Playground
  • Simulations
  • Analytics... 

3. Kaggle 대회 실습

  • Titanic competitions 사용
  • 프로그래밍 언어 측면에서 "Hello World" 와 같은 단계

 

  • Kaggle API 는 kaggle notebook 사용하지 않고 본인의 환경에서 Modeling 하고 싶은 경우 사용함.

Titanic competitions 

  • train.csv : 훈련 데이터
  • test.csv : 테스트 데이터
  • gender_submission.csv : 제출 예제

즉, "Survived" column 을 예측하는 것이 목적.

 

 

'Bootcamp' 카테고리의 다른 글

[Week 14] Day 1 - TIL  (3) 2024.02.23
[Week 11] Day 2 - TIL  (1) 2024.02.06
[Week 10] Day 1 - TIL  (2) 2024.02.05
[Week 8] Day 4 - TIL  (4) 2024.01.12
[Week 8] Day 1 - TIL  (2) 2024.01.08