Topics Kaggle 소개 Kaggle competitions Kaggle 대회 실습 1. Kaggle 소개 ❶ Kaggle code Data science module 설치된 Jupyter python notebook 사용 가능 공유가 가능하여 학습에 최적화됨 ❷ Kaggle ranking Competitions, Datasets, Notebooks, Discussions 등을 통하여 Level 결정 Novices ➡️ Contributor ➡️ Experts ➡️ Masters ➡️ Grandmasters 순서로 금 / 은 / 동 메달의 기준은 각각 따로 정해져 있음 이력서를 작성할 때 우대사항 2. Kaggle Competitions Dataset Hosting Real-time Leaderbo..
Topics Machine Learning 선형대수 확률 Machine Learning 1. Machine Learning 정의 간단히 요약하자면 데이터에서 지식을 추출하는 것을 Machine 이 스스로 할 수 있도록 학습하는 것이다. 데이터 내부에 존재하는 특징과 패턴들을 찾는 것을 스스로 할 수 있도록 하는 것이다. 여기서 특징과 패턴들을 Feature 라고 부른다. 인공지능 (AI) 과 ML, DL 의 차이와 발전되는 방향은 다음과 같다. AI : 기계가 사람처럼 생각하고 행동하면 좋겠다.. How? -> ML : 학습을 통해서 사람처럼 생각하여 예측을 진행해야겠다.. How? -> DL : 그렇다면 사람의 인지 과정을 모방해보자! ML은 명시적 프로그램인 Rule-Based Expert Syste..
Topics Data modeling Linear regression Regularization Logistic regression Support Vector Machine (SVM) Random Forest Data Modeling feature(x or input) 와 label(y or output)를 효과적으로 설명하는 함수를 만드는 일 label 존재 여부에 따른 분류 label 존재하는 경우 label 존재하지 않는 경우 supervised learning unsupervised learning label 데이터 종류에 따른 분류 continuous data categorical data regression task classification task Bayes 정리를 Data modeling..
📋 Topics 데이터 분석 이유 데이터 분석 프로세스 정규화와 스케일링 🤔 데이터 분석 이유 Amazon, Alphabet, Facebook, Netfix은 제조업이 아닌 서비스 기업인데, 이들은 "데이터를 이용한 가치"를 판매하여서 수익을 창출함. 따라서, 데이터 분석을 기반한 사업, 의사 결정은 수많은 성공 사례를 이 데이터를 통하여 보여주고 있음. So, 데이터 분석이란? 데이터를 통해 "인사이트"를 만들어내는 작업을 데이터 분석이라고 한다. 여기서 인사이트에 대한 설명은 7주차 Day 1에 기재했으므로 설명은 생략한다. https://devidas.tistory.com/2 [Week 7] Day 1 - TIL 📝 Topics - Pandas - Anaconda 데이터 분석 데이터 분석은 아래의 ..
📝 Topics - Pandas - Anaconda ✏️ 데이터 분석 데이터 분석은 아래의 4가지 과정으로 이루어진다. 1. Data Preprocessing 데이터 분석 및 처리 과정에서 가장 중요한 단계로서, 데이터를 분석 및 처리에 적합한 형태로 만드는 과정을 말한다. 데이터 전처리 단계는 아래와 같은 순서대로 진행된다.데이터 수집 -> 데이터 정제 -> 데이터 통합 -> 데이터 축소 -> 데이터 변환 데이터 전처리를 예로 들자면 중복값 제거, 결측값 보정, 데이터 연계/통합, 노이즈 제거, 데이터 구조 변경, outlier detection, feature engineering 등이 존재한다. 2. Data Analysis - visualization 가공된 데이터를 바탕으로 유용한 인사이트를 도..