Machine LearningMachine Learning 이란 어떠한 것의 성능을 향상시키기 위해 경험에 근거해서 발전시키는 알고리즘이다. 예를 들어, 체스 게임을 하는 프로그램이 많이 이기기 위한 Machine Learning 알고리즘이 존재한다고 가정해보자.여기서 행위를 세 가지로 분류할 수 있음.T (Task) : 체스를 하는 행위P (Performance) : 상대방을 이길 수 있는 확률E (Experience) : 스스로 체스 게임을 하는 것 체스 게임을 반복하면서 그 수를 놓은 데이터들을 가지고 학습하여 이길 수 있는 수들을 산출하는 것. Traditional Programming 은 다음과 같이 결과를 산출하였음. 그러나, Machine Learning 에서는 다르게 결과가 산출됨. 예를..
Deep Learning Model 을 Back-end Server에 배포하기 위해 FastAPI를 알아보기 시작했다.FastAPI란? FastAPI는 공식 홈페이지에는 이렇게 적혀있다."현대적이고 빠르며 (고성능), Python 표준 타입에 기초한 Python 3.6+의 API를 Build 하기 위한 Web Framework"즉, FastAPI 라는 것은 Python 3.6+ version 에서 API를 Bulid 하기 위한 web framework 라는 것이고 빠르다는 것이 주요 장점이라고 할 수 있다. 공식 홈페이지에 나온 주요 특징들을 보면 이렇다.빠름 : Nodejs 및 Go 와 대등할 정도로 매우 높은 성능빠른 코드 작성 : 개발 속도 증가적은 버그직관적 쉽고 짧은 코드표준 기반 : OpenA..
Face Recognition System대부분의 사진이 얼굴에만 있지 않아서 face detection 을 통해 얼굴만 crop 함face alignment 로 정면을 보게 위치를 조절Augmentation 효과를 주는 Face Preprocessing 과정을 거쳐 모델 Input 으로 들어감Train 과정에서는 CNN Network를 통해 얼굴의 Feature 를 뽑고 task 에 맞는 loss를 학습한다. Closed-set Face DetectionFace detection은 Closed-set 과 Open-set 으로 나뉘어짐. Closed-set 은 train-set 에 test-set label 이 포함되어 있는 경우로 특정 회사 얼굴 인식을 생각하면 됨. Deep Learning 에서 C..
NLP (Natural Language Processing)다양한 분야가 존재Text Classification, Sentiment Analysis, Summarization, Machine Translation, Question Answering국민청원 분류TextCNN 이라는 모델을 적용수많은 청원 글 중 주목받을 만한 글을 예측하는 것이 목적관심이 필요한 많은 사연들에 사람들의 눈길이 한 번 더 닿는 것프로젝트의 전체적인 흐름"주목받을 만한" 이라는 표현이 모호함주관적 판단을 배제할 수 있는 방법으로 Deep Learning 도입Model 을 통하여 높은 청원 참여인원을 기록한 글들의 특징을 학습하여 새로운 글이 입력되었을 때 청원 참여인원이 높은 글들과의 유사성을 계산하여 주목받을 만한 글인지 아..
출처 : "한 줄씩 따라 해보는 파이토치 딥러닝 프로젝트" (이경택, 박희경, 전종섭, 김수지, 신훈철, 조민호, 이승현, 심은선, 장예은) 이미지 분류 모델을 활용하여 작물 잎 사진의 종류와 질병 유무를 판단하는 ProjectProject 에서 사용하는 총 데이터의 수는 40,000개 이고 분류 클래스와 각 클래스에 해당하는 데이터 수는 밑에 그림과 같음. 기본적인 BaseLine Model 모델을 구축 vs Pre-Trained Model 사용 (Transfer Learning 기법 사용) 후 비교! 데이터를 Train / Validation / Test 데이터로 나누고 각각의 클래스에 해당하는 폴더에 저장하는 작업을 시행하여야 함.Train Data : 모델을 훈련시키기 위한 용도Validatio..
Pytorch란?딥러닝을 다루는 Library 중 하나Python의 언어 구조와 굉장히 유사하고 간결함내부적으로 CUDA, cuDNN 이라는 API를 이용해 GPU 연산을 가능하게 하고 연산 속도가 월등히 빠름2019년 중반 이후 부터는 Pytorch 구현 논문이 많아졌음 -> 위상이 높아짐데이터의 형태로 Tensor를 사용한다는 점Tensor수학적인 개념의 "데이터의 배열"과 같음0차원 - Scalar, 1차원 - Vector, 2차원 - Matrix, 3차원 이상 - n차원 Tensor (또는 초평면) 이라고 부름 Anaconda 설치Anaconda 는 선형 대수를 다루는 Numpy, 정형 데이터를 다루는 Pandas, 여러 머신러닝 알고리즘 모델이 포함된 Sklearn 등 기본 라이브러리를 제공가상..