NLP (Natural Language Processing)
- 다양한 분야가 존재
- Text Classification, Sentiment Analysis, Summarization, Machine Translation, Question Answering
국민청원 분류
- TextCNN 이라는 모델을 적용
- 수많은 청원 글 중 주목받을 만한 글을 예측하는 것이 목적
- 관심이 필요한 많은 사연들에 사람들의 눈길이 한 번 더 닿는 것
프로젝트의 전체적인 흐름
- "주목받을 만한" 이라는 표현이 모호함
- 주관적 판단을 배제할 수 있는 방법으로 Deep Learning 도입
- Model 을 통하여 높은 청원 참여인원을 기록한 글들의 특징을 학습하여 새로운 글이 입력되었을 때 청원 참여인원이 높은 글들과의 유사성을 계산하여 주목받을 만한 글인지 아닌지 판단
- 1. 국민청원 페이지 크롤링 -> 2. 데이터 전처리 -> 3. 토크나이징 및 변수 생성 -> 4. 단어 임베딩 -> 5. 실험 설계 -> 6. TextCNN
'Data Engineer > AI' 카테고리의 다른 글
FastAPI 시작하기 (1) | 2024.11.23 |
---|---|
DeepFace Recognition (2) | 2024.11.22 |
AI - 작물 잎 사진으로 질병 분류 (3) | 2024.11.16 |
AI - Pytorch (6) | 2024.11.14 |
AI - DL (0) | 2024.11.12 |