AI - 국민청원 분류

NLP (Natural Language Processing)

  • 다양한 분야가 존재
  • Text Classification, Sentiment Analysis, Summarization, Machine Translation, Question Answering

국민청원 분류

  • TextCNN 이라는 모델을 적용
  • 수많은 청원 글 중 주목받을 만한 글을 예측하는 것이 목적
  • 관심이 필요한 많은 사연들에 사람들의 눈길이 한 번 더 닿는 것

프로젝트의 전체적인 흐름

  • "주목받을 만한" 이라는 표현이 모호함
  • 주관적 판단을 배제할 수 있는 방법으로 Deep Learning 도입
  • Model 을 통하여 높은 청원 참여인원을 기록한 글들의 특징을 학습하여 새로운 글이 입력되었을 때 청원 참여인원이 높은 글들과의 유사성을 계산하여 주목받을 만한 글인지 아닌지 판단
  • 1. 국민청원 페이지 크롤링 -> 2. 데이터 전처리 -> 3. 토크나이징 및 변수 생성 -> 4. 단어 임베딩 -> 5. 실험 설계 -> 6. TextCNN

 

'Data Engineer > AI' 카테고리의 다른 글

FastAPI 시작하기  (1) 2024.11.23
DeepFace Recognition  (2) 2024.11.22
AI - 작물 잎 사진으로 질병 분류  (3) 2024.11.16
AI - Pytorch  (6) 2024.11.14
AI - DL  (0) 2024.11.12