Machine Learning/NLP
-
[개발 일지] 특정 corpus를 넣었을 때 그 날 경기를 이겼는지 졌는지 판별해주는 분류기 만들기 (1) : 데이터 수집Machine Learning/NLP 2021. 6. 24. 21:37
자연어 처리를 간단하게나마 독학(이라고 하기에도 민망한 수준)하고, 실습을 해 보기로 하였다. 나는 야구를 좋아하므로 이번에도 야구 관련 프로젝트를 해 보기로 했다. 프로젝트의 목표는 이렇다. 다음과 같은 분류기를 만든다. (예시로 주어진 코퍼스는 그저 예시일 뿐) case 1: input > "오늘 경기 실화....? 보는 내내 너무 스트레스 받음" output > Lose case 2: input > "선수분들 너무 수고 많았어요! 특히 8회 만루홈런은 최고!" output > Win 이를 위해 아래의 절차들을 수행한다. (1) 코퍼스 데이터, 승패 데이터 수집 (2) 적당한 전처리 (3) 분류기를 사용하여 분류 이번 글은 이 중 첫 번째 절차인 데이터 수집에 대해 개발 일지를 써 보려 한다. 개발 ..