데이터 전처리 과정 1. 문제 정의 및 가설 문제를 명확하게 정의하는 것이 가장 중요하다. 문제 정의부터 잘못 접근했다면 나오는 결과 또한 무의미한 결과이기 때문이다. 문제 정의에 앞서 배경을 살펴보고 전체적인 맥락을 이해하는데 중점을 둔다. 배경을 이해하는데 도움이되는 것은 도메인 지식이다. 문제를 정의했다면 “이 문제를 해결함으로 어떤 것이 해결 되는가?” 를 생각해야 한다. 즉 데이터 분석의 목적을 정의하고 그 문제를 해결하기 위한 가설을 세워야한다. i. 프로젝트시 고려사항 목적과 데이터 특성에 맞는 모델을 무엇인가? 일반화 가능성은 어떠한가? 성능 측정의 지표는? 성능을 높이기 위해 어떻게 Feature Engineering을 진행할 것인가? 제품 혹은 시스템에 모델을 적용할 시 계산량이나 언어..