반응형

BigData 2

PointCloud란(pcd, ply)

정의 PointCloud는 Lidar 센서로 부터 얻은 3차원의 점 데이터를 생성해주는 라이브러리다. 특징 데이터의 노이즈가 다소 포함되어 있기 때문에 데이터 전처리 과정이 필요하다. numpy 형태로 데이터를 return 한다. ply 파일 data의 모습 ply #확장자 format ascii 1.0 comment PCL generated element vertex 17228754 # point 총 갯수 property float x #point x축 값 property float y #point y축 값 property float z #point z축 값 property uchar red #rgb 컬러 값 property uchar green #rgb 컬러 값 property uchar blue #..

BigData 2022.05.16

데이터 분석 및 모델링 순서

데이터 전처리 과정 1. 문제 정의 및 가설 문제를 명확하게 정의하는 것이 가장 중요하다. 문제 정의부터 잘못 접근했다면 나오는 결과 또한 무의미한 결과이기 때문이다. 문제 정의에 앞서 배경을 살펴보고 전체적인 맥락을 이해하는데 중점을 둔다. 배경을 이해하는데 도움이되는 것은 도메인 지식이다. 문제를 정의했다면 “이 문제를 해결함으로 어떤 것이 해결 되는가?” 를 생각해야 한다. 즉 데이터 분석의 목적을 정의하고 그 문제를 해결하기 위한 가설을 세워야한다. i. 프로젝트시 고려사항 목적과 데이터 특성에 맞는 모델을 무엇인가? 일반화 가능성은 어떠한가? 성능 측정의 지표는? 성능을 높이기 위해 어떻게 Feature Engineering을 진행할 것인가? 제품 혹은 시스템에 모델을 적용할 시 계산량이나 언어..

BigData 2022.02.16
반응형