Python

Pandas 결측치 예제

Yukart 2022. 2. 16. 09:23
반응형

결측치 확인

  • Python Pandas 라이브러리의 isnull() 활용
s = pd.Series([1, 2, 3, np.nan] * 3) # 4행 3열의 null 값이 존재하는 2차원 데이터

s.isnull().sum() # null 값의 건수 = 3

결측치 채움

  • Python Pandas 라이브러리의 fillna() 활용
  • fillna()는 return값이 복제본이다. 따라서 inplace = True 를 명시하지 않으면 원본 데이터의 변경을 피할 수 있다.
s.fillna(4) # null 값을 모두 4로 채움

원본 데이터와 비교

# 원본 데이터
print(s)

# 결과
0     1.0
1     2.0
2     3.0
3     NaN
4     1.0
5     2.0
6     3.0
7     NaN
8     1.0
9     2.0
10    3.0
11    NaN
dtype: float64

#fillna(4)로 채운 s1
print(s1)

# 결과 
0     1.0
1     2.0
2     3.0
3     4.0
4     1.0
5     2.0
6     3.0
7     4.0
8     1.0
9     2.0
10    3.0
11    4.0
dtype: float64

원본데이터는 지키면서 새로운 변수에 담을 수 있게 복제본을 반환한다.

🔗참조 링크

https://wikidocs.net/75115

https://pandas.pydata.org/docs/reference/api/pandas.Series.html

반응형

'Python' 카테고리의 다른 글

[Python] Selenium 사용법 정리  (0) 2023.09.18
Pandas IO File Format  (0) 2022.03.27
Pandas map, apply 예제  (0) 2022.02.16
Pandas 데이터 타입  (0) 2022.02.16