컬럼별로 데이터 확인
| 그룹별로 데이터 집계하기 | df.groupby() |
| 그룹별로 개수세기 | pd.Series.value_counts() |
| 유니크한 값 구하기 | pd.Series.unique() |
| 행에 접근 | df.itertuples() |
이상 데이터 처리
| 결측 데이터 찾기 | df.isnull() / df.isnull().sum() |
| 결측 데이터를 포함한 행 삭제 | df.dropna() |
| 중복 데이터 찾기 | df.duplicated() / df.duplicated().sum() |
| 중복 데이터를 포함한 행 삭제 | df.drop_duplicates() |
직접 데이터 처리
| 행 삭제 | df.drop(['index명']) (조건으로 하고싶다면 ['index명']에 : df.loc[df.column명 == 1].index ) |
데이터 범위 나누기
| pd.cut(bins = ()) |
| pd.Series.value_count(bins = ) |
'Python > Python Lib' 카테고리의 다른 글
| [Pandas] 데이터 프레임 용량 줄이기 참고 링크 (0) | 2021.02.07 |
|---|---|
| [Pandas] 데이터 프레임 그래프로 나타내기 (0) | 2021.01.26 |
| [Numpy] 계산 (0) | 2021.01.06 |
| 파이썬 : 문자열 (0) | 2021.01.02 |
| 파이썬 : 오류 관련 (0) | 2020.12.28 |