heheh
히히
heheh
전체 방문자
오늘
어제
  • 히히 (75)
    • AI (14)
      • Model (Study) (3)
      • Model (Paper) (7)
      • Tip! (4)
    • Backend (3)
      • ASP.NET (1)
      • Spring (2)
      • program (0)
      • JAVA (0)
    • Program (11)
      • Docker (3)
      • Github (5)
      • AWS (3)
    • OS (1)
      • Window (1)
      • Linux (0)
    • Python (14)
      • Python Lib (11)
      • Pytorch (1)
      • Tensorflow (1)
      • 크롤링 (1)
    • Spark (3)
      • Scala (2)
      • Pyspark (0)
      • SQL (1)
    • IOS (Swift) (0)
      • 기본 개념 (0)
    • 프로젝트 (3)
      • [AI] GAN (0)
      • [IOS] Swift (3)
      • [AI] 추천시스템 (0)
    • 분석 (1)
    • 알고리즘 풀이 (22)
      • 백준 (22)
    • 기타 (3)
      • 장비세팅 (3)
      • 소개 (0)

인기 글

최근 글

최근 댓글

hELLO · Designed By 정상우.
heheh

히히

Python/Python Lib

[Pandas] 데이터 분석 용 함수 모음

2021. 1. 6. 20:36

 

컬럼별로 데이터 확인

그룹별로 데이터 집계하기 df.groupby()
그룹별로 개수세기 pd.Series.value_counts()
유니크한 값 구하기 pd.Series.unique()
행에 접근 df.itertuples()

 

이상 데이터 처리

결측 데이터 찾기 df.isnull() / df.isnull().sum()
결측 데이터를 포함한 행 삭제 df.dropna()
중복 데이터 찾기 df.duplicated() / df.duplicated().sum()
중복 데이터를 포함한 행 삭제 df.drop_duplicates()

 

직접 데이터 처리

행 삭제 df.drop(['index명'])
(조건으로 하고싶다면 ['index명']에
: df.loc[df.column명 == 1].index )

 

 

데이터 범위 나누기

pd.cut(bins = ())
pd.Series.value_count(bins = )

'Python > Python Lib' 카테고리의 다른 글

[Pandas] 데이터 프레임 용량 줄이기 참고 링크  (0) 2021.02.07
[Pandas] 데이터 프레임 그래프로 나타내기  (0) 2021.01.26
[Numpy] 계산  (0) 2021.01.06
파이썬 : 문자열  (0) 2021.01.02
파이썬 : 오류 관련  (0) 2020.12.28
    heheh
    heheh

    티스토리툴바