본문 바로가기

컴퓨팅

pandas_데이터 탐색을 위해 사용할 수 있는 함수들

1. df.head()

: 앞에 10행을 샘플로 보여준다.

 

2. df.shpae()

:데이터 전체 행렬 구조를 보여준다.

 

3. df.describe()

:칼럼별로 기초기술통계를 보여준다.

 

4. df.info()

: 칼럼별로 행렬크기, null 유/무, 자료형

 

5. df.count()

: 칼럼별 카운트

 

6*. pd.value_counts(df.values.flatten())

: 칼럼 속성별로 카운팅을 하고 싶을 때 데이터프레임 구조에서도 할 수 있는 방법 

stackoverflow.com/questions/19392226/attributeerror-dataframe-object-has-no-attribute

 

7.series.value_counts()  

: 칼럼에서 속성 별 카운팅 

 

8.series.unique()

: 칼럼별 갑 index 확인

 

pandas_1.1.0 버전 이상 지원(pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.count.html)

7-2. df.value_counts()

: 칼럼별 Row_data 총 갯수 카운팅 / 행별로 출력(axis=1)

 

8-2 df.nunique()

: 칼럼별 unique 갯수로 출력 / 행별로 출력(axis=1)

 

 

9. df.columns

: 칼럼 이름 index로 출력

 

10. df.dtypes

: 칼럼 별 데이터 타입 확인

 

*응용

데이터프레임에서 범주형데이터인 것만 뽑아내기

s = (df.dtypes == 'object')

object_cols = list(s[s].index)

'컴퓨팅' 카테고리의 다른 글

Anaconda_prompt  (0) 2021.01.16
python_English to Korean  (0) 2021.01.15
HTML 입문  (0) 2020.12.24
URL 이해  (0) 2020.12.24
BeautifulSoup 정의 / find vs select  (0) 2020.12.23