1. df.head()
: 앞에 10행을 샘플로 보여준다.
2. df.shpae()
:데이터 전체 행렬 구조를 보여준다.
3. df.describe()
:칼럼별로 기초기술통계를 보여준다.
4. df.info()
: 칼럼별로 행렬크기, null 유/무, 자료형
5. df.count()
: 칼럼별 카운트
6*. pd.value_counts(df.values.flatten())
: 칼럼 속성별로 카운팅을 하고 싶을 때 데이터프레임 구조에서도 할 수 있는 방법
stackoverflow.com/questions/19392226/attributeerror-dataframe-object-has-no-attribute
7.series.value_counts()
: 칼럼에서 속성 별 카운팅
8.series.unique()
: 칼럼별 갑 index 확인
pandas_1.1.0 버전 이상 지원(pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.count.html)
7-2. df.value_counts()
: 칼럼별 Row_data 총 갯수 카운팅 / 행별로 출력(axis=1)
8-2 df.nunique()
: 칼럼별 unique 갯수로 출력 / 행별로 출력(axis=1)
9. df.columns
: 칼럼 이름 index로 출력
10. df.dtypes
: 칼럼 별 데이터 타입 확인
*응용
데이터프레임에서 범주형데이터인 것만 뽑아내기
s = (df.dtypes == 'object')
object_cols = list(s[s].index)
'컴퓨팅' 카테고리의 다른 글
Anaconda_prompt (0) | 2021.01.16 |
---|---|
python_English to Korean (0) | 2021.01.15 |
HTML 입문 (0) | 2020.12.24 |
URL 이해 (0) | 2020.12.24 |
BeautifulSoup 정의 / find vs select (0) | 2020.12.23 |