본문 바로가기
Python/데이터분석 👀

[데이터분석/시각화] 데이터 확인, 선택

by narang111 2022. 2. 11.

데이터를 다루기 전에 excel 파일을 읽어왔다.

 

 

 

describe를 사용하면 계산할 수 있는 데이터에 대해서 column 별로

데이터의 개수, 평균, 표준편차, 최소/최대값 정보를 보여준다.

 

데이터 자료형 확인

 

데이터 머리/끝 부터 n개 가져온다. 괄호 안에 숫자를 넣지 않으면 default 값을 5개를 보여준다.

 

 

 

df.shape을 통해서 row, column 순서대로 크기를 알 수 있다.

 

 

1차원 데이터인 Series별로도 describe가 가능하다. 

그리고 궁금한 값만 볼 수도 있다.

 

 

count를 사용하면 NaN을 뺀 데이터의 개수가 나오고 nunique()를 하게 되면 서로 다른 데이터의 개수가 나온다. 

다른 학교가 2개였기 때문에 2가 나온것을 볼 수 있었다.

 

column 순서를 index 삼아 선택할 수 있다. 끝만 가져오고 싶다면 -1 넣어주기