데이터를 다루기 전에 excel 파일을 읽어왔다.
describe를 사용하면 계산할 수 있는 데이터에 대해서 column 별로
데이터의 개수, 평균, 표준편차, 최소/최대값 정보를 보여준다.
데이터 자료형 확인
데이터 머리/끝 부터 n개 가져온다. 괄호 안에 숫자를 넣지 않으면 default 값을 5개를 보여준다.
df.shape을 통해서 row, column 순서대로 크기를 알 수 있다.
1차원 데이터인 Series별로도 describe가 가능하다.
그리고 궁금한 값만 볼 수도 있다.
count를 사용하면 NaN을 뺀 데이터의 개수가 나오고 nunique()를 하게 되면 서로 다른 데이터의 개수가 나온다.
다른 학교가 2개였기 때문에 2가 나온것을 볼 수 있었다.
column 순서를 index 삼아 선택할 수 있다. 끝만 가져오고 싶다면 -1 넣어주기
'Python > 데이터분석 👀' 카테고리의 다른 글
[데이터분석/시각화] 데이터 파일 저장 및 열기 (0) | 2022.02.11 |
---|---|
[데이터분석/시각화] DataFrame (0) | 2022.02.11 |
[Big Data] 코로나 데이터 시각화 + 구글차트 (0) | 2022.02.05 |
[Big Data] 반응형 웹페이지 + 구글 차트 (0) | 2022.02.05 |
[Big Data] 데이터베이스 (0) | 2022.02.04 |