본문 바로가기
Python/데이터분석 👀

[데이터분석/시각화] DataFrame

by narang111 2022. 2. 11.

DataFrame이란?

2차원 데이터(Series 모음)이다.

 

data['이름'] 이렇게 해서 1차원 데이터만 뽑아볼 수 있다.

 

 

 

 

pandas는 Dataframe으로 데이터를 처리할 수 있도록 돕는 강력한 라이브러리라는 특징이 있다.

Dataframe을 사용하기 위해서 pandas를 우선 import 해준다.

생성한 객체는 df에 넣었다.  들어간 data는 위에 사진에 있는 dictionary 형태의 데이터이다.

이런식으로 column을 한 개 이상 가져올 수 있다.

 

위에서는 df['이름'] 이런식으로 접근을 했지만

data 중에서 원하는 column만 선택하거나, 순서를 변경해서 DataFrame객체를 생성할 수 있다.

 

 

 

 

 

DataFrame 객체 생성/Index 생성

❗ index를 생성할 때에 row 개수 만큼 index 개수를 꼭 맞추어야한다.

Index를 지정했으면 Index에 이름을 붙여줄 수도, 초기화할 수도 있다.

reset_index() 를 하면 새로운 인덱스가 생기고 이전의 지원번호는 이름, 학교와 같은 컬럼이 되어버린다.

 

Inplace

지원번호 index를 지우려면 reset_index에서 drop을 True로 해준다. inplace=True 옵션은 drop한 것을 바로 실제 데이터에 반영하기 위함이다. 이걸 해주지 않으면 df.reset_index(...) 결과가 지원번호가 사라진 것이고 df 객체는 바뀌지 않는다.

바뀐 결과를 df 객체에 inplace해줘야한다.

 

Index 설정

Index를 이름으로 해줄 수도 있다.

 

Index 정렬