DataFrame이란?
2차원 데이터(Series 모음)이다.
data['이름'] 이렇게 해서 1차원 데이터만 뽑아볼 수 있다.
pandas는 Dataframe으로 데이터를 처리할 수 있도록 돕는 강력한 라이브러리라는 특징이 있다.
Dataframe을 사용하기 위해서 pandas를 우선 import 해준다.
생성한 객체는 df에 넣었다. 들어간 data는 위에 사진에 있는 dictionary 형태의 데이터이다.
이런식으로 column을 한 개 이상 가져올 수 있다.
위에서는 df['이름'] 이런식으로 접근을 했지만
data 중에서 원하는 column만 선택하거나, 순서를 변경해서 DataFrame객체를 생성할 수 있다.
DataFrame 객체 생성/Index 생성
❗ index를 생성할 때에 row 개수 만큼 index 개수를 꼭 맞추어야한다.
Index를 지정했으면 Index에 이름을 붙여줄 수도, 초기화할 수도 있다.
reset_index() 를 하면 새로운 인덱스가 생기고 이전의 지원번호는 이름, 학교와 같은 컬럼이 되어버린다.
Inplace
지원번호 index를 지우려면 reset_index에서 drop을 True로 해준다. inplace=True 옵션은 drop한 것을 바로 실제 데이터에 반영하기 위함이다. 이걸 해주지 않으면 df.reset_index(...) 결과가 지원번호가 사라진 것이고 df 객체는 바뀌지 않는다.
바뀐 결과를 df 객체에 inplace해줘야한다.
Index 설정
Index를 이름으로 해줄 수도 있다.
Index 정렬
'Python > 데이터분석 👀' 카테고리의 다른 글
[데이터분석/시각화] 데이터 확인, 선택 (0) | 2022.02.11 |
---|---|
[데이터분석/시각화] 데이터 파일 저장 및 열기 (0) | 2022.02.11 |
[Big Data] 코로나 데이터 시각화 + 구글차트 (0) | 2022.02.05 |
[Big Data] 반응형 웹페이지 + 구글 차트 (0) | 2022.02.05 |
[Big Data] 데이터베이스 (0) | 2022.02.04 |