본문 바로가기

Python/Pandas

[Python]Pandas 라이브러리란?

pandas 라이브러리란?

  • 테이블형 데이터를 다룰 수 있는 다양한 기능을 가진 라이브러리
  • 데이터를 다루기 위해 데이터 프레임(Dataframe)과 시리즈(Series) 제공
  • 시리즈(Series)는 1차원 데이터를 다룬다. (컬럼이 하나밖에 없다)
  • 데이터프레임(Dataframe)이 테이블형(2차원) 데이터를 다룬다. (행,렬이 같이 존재)
  • 데이터 분석/머신 러닝에서 데이터 처리를 위해 사용

pandas 데이터 타입

pandas의 데이터 타입은 파이썬과 다르다

  • [pandas] → [python]
  • object → str
  • int64 → int
  • float64 → float
  • bool → bool
  • datetime64 → 날짜/시간
  • timedelta → 두 datatime64 간의 차이

데이터 타입 변경 - Series.astype(변경할 타입)

data_type = pd.Series([1,2,3])
print(data_type)
print(data_type.astype('float'))

>>>
0    1
1    2
2    3
dtype: int64
0    1.0
1    2.0
2    3.0
dtype: float64

https://class101.net/products/5f47290f4fb5ee00159293c3