본문 바로가기
「python초짜에서 중급으로!

[DAY2_KAIST 이규민교수님 강의] pandas dataframe ①

by DayGo 2023. 2. 7.

Lecture5-1-dataframe[LECTURE]_updated.ipynb
0.11MB
who_covid19.csv
0.01MB

1. 기본 datafram 구조 파악하는 방법 헷갈리지 말자!!!!!

   -shape, info() 차이있음

df.shape
df.columns
df.values
df.dtypes



df.info()
df.describe()
df.head()
df.tail()

 

 

 

2. iloc : 순서 기반 출력, 실제 행index가 220이더라도 첫번째 순서면 0으로 봄

   loc : 실제 데이터 기반 index 출력

 

df_covid.loc[[0, 1],['Name', 'Cases - cumulative total']]   # loc는 실제 데이터의 좌표를 찍는다!!! loc[ [행] ,[열] ]

 

3. subset 출력하기

  df[        ]

df_covid['Name']  #name 컬럼만 뽑아내기, subset

여러개 컬럼을 포함한 subset 출력

subset = df_covid[['Name', 'Cases - cumulative total']]  # 여러개 컬럼을 동시에 뽑을 경우 리스트 형태로 해야함 그래서 df.covid[     []    ]  요런 형태가 되는것임

 

4. subset 불리언 구조 출력

 

df_covid[df_covid['Cases - cumulative total']>1e7]

df_covid[df_covid['Name']=='Republic of Korea']

df_covid[df_covid['Name'].str.contains("Ko")]

댓글