1. 기본 datafram 구조 파악하는 방법 헷갈리지 말자!!!!!
-shape, info() 차이있음
df.shape
df.columns
df.values
df.dtypes
df.info()
df.describe()
df.head()
df.tail()
2. iloc : 순서 기반 출력, 실제 행index가 220이더라도 첫번째 순서면 0으로 봄
loc : 실제 데이터 기반 index 출력
df_covid.loc[[0, 1],['Name', 'Cases - cumulative total']] # loc는 실제 데이터의 좌표를 찍는다!!! loc[ [행] ,[열] ]
3. subset 출력하기
df[ ]
df_covid['Name'] #name 컬럼만 뽑아내기, subset
여러개 컬럼을 포함한 subset 출력
subset = df_covid[['Name', 'Cases - cumulative total']] # 여러개 컬럼을 동시에 뽑을 경우 리스트 형태로 해야함 그래서 df.covid[ [] ] 요런 형태가 되는것임
4. subset 불리언 구조 출력
df_covid[df_covid['Cases - cumulative total']>1e7]
df_covid[df_covid['Name']=='Republic of Korea']
df_covid[df_covid['Name'].str.contains("Ko")]
'「python초짜에서 중급으로!' 카테고리의 다른 글
X,Y 산점도 그리기(KAIST 이규민 교수님 인공지능 강의week8 lecture part3) (0) | 2023.08.08 |
---|---|
7 Steps to Mastering Data Cleaning and Preprocessing Techniques (0) | 2023.08.08 |
[DAY1] 쥬피터 노트북 환경설정 (0) | 2023.02.01 |
[DAY1] 쥬피터 노트북 환경설정 (0) | 2023.02.01 |
07. dataframe에서 특정 columns 선택하기 (0) | 2021.01.31 |
댓글