본문 바로가기
배우고 씀

[python] 판다스 시리즈, 데이터 프레임 만들기(Series,DataFrame)

by 혜팡이 2020. 9. 5.
300x250

판다스에 있는 메서드 호출을 위해서는 'pandas.메서드()' 형식으로 불러줘야 한다. 

매번 pandas를 다 입력하기에는 비효율적이기 때문에

import를 할 때 import pandas as pd로 축약해준다. 

 

 

시리즈(Series) 만들기

판다스의 시리즈(Series) 메서드를 사용. 

 

시리즈 메서드의 index인자를 이용해서 리스트 형식으로 인덱스를 지정할 수 있다.

index=['문자열1', '문자열2','문자열3']

 

 

 

시리즈(Series)를 데이터 프레임으로 만들기 

+ 이렇게 만든 시리즈를 .to_frame() 메소드를 이용해서 데이터 프레임 형식으로 바꿔줄 수도 있다.

 

이렇게 만들어진 데이터 프레임은 .columns를 이용해 열 이름 변경을 해주고 이용하면 된다.

 

 

 

데이터 프레임 만들기

데이터 프레임은 판다스의 데이터 프레임에 '딕셔너리'를 전달해서 만들 수 있다. 

pd.DataFrame({열이름1 : [' 요소1 ', '요소2 '],

   열이름2 : [' 요소3',' 요소4']})

 

 

데이터 프레임에서도 index 인자를 이용해서 인덱스 지정이 가능하고, columns인자를 이용하면 열 순서를 바꿀 수 있다. 괄호가 많다보니 헷갈릴 수 있는데,

 

pd.DataFrame({ 데이터 입력 }, columns=[  ], index=[  ])

위와 같은 형식으로 만들어줘야 한다는 걸 기억해야 한다.

 

 

 

반응형