Chapter_1_1_Python_visualisation_intro
Page content
공지
제 수업을 듣는 사람들이 계속적으로 실습할 수 있도록 강의 파일을 만들었습니다. 늘 도움이 되기를 바라며. 참고했던 교재 및 Reference는 꼭 확인하셔서 교재 구매 또는 관련 Reference를 확인하시기를 바랍니다.
I. Matplotlib
(1) 기본 개요
Matplotlib
는 파이썬 표준 시각화 도구라고 불리워지며 파이썬 그래프의 기본 토대가 된다고 해도 무방하다. 객체지향 프로그래밍을 지원하므로 세세하게 꾸밀 수 있다.
Seaborn
그래는 파이썬 시각화 도구의 고급 버전이다. Matplotlib
에 비해 비교적 단순한 인터페이스를 제공하기 때문에 초보자도 어렵지 않게 배울 수 있다.
(2) matplotlib & Seabon 설치
설치방법은 윈도우 명령 프롬프트, MacOS, Linux 터미널에서 pip install matplotlib
입력하면 되지만, 간혹 여러 환경에 따라 달라질 수 있으니 관련 싸이트에서 확인하기를 바란다.
- matplotlib 설치 방법: https://matplotlib.org/users/installing.html
- seaborn 설치 방법: https://seaborn.pydata.org/installing.html
II. 기본적인 시각화 문법
- 시각화 문법은 아래와 같다.
import matplotlib.pyplot as plt
plt.plot("X축 리스트", "Y축 리스트")
plt.show()
import matplotlib.pyplot as plt
x = [1,2,3,4] # list
y = [1,4,2,3] # list
plt.plot(x, y) # Matplotlib plot.
plt.show()
III. Pandas + Matplotlib
Pandas
로 가상의 데이터프레임을 만든 후,Matplotlib
로 시각화를 진행한다.- 이 때, 산점도를 작성하는데,
num_A
는 x축,num_B
는 y축으로 지정한다.
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame({
'age':[23,78,22,19,45,33,20],
'gender':['M','F','M','M','M','F','M'],
'region':['A','B','B','A','C','C','A'],
'num_A':[2,0,0,3,2,1,4],
'num_B':[5,1,0,5,2,2,3]
})
df.plot(kind='scatter', x='num_A', y='num_B')
plt.show()
IV. What’s Next
- 이번 시간에는 간단하게 Python에서 실행하는
matplotlib
시각화의 기본적인 문법에 대해 배웠습니다. - 다음 시간에는
seaborn
에 대해서 배워보도록 합니다.