Chapter_1_1_Python_visualisation_intro

Page content

공지

제 수업을 듣는 사람들이 계속적으로 실습할 수 있도록 강의 파일을 만들었습니다. 늘 도움이 되기를 바라며. 참고했던 교재 및 Reference는 꼭 확인하셔서 교재 구매 또는 관련 Reference를 확인하시기를 바랍니다.

I. Matplotlib

(1) 기본 개요

Matplotlib는 파이썬 표준 시각화 도구라고 불리워지며 파이썬 그래프의 기본 토대가 된다고 해도 무방하다. 객체지향 프로그래밍을 지원하므로 세세하게 꾸밀 수 있다.

Seaborn 그래는 파이썬 시각화 도구의 고급 버전이다. Matplotlib에 비해 비교적 단순한 인터페이스를 제공하기 때문에 초보자도 어렵지 않게 배울 수 있다.

(2) matplotlib & Seabon 설치

설치방법은 윈도우 명령 프롬프트, MacOS, Linux 터미널에서 pip install matplotlib입력하면 되지만, 간혹 여러 환경에 따라 달라질 수 있으니 관련 싸이트에서 확인하기를 바란다.

II. 기본적인 시각화 문법

  • 시각화 문법은 아래와 같다.
import matplotlib.pyplot as plt
plt.plot("X축 리스트", "Y축 리스트")
plt.show()
import matplotlib.pyplot as plt
x = [1,2,3,4] # list
y = [1,4,2,3] # list

plt.plot(x, y)  # Matplotlib plot.
plt.show()

png

III. Pandas + Matplotlib

  • Pandas로 가상의 데이터프레임을 만든 후, Matplotlib로 시각화를 진행한다.
  • 이 때, 산점도를 작성하는데, num_A는 x축, num_B는 y축으로 지정한다.
import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame({
    'age':[23,78,22,19,45,33,20],
    'gender':['M','F','M','M','M','F','M'],
    'region':['A','B','B','A','C','C','A'],
    'num_A':[2,0,0,3,2,1,4],
    'num_B':[5,1,0,5,2,2,3]
})

df.plot(kind='scatter', x='num_A', y='num_B')
plt.show()

png

IV. What’s Next

  • 이번 시간에는 간단하게 Python에서 실행하는 matplotlib 시각화의 기본적인 문법에 대해 배웠습니다.
  • 다음 시간에는 seaborn에 대해서 배워보도록 합니다.