개요 작업 2유형(머신러닝)을 보다 쉽게 대비할 수 있도록 튜토리얼을 준비했습니다. 핵심 키워드 : Python 머신러닝은 pipeline 코드로 기억하자 본 코드는 구글 코랩에서 작성하였습니다. 유투브 유투브에서 강의 영상을 시청할 수 있습니다. (구독과 좋아요) 데이터 출처 본 데이터는 K-Data에서 가져왔습니다. 구글 드라이브 연동 데이터를 가져오기 위해 구글 드라이브와 연동합니다. from google.colab import drive drive.mount("/content/drive") Mounted at /content/drive 라이브러리 불러오기 아래 라이브러리들을 모두 암기하시기를 바랍니다. import pandas as pd import numpy as np from sklearn.
작업형 2유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 주요 라이브러리 palmerpenguins : 팔머펭귄 데이터셋의 목표는 iris 데이터셋의 대안으로 데이터 탐색 및 시각화를 위한 데이터셋 제공. scikit-learn : 머신러닝을 위한 라이브러리 lightgbm : LightGBM은 Microsoft에서 개발한 오픈 소스 기계 학습 라이브러리로, 대용량 데이터셋에서 빠른 속도와 높은 성능을 제공하는 것이 특징 주의 각 코드에 대한 설명은 별도로 하지 않습니다.
작업형 2유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 주요 라이브러리 palmerpenguins : 팔머펭귄 데이터셋의 목표는 iris 데이터셋의 대안으로 데이터 탐색 및 시각화를 위한 데이터셋 제공. scikit-learn : 머신러닝을 위한 라이브러리 lightgbm : LightGBM은 Microsoft에서 개발한 오픈 소스 기계 학습 라이브러리로, 대용량 데이터셋에서 빠른 속도와 높은 성능을 제공하는 것이 특징 주의 각 코드에 대한 설명은 별도로 하지 않습니다.
작업형 3유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 라이브러리 확인 파이썬에서 가설검정을 위한 통계와 관련된 라이브러리는 크게 2가지이다. scipy : SciPy는 수치 계산, 최적화, 선형 대수, 신호 및 이미지 처리, 통계 분석 등과 같은 과학적 계산 작업을 수행하는 데 사용됨 statsmodels : Statsmodels는 통계 분석과 추정을 위한 파이썬 라이브러리로, 선형 회귀, 로지스틱 회귀, 시계열 분석, 비모수적 추정 등 다양한 통계 모델을 지원함.