Scikit-Learn

Streamlit ML Multiclass Classification Model Prediction Sample (feat. Pipeline)

개요 Kaggle 데이터셋을 활용하여 Streamlit ML Multiclass Classification Model을 배포한다. 각 코드에 대한 자세한 설명은 여기에서는 생략한다. 데이터 수집 이번에 활용하는 캐글 데이터 수집은 아래 대회에서 train 데이터만 가져왔다. Multi-Class Prediction of Obesity Risk : https://www.kaggle.com/competitions/playground-series-s4e2 Dataset Description은 아래에서 확인하도록 한다. 링크 : https://www.kaggle.com/competitions/playground-series-s4e2/data train.csv 파일만 다운로드 받았다. 모델 개발 다음 코드는 모델을 개발하는 코드이다. 주어진 데이터셋에서 종속변수 NObeyesdad을 예측하는 모델을 구성했다. 파일명 : model.py import pandas as pd from sklearn.

Streamlit ML Model Prediction Sample (feat. Pipeline)

강의소개 인프런에서 Streamlit 관련 강의를 진행하고 있습니다. 인프런 : https://inf.run/YPniH 개요 tips 데이터셋을 활용하여 Streamlit ML Model을 배포한다. 각 코드에 대한 자세한 설명은 여기에서는 생략한다. 모델 개발 다음 코드는 모델을 개발하는 코드이다. 주어진 데이터셋에서 tip을 예측하는 모델을 구성했다. 파일명 : model.py import streamlit as st import pandas as pd import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.compose import ColumnTransformer from sklearn.pipeline import Pipeline from sklearn.

Scikit-Learn ML Model with Java

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 개요 scikit-learn 모델을 JAVA에서 구동 시켜야 한다. 크게 3가지 방법론이 존재한다.(원문 참조 : Moving from Python to Java to deploy your machine learning model to production embed : Java 코드 내에서 직접 Python 코드 구현 방법.

MLFlow with Scikit-Learn

개요 Scikit-Learn 모델을 만든 후, MLFlow로 모델을 배포한다. 머신러닝 코드에 대한 설명은 생략한다. 가상환경 설정에 관한 내용도 생략한다. 라이브러리 불러오기 기존 코드에서 mlflow 라이브러리만 추가한다. %matplotlib inline import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import sklearn import seaborn as sns import mlflow import mlflow.sklearn from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split, KFold from sklearn.preprocessing import StandardScaler from sklearn.metrics import roc_auc_score, plot_roc_curve, confusion_matrix print(f"numpy version {np.

Scikit-Learn OneHot Encoding 다양한 적용 방법

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 개요 One-Hot Encoding 개념에 대해 이해한다. One-Hot Encoder 사용법을 익힌다. One-Hot Encoding One-Hot Encoding은 문자를 숫자로 변환하는 것이다. 먼저 그림을 보면서 이해하도록 한다. 머신러닝 알고리즘은 데이터가 모두 숫자인 것으로 이해하기 때문에 모두 변환해주어야 한다. OnetHotEncoder OneHotEncoder는 Scikit-Learn 라이브러리에 있는 클래스이다.