Kaggle

Kaggle ML Submission 클래스 만들기

개요 취업 준비생 들에게 필요한 캐글 연습 코드 클래스로 구현함 학습에서 제출까지 자동화하는 것에 목적을 둠 클래스에 대한 기본적인 이해가 있다는 전제하에 작성 전체 코드는 다음과 같다. import numpy as np import pandas as pd import shap import matplotlib.pyplot as plt # 데이터 처리 및 모델링 라이브러리 from sklearn.model_selection import train_test_split, cross_val_score from sklearn.preprocessing import StandardScaler, LabelEncoder, OrdinalEncoder from sklearn.impute import SimpleImputer from sklearn.metrics import ( mean_squared_error, mean_absolute_error, r2_score, mean_absolute_percentage_error ) from sklearn.

kaggle 한글폰트 적용

개요 캐글에서 한글폰트를 적용하는 방법에 대해 알아본다. 가장 간편한 방법은 폰트를 업로드 한 뒤 업데이트 하는 방식이다. 폰트 확인 폰트는 아래 사이트에서 다운로드 받는다. 사이트 : https://hangeul.naver.com/font 여기에서 나눔글꼴을 다운로드 받았다. 폰트 압축풀기 다운로드 폰트를 압축 풀기 하면 매우 다양한 폰트가 확인이 된다. 여기에서 나눔스퀘어 > NanumFontSetup_TTF_SQUARE 파일에서 폰트 목록을 확인한다. 폰트 업로드 이제 현재 사용하는 캐글 노트북에 추가한다. 임의의 font 폴더명을 입력했다. Create 버튼을 클릭한다. 업로드 이후에 폴더에 폰트가 들어간 것을 확인한다.

Kaggle - Colab API 연동

개요 API 토큰을 내려받은 후, 구글 코랩에서 데이터를 다운로드 받도록 한다. API 토큰 발급 Kaggle Profile - Settings - API를 순차적으로 클릭 후, Create New Token 버튼을 클릭한다. 아래 화면처럼 다운로드를 받을 수 있다. Google Colab API 코드 업로드 이제 해당 파일을 바탕화면 등 적당한 곳에 위치시킨 후 아래 코드를 실행한다. # kaggle.json 파일을 업로드하세요. from google.colab import files files.upload() 마지막으로 ~/.kaggle 폴더를 만들고 키 파일을 복사한 후, 보안을 위해 현재 사용자만 이 파일을 읽을 수 있도록 하는 명령어(chmod 600)를 실행한다.

Kaggle Wandb API 설정

개요 Wandb에 접속 후, 활용해본다. 회원가입 회원가입을 진행한다. 사이트 : https://wandb.ai/site 여기에서 Github로 로그인을 진행한다. Authorize wandb를 클릭한다. Create your account 항목에 Full name과 회사명을 입력한다. 아래와 같이 지정했다. 교육 목적으로 선택했다. 팀 이름명을 지정한다. 추후에 설정한다. API Key가 나타난다. 어딘가에 인증키를 저장해둔다. db3cce8abed215f7b3770979a0006861dbcfe4f2 추후 확인 시 User Settings을 클릭한다. Scroll Down 하면 API 키값이 나타난다. 캐글 노트북 상단 메뉴 [Add-ones] - [Secrets]를 클릭한다. Secret 값을 아래와 같이 추가한다. 추가한 후, 아래 명령어를 추가한다.

PyCaret Kaggle Notebook (Since April 10, 2022)

개요 PyCaret이 최근 업데이트 되면서 Kaggle에서 설치 오류가 뜨기 시작함. 메인 홈페이지 : https://pycaret.gitbook.io/docs/ 해결책은 몇가지 있으나, 그 중 Downgrade 해서 설치 할 예정 캐글 대회 시작 캐글 노트북 시작을 하면 다음 코드가 나타난다. 다음 Cell부터 진행한다. # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.

Convert Plotly Jupyterlab to HTML

개요 jupyter notebook에서 plotly 기반의 시각화를 작성한다. jupyter notebook에서 html로 변환 시, plotly로 작성된 코드는 나타나지 않았다. 이 때 필수적으로 입력해야 할 코드를 작성한다. 필수 코드 적용 전 변환 시 간단한 시각화 코드를 작성 후, html로 변환한다. import plotly.express as px fig = px.line(x=["a","b","c"], y=[1,3,2], title="sample figure") fig.show() 아래 그림은 일반적으로 JupyterLab 에디터에서 HTML로 변환하는 과정이다. File - Save and Export Notebook As… - HTML 순차적으로 클릭한다. 그런데, HTML로 변환된 파일을 클릭하면, 위 코드에서 보였던 코드는 안 보이게 된다.

Kaggle Survey Data Transformation Tip

Intro Data Transformation is always important to visualise. Here, I just introduced to get value counts in different dataset. If you are newbie, please be aware of this code before you dive into visualization. # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.

Home Credit Default - Data Visualization

공지 본 포스트는 재직자 교육을 위해 만든 강의안의 일부입니다. Introduction 대회 개요 Many people struggle to get loans due to insufficient or non-existent credit histories. And, unfortunately, this population is often taken advantage of by untrustworthy lenders. Home Credit strives to broaden financial inclusion for the unbanked population by providing a positive and safe borrowing experience. In order to make sure this underserved population has a positive loan experience, Home Credit makes use of a variety of alternative data–including telco and transactional information–to predict their clients’ repayment abilities.

Kaggle-Python-Bigquery 연동 예제

1줄 요약 캐글 데이터를 빅쿼리에 넣어보 캐글 데이터 다운로드 캐글 데이터를 다운로드 받습니다. !pip install kaggle Requirement already satisfied: kaggle in /usr/local/lib/python3.7/dist-packages (1.5.12) Requirement already satisfied: six>=1.10 in /usr/local/lib/python3.7/dist-packages (from kaggle) (1.15.0) Requirement already satisfied: requests in /usr/local/lib/python3.7/dist-packages (from kaggle) (2.23.0) Requirement already satisfied: urllib3 in /usr/local/lib/python3.7/dist-packages (from kaggle) (1.24.3) Requirement already satisfied: certifi in /usr/local/lib/python3.7/dist-packages (from kaggle) (2020.12.5) Requirement already satisfied: python-dateutil in /usr/local/lib/python3.7/dist-packages (from kaggle) (2.8.1) Requirement already satisfied: tqdm in /usr/local/lib/python3.

ACEA Water, Intro to Time Series Forecasting

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 Overview Can you build a model to predict the amount of water in each waterbody to help preserve this natural resource? This is an Analytics competition where your task is to create a Notebook that best addresses the Evaluation criteria below.