개요 취업 준비생 들에게 필요한 캐글 연습 코드 클래스로 구현함 학습에서 제출까지 자동화하는 것에 목적을 둠 클래스에 대한 기본적인 이해가 있다는 전제하에 작성 전체 코드는 다음과 같다. import numpy as np import pandas as pd import shap import matplotlib.pyplot as plt # 데이터 처리 및 모델링 라이브러리 from sklearn.model_selection import train_test_split, cross_val_score from sklearn.preprocessing import StandardScaler, LabelEncoder, OrdinalEncoder from sklearn.impute import SimpleImputer from sklearn.metrics import ( mean_squared_error, mean_absolute_error, r2_score, mean_absolute_percentage_error ) from sklearn.
개요 캐글에서 한글폰트를 적용하는 방법에 대해 알아본다. 가장 간편한 방법은 폰트를 업로드 한 뒤 업데이트 하는 방식이다. 폰트 확인 폰트는 아래 사이트에서 다운로드 받는다. 사이트 : https://hangeul.naver.com/font 여기에서 나눔글꼴을 다운로드 받았다. 폰트 압축풀기 다운로드 폰트를 압축 풀기 하면 매우 다양한 폰트가 확인이 된다. 여기에서 나눔스퀘어 > NanumFontSetup_TTF_SQUARE 파일에서 폰트 목록을 확인한다. 폰트 업로드 이제 현재 사용하는 캐글 노트북에 추가한다. 임의의 font 폴더명을 입력했다. Create 버튼을 클릭한다. 업로드 이후에 폴더에 폰트가 들어간 것을 확인한다.
개요 API 토큰을 내려받은 후, 구글 코랩에서 데이터를 다운로드 받도록 한다. API 토큰 발급 Kaggle Profile - Settings - API를 순차적으로 클릭 후, Create New Token 버튼을 클릭한다. 아래 화면처럼 다운로드를 받을 수 있다. Google Colab API 코드 업로드 이제 해당 파일을 바탕화면 등 적당한 곳에 위치시킨 후 아래 코드를 실행한다. # kaggle.json 파일을 업로드하세요. from google.colab import files files.upload() 마지막으로 ~/.kaggle 폴더를 만들고 키 파일을 복사한 후, 보안을 위해 현재 사용자만 이 파일을 읽을 수 있도록 하는 명령어(chmod 600)를 실행한다.
개요 Wandb에 접속 후, 활용해본다. 회원가입 회원가입을 진행한다. 사이트 : https://wandb.ai/site 여기에서 Github로 로그인을 진행한다. Authorize wandb를 클릭한다. Create your account 항목에 Full name과 회사명을 입력한다. 아래와 같이 지정했다. 교육 목적으로 선택했다. 팀 이름명을 지정한다. 추후에 설정한다. API Key가 나타난다. 어딘가에 인증키를 저장해둔다. db3cce8abed215f7b3770979a0006861dbcfe4f2 추후 확인 시 User Settings을 클릭한다. Scroll Down 하면 API 키값이 나타난다. 캐글 노트북 상단 메뉴 [Add-ones] - [Secrets]를 클릭한다. Secret 값을 아래와 같이 추가한다. 추가한 후, 아래 명령어를 추가한다.
개요 PyCaret이 최근 업데이트 되면서 Kaggle에서 설치 오류가 뜨기 시작함. 메인 홈페이지 : https://pycaret.gitbook.io/docs/ 해결책은 몇가지 있으나, 그 중 Downgrade 해서 설치 할 예정 캐글 대회 시작 캐글 노트북 시작을 하면 다음 코드가 나타난다. 다음 Cell부터 진행한다. # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.
개요 jupyter notebook에서 plotly 기반의 시각화를 작성한다. jupyter notebook에서 html로 변환 시, plotly로 작성된 코드는 나타나지 않았다. 이 때 필수적으로 입력해야 할 코드를 작성한다. 필수 코드 적용 전 변환 시 간단한 시각화 코드를 작성 후, html로 변환한다. import plotly.express as px fig = px.line(x=["a","b","c"], y=[1,3,2], title="sample figure") fig.show() 아래 그림은 일반적으로 JupyterLab 에디터에서 HTML로 변환하는 과정이다. File - Save and Export Notebook As… - HTML 순차적으로 클릭한다. 그런데, HTML로 변환된 파일을 클릭하면, 위 코드에서 보였던 코드는 안 보이게 된다.
Intro Data Transformation is always important to visualise. Here, I just introduced to get value counts in different dataset. If you are newbie, please be aware of this code before you dive into visualization. # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O (e.
공지 본 포스트는 재직자 교육을 위해 만든 강의안의 일부입니다. Introduction 대회 개요 Many people struggle to get loans due to insufficient or non-existent credit histories. And, unfortunately, this population is often taken advantage of by untrustworthy lenders. Home Credit strives to broaden financial inclusion for the unbanked population by providing a positive and safe borrowing experience. In order to make sure this underserved population has a positive loan experience, Home Credit makes use of a variety of alternative data–including telco and transactional information–to predict their clients’ repayment abilities.
1줄 요약 캐글 데이터를 빅쿼리에 넣어보 캐글 데이터 다운로드 캐글 데이터를 다운로드 받습니다. !pip install kaggle Requirement already satisfied: kaggle in /usr/local/lib/python3.7/dist-packages (1.5.12) Requirement already satisfied: six>=1.10 in /usr/local/lib/python3.7/dist-packages (from kaggle) (1.15.0) Requirement already satisfied: requests in /usr/local/lib/python3.7/dist-packages (from kaggle) (2.23.0) Requirement already satisfied: urllib3 in /usr/local/lib/python3.7/dist-packages (from kaggle) (1.24.3) Requirement already satisfied: certifi in /usr/local/lib/python3.7/dist-packages (from kaggle) (2020.12.5) Requirement already satisfied: python-dateutil in /usr/local/lib/python3.7/dist-packages (from kaggle) (2.8.1) Requirement already satisfied: tqdm in /usr/local/lib/python3.
강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 Overview Can you build a model to predict the amount of water in each waterbody to help preserve this natural resource? This is an Analytics competition where your task is to create a Notebook that best addresses the Evaluation criteria below.