왜 Git 그래프가 채워지지 않는가?

1줄 요약 이메일을 확인하자. 개요 필자는 강의를 위해 깃헙 계정이 여러개가 존재함 강사용 PC에서 지속적으로 Commit을 진행했으나 Github 그래프가 출력이 되지 않는 오류 발생을 해결하는 과정에서 확인 Github 질의 Why are my contributions not showing up on my profile? 이런 글이 있습니다. 그러나, 제 경우에는 제 개인 PC는 반영이 잘 되고, 강사 PC에는 안되는 상황이어서, 맞지 않은 케이스였습니다. 왜? 공통 이유 중의 하나는 이메일 이 때, 가장 중요한 것은 이메일입니다. 사실, 해당 내용에도 나오지만, 가장 흔한 이유 중의 하나라고 합니다.

Introduction to MLOps

인프런 강의 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 1줄 요약 MLOps를 소개해본다. What is MLOps? 최근 기술 트렌드 중의 Hot한 주제는 DevOps이다. Dev는 Development의 약어이며, Ops는 Operation의 약자이다. 과거에는 개발팀과 운영팀 두개로 존재하는 것이 상식이었지만, 가장 큰 문제는 Communication 문제! 이러한 문제점을 해결하기 위해 나온 방법론이 DevOps이다.

Windows 10 KoNLP 설치

한줄 요약 KoNLP는 여기에서 무조건 해결한다. KoNLP 이슈 R에서 텍스트 마이닝을 진행할 때에는 반드시 한번쯤은 패키지 설치로 인해 어려움을 겪는다. - R 입문자 분들이 초반에 호기롭게 시작하였다가 대부분 포기하려고 하는 지점이기도 하다. 사실, 조금 더 간편한 방법이 나오기를 기대한다. 1단계 Java 설치 및 환경 변수 설정 주의: 윈도우 10 64비트 여러 좋은 자료들이 많아서 같이 참고하기를 바란다. Java 설치 관련: [JAVA] Windows에 자바 설치하기! 필자는 Java 8 version을 선택했다. 설치가 완료가 되면 아래 두개의 폴더가 있는지를 확인한다.

트위터 데이터 수집 with R

1줄 요약 R을 활용하여 트위터 데이터를 수집하는 방법 및 절차에 대해 배우도록 한다. 트위터 API 인증 https://apps.twitter.com에 접속한다. 회원가입을 진행한다. create an app 버튼을 클릭한다. 필자는 Hobbysit-Exploring the API를 선택했다. 그 후에 개인 정보 등을 입력해야 한다. 휴대폰, 이메일 인증 등 인증 메일이 오기전까지는 조금 시일이 걸린다. rtweet 패키지 별도의 인증 절차 없이 사용 가능한 패키지 https://github.com/ropensci/rtweet 우선 설치 후, 사용해보도록 한다. 본 코드는 Github 예제로 있는 코드를 가져온 것임 # install.

disk.frame 패키지 소개

공지 대용량 데이터 전처리시에 필요한 패키지를 소개한다. url: https://www.youtube.com/watch?v=EOjObl_GSi4 주석은 가급적 원어를 남겨 놓으니 잘 번역하기를 바란다. 설치 설치 방법은 기존과 마찬가지로 간단하게 작성할 수 있다. install.packages("disk.frame") suppressPackageStartupMessages(library(disk.frame)) library(nycflights13) 패키지 주요 아이디어 메모리보다 많은 데이터를 각각의 chunks로 분해하여 하나의 폴더 안에 저장한다. (HDD 디스크 사용) 자세한 셜명은 Giuhub를 참고 (https://github.com/xiaodaigh/disk.frame) Setup 실습 환경을 구성한다. setup_disk.frame() ## The number of workers available for disk.frame is 1 # this allows large datasets to be transferred between sessions options(future.

Linux 기본 명령어

개요 기본 문법을 다뤄봅니다. (추가적으로 올리고 싶을 때마다 정리해서 올릴 예정입니다.) unzip 만약에 여러개의 zip 파일을 받는다면 어떻게 해야할까? 다음과 같이 할 수도 있다. $ unzip a.zip b.zip c.zip d.zip 코드가 조금 길어지는 것 같다. 간단하게 하면 다음과 같이 할 수도 있다. 캐글 대회 데이터를 직접 응용하도록 한다. $ kaggle competitions download -c sf-crime Warning: Looks like you're using an outdated API Version, please consider updating (server 1.5.10 / client 1.

CI CD Pipeline for Data Science

개요 최근 밑바닥부터 시작하는 딥러닝 3로 수업을 수강생들과 진행하며 배포에 관한 내용이 있었습니다. (p 98). 구체적인 방법은 소개하지 않아서, 보충 자료로 작성하였다. 전 단계별로 진행하는데, 깃허브에 관한 기본적인 내용 및 코드는 알고 있다는 전제하에 작성하였다. 깃허브를 처음 접하시는 분들은 Github Project 포트폴리오를 참고하기를 바란다. 필요한 것 Github: https://github.com/ Travis-CI: https://www.travis-ci.com/ Codecov: https://about.codecov.io/ PyPI: https://pypi.org/ Steps - Travis Logins Travis에 깃허브로 로그인 한다. 아래와 같은 화면이 나오면 로그인이 잘 된 것이다. 영문 내용을 잘 읽어본다.

Pandas read_csv skiprows 활용

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 문제 개요 Kaggle 데이터 New York City Taxi Fare Prediction 데이터를 구글 코랩에서 Loading 하는 중 메모리 문제가 발생함 계통추출(Systematic Sampling)을 통해 데이터를 불러오기로 함 예제 실습 아래 예제를 통해서 실제로 데이터가 줄어드는지 확인을 해본다.

ACEA Water, Intro to Time Series Forecasting

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 Overview Can you build a model to predict the amount of water in each waterbody to help preserve this natural resource? This is an Analytics competition where your task is to create a Notebook that best addresses the Evaluation criteria below.

Tutorial of Ranzcr EDA

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 Competition https://www.kaggle.com/c/ranzcr-clip-catheter-line-classification Intro Thanks to RANZCR/resnext50_32x4d starter [training] Please visit here and upvote import os import pandas as pd from matplotlib import pyplot as plt import seaborn as sns Check File Size Check Each Size of Dataset Folder in this competition train_records = 4.