개요 MacOS m1, Big Sur에서 gcloud 환경 세팅을 해본다. 목표는 gcloud를 설치 한 뒤, 신규 프로젝트를 설치하도록 한다. Cloud SDK 시작 전 MacOS에서는 Python이 필요하다. 지원되는 버전은 Python3(권장, 3.5 ~ 3.8) 및 Python 2 (2.7.9) 이상이다. 만약 Python이 설치되지 않았다면 추가로 설치를 진행해야 한다. https://www.python.org/ Cloud SDK 시작 필요한 파일 및 설치 참고 자료는 공식홈페이지: 빠른 시작: Cloud SDK 시작하기 에서 확인한다. 압축 파일을 풀고 해당 경로로 이동한다. 이 때, 환경문제가 발생할 수 있으니, 가급적 .
강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 개요 수강생 중 1명이 캐글 경진대회에 참여하고 있는데, 시각화의 어려움을 같이 해결하면서 팁을 공유한다. 도구: Python + Seaborn + Matplotlib 캐글 데이터: https://www.kaggle.com/c/kaggle-survey-2020/notebooks?competitionId=23724&sortBy=voteCount 캐글 데이터 연동 캐글 데이터를 구글 드라이브에 업로드 한 뒤 구글 코랩과 연동한다.
강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 산점도 그래프 산점도는 두 수치형 변수의 분포를 비교하고 두 변수 사이에 상관 관계가 있는지 여부를 확인하는 데 사용됩니다. 데이터 내에 구별되는 군집/분할이 있으면 산점도에서도 명확해집니다.
(1) 라이브러리 불러오기 필요한 라이브러리를 불러옵니다.
import matplotlib.pyplot as plt import numpy as np import seaborn as sns (2) 데이터 생성 이번에는 seaborn 패키지 내 tips 데이터를 활용합니다.
개요 M1 맥북을 구입 후, 환경 설정을 하다보며, 기록을 남기기로 하였다. 환경변수에 대해 살짝 다루도록 한다. Jupyter Notebook 설치를 진행해본다. Note: 아나콘다가 아닌, Python 공식홈페이지에서 다운 받은 것을 전제로 한다. 설정 1. zsh to bash 환경으로 바꾸기 필자는 zsh는 잘 쓰지 않았다. 그런데, Mac은 Default로 bash 환경을 쓴다. 써보지 않았기에, bash로 바꾸도록 한다. (쉽다!) $ chsh -s /bin/bash 위 설정을 진행한 후, 터미널을 종료한 뒤 다시 시작한다. 만약, 현재 쉘 스크립트를 알고자 하면 아래와 같은 명령어를 입력하도록 한다.
개요 새로운 맥을 구입하면서 생긴 여러 에러를 해결하면서 기록으로 남겼다. 선수 학습 본 포스트는 기존 hugo 깃허브 블로그를 운영중인 독자들을 위한 글이다. 만약 깃허브 블로그를 처음 만드시는 분은 공식 홈페이지를 참조하기를 바란다. https://gohugo.io/getting-started/installing/ 기존 블로그 활용 필자는 blog라는 깃허브 repo가 존재하였음 따라서, blog 레포를 내려 받았다. $ git clone https://github.com/yourname/your_repo.git 상황 1. submodule에 대한 충분하지 못한 이해 필자가 실수한 것이 있다. github에서 submodule은 영어 단어 그대로, 서브 모듈이다. 즉, 한개의 메인 프로젝트가 존재하지만, 다른 프로젝트는 공통으로 사용할 모듈이라는 뜻이다.
개요 커밋을 하기 전에 확인해야 할 기본적인 명령어 등을 확인해본다. tracked 상태의 파일을 untracked 상태로 변경하는데, 스테이지에 등록하는 것과 반대 과정이라고 보면 된다. stage 상태에 있는 것을 unstage 상태로 변경하려면 삭제(rm)나 리셋(reset) 명령어를 사용한다. 파일 등록 취소 rm 명령어로 삭제 하려면, 기억해야 하는 것은 스테이지 영역에서만 등록된 파일을 삭제하려면 --cached 옵션을 함께 사용한다. $ git rm --cached main.py rm 'main.py' 캐시 목록에서 파일이 삭제가 된 이후에 git status를 실행해본다. $ git status On branch master Changes to be committed: (use "git reset HEAD <file>.
개요 깃 명령어의 기본적인 명령어를 실행하는 것을 목표로 한다. 깃 설치 및 깃허브 설치는 기존 게시글을 확인해본다. Github Project 포트폴리오 Git 환경설정 git 명령어를 입력 시, 제대로 실행되지 않았다면 환경변수를 추가한다. 윈도우에서 제어판을 실행한 후 시스템 > 고급 시스템 설정 > 고급 > 환경 변수를 작성한다. 시스템 변수 항목에서 Path를 더블클릭하도록 한다. 환경 변수 편집 창에 C:\Program Files\Git\cmd 경로를 추가한다. 영상을 통해서 한번 보도록 한다. Git 기본문법 git의 명령어의 기본 문법은 아래와 같다.
개요 본 포스트는 자연어처리의 주요 흐름에 관해 간단하게 정리한 내용이다. 일종의 모음집이라고 하면 좋을 것 같다. 구체적인 자연어 이론에 대한 설명은 대해서는 유투브 영상 및 그 와 다양한 자료들을 참고하도록 하자. . 사전 학습의 개념 사전 학습 모델이란 기존에 자비어(Xavier) 등 임의의 값으로 초기화된 모델의 가중치들을 다른 문제(task)에 학습시킨 가중치들로 초기화하는 방법이다. 이미지 분류에서는 보통 전이학습이라는 용어를 사용하기도 했다. 자연어에서의 가장 대표적인 사전학습 모델이 버트와 GPT이다. 현재는 이러한 대부분의 자연어 처리 모델이 언어 모델을 사전 학습한 모델을 활용하도록 한다.
공지 해당 포스트는 취업 준비반 대상 강의 교재로 파이썬 머신러닝 완벽가이드를 축약한 내용입니다. 매우 좋은 책이니 가급적 구매하시기를 바랍니다. 개요 Mercari Price Suggestion Challenge는 캐글에서 진행된 과제이며, 제공되는 데이터 세트는 제품에 대한 여러 속성 및 제품 설명 등의 텍스트 데이터로 구성된다. 데이터 세트는 다음 링크에서 확인한다. https://www.kaggle.com/c/mercari-price-suggestion-challenge/data 데이터 다운로드 데이터를 다운로드 받도록 한다. !pip install kaggle !sudo apt install p7zip p7zip-full # 7z 파일을 풀기 위한 것이다. Requirement already satisfied: kaggle in /usr/local/lib/python3.
공지 해당 포스트는 취업 준비반 대상 강의 교재로 파이썬 머신러닝 완벽가이드를 축약한 내용입니다. 매우 좋은 책이니 가급적 구매하시기를 바랍니다. 감성 분석 개요 문서의 주관적인 감성/의견/감정/기분 등을 파악하기 위한 방법으로 소셜 미디어, 여론조사, 온라인 리뷰, 피드백 등 다양한 분야에서 활용되고 있다. 감성 분석은 크게 지도학습 & 비지도학습 방식으로 수행된다. 데이터는 캐글 대회 데이터를 활용하였다. 따라서, 본 포스트에서는 지도학습 기반과 비지도학습 기반의 감성 분석을 실습한다. 데이터 불러오기 각각 필요한 데이터를 불러오도록 한다. from google.