Pythons

파이썬 객체 지향 프로그래밍 - Attributes & Methods

1줄 요약 Attributes & Methods의 차이점에 대해 이해한다. 개요 Object = State + Behavior 예) Email, Phone Number, 배송상태 Class는 일종의 가이드라인을 의미 파이썬 내의 모든 객체는 일종으 클래스임 Object Class 7 int “Hello” str pd.DataFrame() DataFrame 해당 클래스를 찾기 위해 type( )를 사용함. import numpy as np temp = np.array([1, 2, 3]) print(type(temp)) <class 'numpy.ndarray'> State + Behavior 그렇다면, State를 지칭하는 파이썬 문법은 무엇인가? 파이썬에서는 이를 Attributes라고 부른다. 또한, Behavior를 지칭하는 파이썬 문법은 무엇인가?

[Python] Open API를 활용한 Air Quality 데이터 수집 예제

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 1줄 요약 오픈 데이터로 활용하여 시계열 데이터를 확보해보자. 동기 부여 Pandas 공식 홈페이지가 살짝 바뀐 듯 하였다. 시계열 데이터를 다루는 페이지를 확인하던 중 open air quality data API가 있는 것을 확인하였다. Github: https://github.com/dhhagan/py-openaq 라이브러리 설치 라이브러리 설치는 비교적 간단하다.

Pandas read_csv skiprows 활용

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 문제 개요 Kaggle 데이터 New York City Taxi Fare Prediction 데이터를 구글 코랩에서 Loading 하는 중 메모리 문제가 발생함 계통추출(Systematic Sampling)을 통해 데이터를 불러오기로 함 예제 실습 아래 예제를 통해서 실제로 데이터가 줄어드는지 확인을 해본다.

M1 tensorflow Test Preview

개요 M1에서 Tensorflow 테스트를 진행해본다. 현재 M1 시스템 환경은 아래와 같다. (2021-01-16) 주의: 텐서플로 공식 버전은 아님 라이브러리 설치 다음 코드를 설치해본다. Apple 공식 Repo: https://github.com/apple/tensorflow_macos 실행 전, 필수 체크 사항 macOS 11.0+ Python 3.8, available from the Xcode Command Line Tools $ /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/apple/tensorflow_macos/master/scripts/download_and_install.sh)" Installation script for pre-release tensorflow_macos 0.1alpha1. Please visit https://github.com/apple/tensorflow_macos for instructions and license information. This script will download tensorflow_macos 0.1alpha1 and needed binary dependencies, then install them into a new or existing Python 3.

matplotlib 03_2 Scatter Plot

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 산점도 그래프 산점도는 두 수치형 변수의 분포를 비교하고 두 변수 사이에 상관 관계가 있는지 여부를 확인하는 데 사용됩니다. 데이터 내에 구별되는 군집/분할이 있으면 산점도에서도 명확해집니다. (1) 라이브러리 불러오기 필요한 라이브러리를 불러옵니다. import matplotlib.pyplot as plt import numpy as np import seaborn as sns (2) 데이터 생성 이번에는 seaborn 패키지 내 tips 데이터를 활용합니다.

NLP - From Word2Vec TO GPT-3

개요 본 포스트는 자연어처리의 주요 흐름에 관해 간단하게 정리한 내용이다. 일종의 모음집이라고 하면 좋을 것 같다. 구체적인 자연어 이론에 대한 설명은 대해서는 유투브 영상 및 그 와 다양한 자료들을 참고하도록 하자. . 사전 학습의 개념 사전 학습 모델이란 기존에 자비어(Xavier) 등 임의의 값으로 초기화된 모델의 가중치들을 다른 문제(task)에 학습시킨 가중치들로 초기화하는 방법이다. 이미지 분류에서는 보통 전이학습이라는 용어를 사용하기도 했다. 자연어에서의 가장 대표적인 사전학습 모델이 버트와 GPT이다. 현재는 이러한 대부분의 자연어 처리 모델이 언어 모델을 사전 학습한 모델을 활용하도록 한다.

정형데이터와 함께하는 텍스트 마이닝

공지 해당 포스트는 취업 준비반 대상 강의 교재로 파이썬 머신러닝 완벽가이드를 축약한 내용입니다. 매우 좋은 책이니 가급적 구매하시기를 바랍니다. 개요 Mercari Price Suggestion Challenge는 캐글에서 진행된 과제이며, 제공되는 데이터 세트는 제품에 대한 여러 속성 및 제품 설명 등의 텍스트 데이터로 구성된다. 데이터 세트는 다음 링크에서 확인한다. https://www.kaggle.com/c/mercari-price-suggestion-challenge/data 데이터 다운로드 데이터를 다운로드 받도록 한다. !pip install kaggle !sudo apt install p7zip p7zip-full # 7z 파일을 풀기 위한 것이다. Requirement already satisfied: kaggle in /usr/local/lib/python3.

텍스트 마이닝 - 감성 분석

공지 해당 포스트는 취업 준비반 대상 강의 교재로 파이썬 머신러닝 완벽가이드를 축약한 내용입니다. 매우 좋은 책이니 가급적 구매하시기를 바랍니다. 감성 분석 개요 문서의 주관적인 감성/의견/감정/기분 등을 파악하기 위한 방법으로 소셜 미디어, 여론조사, 온라인 리뷰, 피드백 등 다양한 분야에서 활용되고 있다. 감성 분석은 크게 지도학습 & 비지도학습 방식으로 수행된다. 데이터는 캐글 대회 데이터를 활용하였다. 따라서, 본 포스트에서는 지도학습 기반과 비지도학습 기반의 감성 분석을 실습한다. 데이터 불러오기 각각 필요한 데이터를 불러오도록 한다. from google.

텍스트 마이닝 - 뉴스 분류

공지 해당 포스트는 취업 준비반 대상 강의 교재로 파이썬 머신러닝 완벽가이드를 축약한 내용입니다. 매우 좋은 책이니 가급적 구매하시기를 바랍니다. 텍스트 분류 실습 - 뉴스그룹 분류 개요 사이킷런은 fetch_20newsgroups API를 이용해 뉴스그룹의 분류를 수행해 볼 수 있는 예제 데이터 활용 가능함. 희소 행렬에 분류를 효과적으로 처리할 수 있는 알고리즘은 로지스틱 회귀, 선형 서포트 벡터 머신, 나이브 베이즈 등임. 텍스트 정규화 fetch_20newsgroups()는 인터넷에서 데이터를 받은 후, 올리는 것이기 때문에 인터넷 연결 유무를 확인한다.

입문자를 위한 머신러닝 - 오차행렬

용어 정리 영어로는 confusion matrix로 불리우지만, 번역하면서 다양한 단어가 등장하고 있다. 오차행렬, 혼동행렬 제목은 오차행렬이라고 표현했지만, 영어 단어를 그대로 살려 confusion matrix라고 활용한다. Confusion Matrix 분류 모형을 통해 머신러닝을 학습하게 되면 confusion matrix 표를 우선 작성하게 된다. 이 표에서 무엇을 볼 수 있는가? 우선 전체 데이터의 크기를 확인할 수 있다. (165명) 예측값 YES는 (100+10) 110명이고, 예측값 NO는 (50+5) 55명이다. 실제값 YES는 (100+5) 105명이고, 실제값 NO는 (50+10) 60명이다. 기본 영어를 정의해본다.