작업형 2유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 주요 라이브러리 palmerpenguins : 팔머펭귄 데이터셋의 목표는 iris 데이터셋의 대안으로 데이터 탐색 및 시각화를 위한 데이터셋 제공. scikit-learn : 머신러닝을 위한 라이브러리 lightgbm : LightGBM은 Microsoft에서 개발한 오픈 소스 기계 학습 라이브러리로, 대용량 데이터셋에서 빠른 속도와 높은 성능을 제공하는 것이 특징 주의 각 코드에 대한 설명은 별도로 하지 않습니다.
작업형 2유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 주요 라이브러리 palmerpenguins : 팔머펭귄 데이터셋의 목표는 iris 데이터셋의 대안으로 데이터 탐색 및 시각화를 위한 데이터셋 제공. scikit-learn : 머신러닝을 위한 라이브러리 lightgbm : LightGBM은 Microsoft에서 개발한 오픈 소스 기계 학습 라이브러리로, 대용량 데이터셋에서 빠른 속도와 높은 성능을 제공하는 것이 특징 주의 각 코드에 대한 설명은 별도로 하지 않습니다.
작업형 3유형 최종정리 작업형1 : 3문제 (30점), 데이터 전처리 작업형2 : 1문제 (40점), 분류/회귀 예측 모델링 작업형3 : 2문제 (30점), 가설 검정 라이브러리 확인 파이썬에서 가설검정을 위한 통계와 관련된 라이브러리는 크게 2가지이다. scipy : SciPy는 수치 계산, 최적화, 선형 대수, 신호 및 이미지 처리, 통계 분석 등과 같은 과학적 계산 작업을 수행하는 데 사용됨 statsmodels : Statsmodels는 통계 분석과 추정을 위한 파이썬 라이브러리로, 선형 회귀, 로지스틱 회귀, 시계열 분석, 비모수적 추정 등 다양한 통계 모델을 지원함.
개요 연도, 월, 주만 있는 컬럼을 날짜 데이터 타입으로 변경하려면 어떻게 해야할까? 약간의 트릭이 필요하다 데이터 생성 가상의 데이터를 생성한다. import pandas as pd data = [ {"year": 2020, "month": 1, "week": 2, "company" : "A회사", "revenue_pct" : 49}, {"year": 2020, "month": 1, "week": 2, "company" : "B회사", "revenue_pct" : 51}, {"year": 2021, "month": 1, "week": 2, "company" : "A회사", "revenue_pct" : 37}, {"year": 2021, "month": 1, "week": 2, "company" : "B회사", "revenue_pct" : 63}, {"year": 2022, "month": 12, "week": 1, "company" : "A회사", "revenue_pct" : 70}, {"year": 2022, "month": 12, "week": 1, "company" : "B회사", "revenue_pct" : 30}, ] df = pd.
책을 출간하였습니다. Streamlit이란 Streamlit은 데이터 분석가가 간단한 코드 몇줄로 빠르게 웹앱을 만들어 줄 수 있는 Python 라이브러리입니다. 웹사이트 : https://streamlit.io/ 누가 읽어야 할까요? 데이터 분석가 : 웹개발은 모르지만 대시보드를 만들어야 하는 분 국비교육 수강중인 비전공자 : Java 웹개발로 머신러닝 플랫폼을 만들어야 하는 분 개별적인 포트폴리오가 필요한 취업준비생 : ML/DL 알고리즘 익히는 것도 어려운데, 웹개발은 언제 배우죠? 데모 페이지 기초문법 포함 2달이면 충분히 아래 데모 페이지와 같이 만들 수 있습니다. 데모 페이지 : https://dschloe-streamlit-book-seoul-app-w9me9j.
사전학습 이 글을 읽기전에 한번 Streamlit 라이브러리를 활용한 배포 - BigQuery 사용 을 읽고 오기를 바란다. 실습 순서 서울시 부동산 실거래가를 API 크롤링으로 가져온다. JSON 형태의 데이터를 pandas 데이터프레임으로 변환한다. 데이터프레임을 BigQuery에 전체 데이터를 저장한다. 저장된 데이터프레임을 BigQuery에서 일부 컬럼만 불러온다. 실습 1 - API 크롤링에서 빅쿼리로 데이터 저장 .streamlit/secrets.toml 을 열고 아래와 같이 설정한다. seoul_api_key는 서울 열린데이터 광장을 의미한다. gcp_service_account 아래 내용은 api key를 json 파일로 열면 확인할 수 있다.
개요 Wandb에 접속 후, 활용해본다. 회원가입 회원가입을 진행한다. 사이트 : https://wandb.ai/site 여기에서 Github로 로그인을 진행한다. Authorize wandb를 클릭한다. Create your account 항목에 Full name과 회사명을 입력한다. 아래와 같이 지정했다. 교육 목적으로 선택했다. 팀 이름명을 지정한다. 추후에 설정한다. API Key가 나타난다. 어딘가에 인증키를 저장해둔다. db3cce8abed215f7b3770979a0006861dbcfe4f2 추후 확인 시 User Settings을 클릭한다. Scroll Down 하면 API 키값이 나타난다. 캐글 노트북 상단 메뉴 [Add-ones] - [Secrets]를 클릭한다. Secret 값을 아래와 같이 추가한다. 추가한 후, 아래 명령어를 추가한다.
Streamlit Matplotlib-Seaborn 한글폰트 적용 개요 배포 시, matplotlib & seaborn 한글 폰트 적용 하는 방법에 대해 알아본다. 나눔고딕 폰트를 적용해본다. 폰트 다운로드 사이트 : https://fonts.google.com/specimen/Nanum+Gothic 개발환경 세팅 git clone 명령어를 활용하여 프로젝트 repo를 다운로드 받는다. 가상환경을 설정한다. virtualenv venv 실행한다. source venv/Scripts/activate 실행하여 가상환경에 접속한다. $ virtualenv venv created virtual environment CPython3.9.13.final.0-64 in 606ms creator CPython3Windows(dest=C:\Users\YONSAI\Desktop\streamlit-korean-fonts\venv, clear=False, no_vcs_ignore=False, global=False) seeder FromAppData(download=False, pip=bundle, setuptools=bundle, wheel=bundle, via=copy, app_data_dir=C:\Users\YONSAI\AppData\Local\pypa\virtualenv) added seed packages: pip==23.1.2, setuptools==67.
반복측정 분산분석 comercial_ratings.csv 데이터 불러오기 데이터탐색 분석 - 기술통계량 - 데이터탐색 아래와 같이 4개의 설문조사 데이터는 종속변수로 넣는다. 확인 버튼을 누른다. 데이터가 40개가 넘으므로 정규성 검토를 할 필요가 없음 만약에 정규성 분포를 한다고 하면 어떻게 할까? 일반선형모형 - 반복측정’ 여기에서 수준의 수를 정의하는 것이 1차 핵심이다. 총 광고의 종류는 4개이므로 요인의 수는 4가 된다. 요인의 이름은 문맥에 맞게 저장한다 측정 이름도 결과에 맞게 저장한다. 예) 매력도, 평가 등 1차 준비는 나온 것이다.
공지 본 내용은 아래 교재를 참조하여 작성하였다. SPSS를 활용하여 논문을 쓰셔야 하는 분은 좋은 책이니 반드시 살 것을 권한다. 한번에 통과하는 논문 SPSS (한빛아카데미) : http://www.yes24.com/Product/Goods/59577796 PREVIEW 케이스 선택은 주로 연구 대상만 남겨두고 나머지 케이스는 필터링하거나 삭제할 때 사용 케이스 선택 방법 : 데이터 - 케이스 선택 케이스 케이스 선택은 특정 케이스를 필터링(삭제하지 않고 분석 시 제외하는 것)하거나 삭제하고자 할 때 사용함 예시 : 연구 대상자가 남자라면 성별이 여자인 케이스는 필터링하거나 삭제해야 함 케이스 선택 방법 SPSS 상단 메뉴의 데이터-케이스 선택에서 진행함 연구 대상자가 남자일 때 어떻게 진행하는지 살펴본다.