개요 연도, 월, 주만 있는 컬럼을 날짜 데이터 타입으로 변경하려면 어떻게 해야할까? 약간의 트릭이 필요하다 데이터 생성 가상의 데이터를 생성한다. import pandas as pd data = [ {"year": 2020, "month": 1, "week": 2, "company" : "A회사", "revenue_pct" : 49}, {"year": 2020, "month": 1, "week": 2, "company" : "B회사", "revenue_pct" : 51}, {"year": 2021, "month": 1, "week": 2, "company" : "A회사", "revenue_pct" : 37}, {"year": 2021, "month": 1, "week": 2, "company" : "B회사", "revenue_pct" : 63}, {"year": 2022, "month": 12, "week": 1, "company" : "A회사", "revenue_pct" : 70}, {"year": 2022, "month": 12, "week": 1, "company" : "B회사", "revenue_pct" : 30}, ] df = pd.
책을 출간하였습니다. Streamlit이란 Streamlit은 데이터 분석가가 간단한 코드 몇줄로 빠르게 웹앱을 만들어 줄 수 있는 Python 라이브러리입니다. 웹사이트 : https://streamlit.io/ 누가 읽어야 할까요? 데이터 분석가 : 웹개발은 모르지만 대시보드를 만들어야 하는 분 국비교육 수강중인 비전공자 : Java 웹개발로 머신러닝 플랫폼을 만들어야 하는 분 개별적인 포트폴리오가 필요한 취업준비생 : ML/DL 알고리즘 익히는 것도 어려운데, 웹개발은 언제 배우죠? 데모 페이지 기초문법 포함 2달이면 충분히 아래 데모 페이지와 같이 만들 수 있습니다. 데모 페이지 : https://dschloe-streamlit-book-seoul-app-w9me9j.
사전학습 이 글을 읽기전에 한번 Streamlit 라이브러리를 활용한 배포 - BigQuery 사용 을 읽고 오기를 바란다. 실습 순서 서울시 부동산 실거래가를 API 크롤링으로 가져온다. JSON 형태의 데이터를 pandas 데이터프레임으로 변환한다. 데이터프레임을 BigQuery에 전체 데이터를 저장한다. 저장된 데이터프레임을 BigQuery에서 일부 컬럼만 불러온다. 실습 1 - API 크롤링에서 빅쿼리로 데이터 저장 .streamlit/secrets.toml 을 열고 아래와 같이 설정한다. seoul_api_key는 서울 열린데이터 광장을 의미한다. gcp_service_account 아래 내용은 api key를 json 파일로 열면 확인할 수 있다.
개요 Wandb에 접속 후, 활용해본다. 회원가입 회원가입을 진행한다. 사이트 : https://wandb.ai/site 여기에서 Github로 로그인을 진행한다. Authorize wandb를 클릭한다. Create your account 항목에 Full name과 회사명을 입력한다. 아래와 같이 지정했다. 교육 목적으로 선택했다. 팀 이름명을 지정한다. 추후에 설정한다. API Key가 나타난다. 어딘가에 인증키를 저장해둔다. db3cce8abed215f7b3770979a0006861dbcfe4f2 추후 확인 시 User Settings을 클릭한다. Scroll Down 하면 API 키값이 나타난다. 캐글 노트북 상단 메뉴 [Add-ones] - [Secrets]를 클릭한다. Secret 값을 아래와 같이 추가한다. 추가한 후, 아래 명령어를 추가한다.
Streamlit Matplotlib-Seaborn 한글폰트 적용 개요 배포 시, matplotlib & seaborn 한글 폰트 적용 하는 방법에 대해 알아본다. 나눔고딕 폰트를 적용해본다. 폰트 다운로드 사이트 : https://fonts.google.com/specimen/Nanum+Gothic 개발환경 세팅 git clone 명령어를 활용하여 프로젝트 repo를 다운로드 받는다. 가상환경을 설정한다. virtualenv venv 실행한다. source venv/Scripts/activate 실행하여 가상환경에 접속한다. $ virtualenv venv created virtual environment CPython3.9.13.final.0-64 in 606ms creator CPython3Windows(dest=C:\Users\YONSAI\Desktop\streamlit-korean-fonts\venv, clear=False, no_vcs_ignore=False, global=False) seeder FromAppData(download=False, pip=bundle, setuptools=bundle, wheel=bundle, via=copy, app_data_dir=C:\Users\YONSAI\AppData\Local\pypa\virtualenv) added seed packages: pip==23.1.2, setuptools==67.
반복측정 분산분석 comercial_ratings.csv 데이터 불러오기 데이터탐색 분석 - 기술통계량 - 데이터탐색 아래와 같이 4개의 설문조사 데이터는 종속변수로 넣는다. 확인 버튼을 누른다. 데이터가 40개가 넘으므로 정규성 검토를 할 필요가 없음 만약에 정규성 분포를 한다고 하면 어떻게 할까? 일반선형모형 - 반복측정’ 여기에서 수준의 수를 정의하는 것이 1차 핵심이다. 총 광고의 종류는 4개이므로 요인의 수는 4가 된다. 요인의 이름은 문맥에 맞게 저장한다 측정 이름도 결과에 맞게 저장한다. 예) 매력도, 평가 등 1차 준비는 나온 것이다.
공지 본 내용은 아래 교재를 참조하여 작성하였다. SPSS를 활용하여 논문을 쓰셔야 하는 분은 좋은 책이니 반드시 살 것을 권한다. 한번에 통과하는 논문 SPSS (한빛아카데미) : http://www.yes24.com/Product/Goods/59577796 PREVIEW 케이스 선택은 주로 연구 대상만 남겨두고 나머지 케이스는 필터링하거나 삭제할 때 사용 케이스 선택 방법 : 데이터 - 케이스 선택 케이스 케이스 선택은 특정 케이스를 필터링(삭제하지 않고 분석 시 제외하는 것)하거나 삭제하고자 할 때 사용함 예시 : 연구 대상자가 남자라면 성별이 여자인 케이스는 필터링하거나 삭제해야 함 케이스 선택 방법 SPSS 상단 메뉴의 데이터-케이스 선택에서 진행함 연구 대상자가 남자일 때 어떻게 진행하는지 살펴본다.
R 프로그램 설치 싸이트 : https://www.r-project.org/ download R 클릭 0-Cloud 선택 각 OS에 맞는 버전 설치, 여기서는 Windows 선택 Windows의 경우 아래와 같이 나타난다. Download R-4.2.3 for Windows 설치 다운로드 받은 설치 파일을 관리자 권한으로 실행한다. 언어는 한국어로 해도 상관없지만, 필자는 주로 영어로 선택해서 했기 때문에, 영어로 진행하도록 한다. 특별하게 주의 깊게 살펴서 해야 할 항목은 없기 때문에, Next 버튼을 순차적으로 클릭한다. R설치가 정상적으로 완료가 되면, 바탕화면에 R 로고가 나타날 것이다.
개요 GCP에서 개발환경을 설정하도록 한다. Local PC에서 GCP로 접속을 하도록 한다. 사전준비 WSL2 Ubuntu 설치 과정은 여기에서 다루지 않는다. 개발환경 설치 Python3 설치한다. (본인에게 맞는 언어를 선택한다) sudo apt update sudo apt install -y python3 python3-pip python3 최신 버전(417.0.1) gcloud CLI 설치 참고자료 : https://cloud.google.com/sdk/docs/install-sdk?hl=ko gcloud CLI를 설치하기 전 운영체제가 다음 요구사항을 충족하는지 확인합니다. $ sudo apt-get install apt-transport-https ca-certificates gnupg 패키지 소스로 gcloud CLI 배포 URI를 추가합니다. 배포판에서 서명 옵션을 지원하는 경우 다음 명령어를 실행합니다.
강의소개 인프런에서 Streamlit 관련 강의를 진행하고 있습니다. 인프런 : https://inf.run/YPniH 개요 한글폰트를 다운로드 받아서 matplotlib에 적용하는 코드를 작성해본다. 주요 코드를 기억해서 업무에 활용해보도록 한다. 폰트 다운로드 일반적으로 자주 사용하는 폰트를 다운로드 받는다. 참고 : https://www.kopus.org/biz-electronic-font2/ 스크롤을 내리면 TTF 다운로드 버튼을 클릭한다. 폰트 설치 다운로드 받은 폰트를 압축을 푼다. 캐시 정리 일반적으로는 다른 오피스 프로그램을 사용할 때는 위 폰트를 글꼴 설정에 추가하면 끝이다. 그러나, Matplotlib에서는 글꼴 설정이 끝이 아니라 Matplotlib에서 관리하는 폰트에 해당 글꼴이 들어있느냐가 매우 중요하다.