Data Science | DSChloe

강의소개 인프런에서 Streamlit 관련 강의를 진행하고 있습니다. 인프런 : https://inf.run/YPniH 개요 간단한 프로젝트라도 DB와 연동하는 작업은 매우 중요하다. 클라우드 DB를 사용하기 위해서는 클라우드 회원가입 등 번거로운 절차를 거쳐야 하며, 또한 비용도 추가될 수도 있다. SQLite를 사용하면 간단한 DB 작업도 진행할 수 있다. Streamlit + SQLite 연동 작업을 간단히 하도록 해본다. SQLite 데이터 핸들링을 하기 위해서는 Python 기초 문법, Pandas 라이브러리를 배워야 한다. Pandas는 본 블로그에서 CSV 파일을 읽고 저장을 하는데 사용을 하게 된다.

개요 Open API를 통해서 부동산 실거래가 정보를 pandas 데이터프레임으로 변환하는 코드를 구현한다. 요청인자 확인 샘플 URL은 크게 2가지를 제공한다. 서울시 부동산 실거래가 정보 http://openapi.seoul.go.kr:8088/(인증키)/xml/tbLnOpendataRtmsV/1/5/ 서울시 부동산 실거래가 정보(마곡일성트루엘플래닛) http://openapi.seoul.go.kr:8088/(인증키)/xml/tbLnOpendataRtmsV/1/5/2022/11500/강서구/10500/일반/0758/0002/마곡일성트루엘플래닛/오피스텔 출력 예제는 다음과 같다. <?xml version="1.0" encoding="UTF-8"?> <tbLnOpendataRtmsV> <list_total_count>2639192</list_total_count> <RESULT> <CODE>INFO-000</CODE> <MESSAGE>정상 처리되었습니다</MESSAGE> </RESULT> <row> <ACC_YEAR>2023</ACC_YEAR> <SGG_CD>11545</SGG_CD> <SGG_NM>금천구</SGG_NM> <BJDONG_CD>10100</BJDONG_CD> <BJDONG_NM>가산동</BJDONG_NM> <LAND_GBN>1</LAND_GBN> <LAND_GBN_NM>대지</LAND_GBN_NM> <BONBEON>0776</BONBEON> <BUBEON>0000</BUBEON> <BLDG_NM>가산대명벨리온</BLDG_NM> <DEAL_YMD>20230127</DEAL_YMD> <OBJ_AMT>12300</OBJ_AMT> <BLDG_AREA>16.28</BLDG_AREA> <TOT_AREA>25.630000</TOT_AREA> <FLOOR>8</FLOOR> <RIGHT_GBN/> <CNTL_YMD/> <BUILD_YEAR>2017</BUILD_YEAR> <HOUSE_TYPE>오피스텔</HOUSE_TYPE> <REQ_GBN>중개거래</REQ_GBN> <RDEALER_LAWDNM>서울 금천구</RDEALER_LAWDNM> </row> <row> <ACC_YEAR>2023</ACC_YEAR> <SGG_CD>11500</SGG_CD> <SGG_NM>강서구</SGG_NM> <BJDONG_CD>10500</BJDONG_CD> <BJDONG_NM>마곡동</BJDONG_NM> <LAND_GBN>1</LAND_GBN> <LAND_GBN_NM>대지</LAND_GBN_NM> <BONBEON>0793</BONBEON> <BUBEON>0000</BUBEON> <BLDG_NM>유림트윈파크</BLDG_NM> <DEAL_YMD>20230127</DEAL_YMD> <OBJ_AMT>13900</OBJ_AMT> <BLDG_AREA>19.

회원가입 회원가입 : 회원가입 | 서울특별시청 (seoul.go.kr) 모두 동의합니다를 선택한다. 본인인증 절차를 거친다. 회원정보를 입력한다. 부가서비스 신청은 옵션이기 때문에 여기서 별도로 다루지는 않겠다. 회원가입이 완료가 되었다. 서울 열린데이터 광장 로그인 이제 데이터 수집을 위해, 해당 사이트에 로그인을 진행한다. 찾고 싶은 데이터를 입력해주세요 부동산을 입력하고 검색을 진행한다. 여기에서 서울시 부동산 실거래가 정보 탭을 클릭한다. 하단에 인증키 신청을 클릭한다. 작성이 끝나면 바로 API 발급이 부여가 된다.

개요 ChatGPT를 활용하여 각 여행지의 기본정보를 제공한다. 사진은 필자가 직접 찍은 것을 활용했다. 마리나 샌즈 호텔 마리나 샌즈 호텔은 싱가포르에서 유명한 호텔입니다. 이 호텔은 싱가포르의 주요 관광지와 접근성이 좋고, 객실이 깨끗하고 서비스가 좋다고 소개되고 있습니다. 마리나 샌즈 호텔에서는 수영장, 사우나, 제과점, 정원, 수프 식사 서비스 등을 제공합니다. 객실 안에는 에어컨, 텔레비젼, 전화, 커피/차 메이커, 일회용 샴푸, 바디 샴푸, 수건, 샤워 캡 등이 구비되어 있습니다. 마리나 샌즈 호텔 내부에는 쇼핑몰, 레스토랑, 커피숍 등이 있습니다.

개요 Windows에서 Opencv 개발환경을 구축한다. 아나콘다를 설치하지 않고 구축한다. 사전 준비 파이썬 설치는 이미 진행된 것으로 가정한다. 설치 웹사이트 : https://www.python.org/ 또한 가상환경을 이미 설치한 것으로 가정한다. 주요 설치 명령어 opencv-python은 OpenCV의 메인 모듈을 포함하고, opencv-contrib-python은 메인 모듈과 Extras 모듈을 포함한다. 설치 시, NumPy는 자동으로 설치 된다. matplotlib 라이브러리는 파이썬 기본 시각화 라이브러리이다. pafy 라이브러리는 Youtube의 메타 데이터를 수집/검색하거나 다운로드 할 수 있도록 도와줌 youtube_dl 라이브러리는 터미널에서 사용 가능한 라이브러리이다. pygame은 파이썬에서 제공하는 게임 라이브러리이다.

개요 GROUP BY 1의 구체적인 의미에 대해 파악을 한다. 데이터 개요 주어진 데이터는 아래와 같다. 이 데이터는 미국의 과거 및 현재 국회의원 데이터셋을 사용한다. 참조 : https://github.com/unitedstates/congress-legislators SELECT * FROM legislators_terms; 쿼리 예제 다음 쿼리는 리텐션을 구하는 쿼리를 작성하기 위해 작성했다. 먼저, 각 의원이 첫 임기를 시작한 날짜를 first_term으로 정의한다. SELECT id_bioguide , MIN(term_start) AS first_term FROM legislators_terms GROUP BY 1; GROUP BY 1 대신에 GROUP BY id_bioguide로 변경하여 코드를 작성해본다.

개요 Streamlit 라이브러리와 BigQuery를 사용하여 배포를 진행한다. GCP 클라우드 프로젝트 설정 과정은 생략한다. BigQuery API 사용설정 Project API에서 ENABLE APIS AND SERVICES 버튼을 클릭한다. 빅쿼리 API를 탐색한다. 키워드명 : BigQuery API manage 버튼을 클릭한다. 인증키를 다운로드 받도록 한다. (CREATE CREDENTIALS클릭) 아래와 같이 지정 후, 스크롤을 내려서 NEXT 버튼을 클릭한다. 임의의 Service account ID 작성 후, CREATE AND CONTINUE 버튼을 클릭한다. 프로젝트 권한을 부여 후, CONTINUE 버튼을 클릭한다. Done 버튼을 클릭한다. Service Accounts - [우측] Manage keys 버튼 클릭 Create new key 버튼 클릭 JSON 클릭 json 파일을 다운로드 받는다.

사전준비 배포를 하기 위해서는 필수로 진행해야 할 사전준비가 필요하다. Git & Github 설치 과정은 생략한다. Step 01 - Streamlit 회원가입 https://share.streamlit.io/signup 아래 이미지에서 Continue with Github 와 같이 회원가입을 진행한다. Set up your account를 작성한다. 작성이 끝나면 다음과 같은 화면이 나오면 정상적으로 등록이 된 것이다. Step 02 - Github 레포 설정 Gitub 레포를 설정한다. 이 때, 주의해야 할 것은 Public으로 설정을 해야한다. .gitignore 파일도 Setting 하는 것이 좋다. Step 03 - 주요 라이브러리 설치 다음 코드를 실행하여 배포를 위한 라이브러리를 설치한다.

개요 Google Analytics 4 설치 과정을 정리하였다. 사전준비 본 글에서는 Google Analytics 4 관련 설명은 생략한다. 어느정도 관련 도구를 이해한다는 전제 조건에서 글을 정리한다. 단계별 설치 과정 단계별로 설치 과정을 알아보자. (1) GA4 추적 ID 가져오기 Google Analytics 4 에서 추적 코드를 받는다. 추적 코드는 Admin - Data Streams에서 확인이 가능하다. Add stream 에서 Hugo Website 주소를 입력한 후 설정을 하면 된다. 그럼 MEASUREMENT ID 확인이 가능하다. G-XXXXXXX 시작하는 ID만 있으면 충분하다.

개요 Python 가상환경을 만든 후, 자동으로 배치 파일이 돌아가도록 하는 코드를 작성하도록 한다. Step 01 - 라이브러리 설치 가상환경을 만든 후, pandas 라이브러리를 설치하도록 한다. $ virtualenv venv $ ./venv/Scripts/activate 만약 에러가 아래와 에러가 생길 경우, $ .\venv\Scripts\activate .\venv\Scripts\activate : 이 시스템에서 스크립트를 실 행할 수 없으므로 C:\Users\h\Desktop\python_batch\venv\ Scripts\activate.ps1 파일을 로드할 수 없습니다. 자세한 내용은 about_Execution_Policies(https://go.microsoft. com/fwlink/?LinkID=135170)를 참조하십시오. 위치 줄:1 문자:1 + .\venv\Scripts\activate + ~~~~~~~~~~~~~~~~~~~~~~~ + CategoryInfo : 보안 오류: (:) [], PSSec uri tyException + FullyQualifiedErrorId : UnauthorizedAccess PowerShell을 관리자 권한으로 실행 후 아래 코드를 입력한다.

Streamlit 라이브러리를 활용한 배포 예제 - sqlite

서울시 부동산 실거래가 정보 API 크롤링 2 - 크롤링편 (XML)

서울시 부동산 실거래가 정보 API 크롤링 1 - 인증키 발급편

ChatGPT를 활용한 싱가포르 여행 후기 - Spectra Show 관람기

OpenCV 개발환경 윈도우 버전

GROUP BY 1의 의미와 사용법 예제

Streamlit 라이브러리를 활용한 배포 - BigQuery 사용

Streamlit 라이브러리를 활용한 배포 예제

Google Analytics 4 설치 - Hugo 깃허브

윈도우 배치 파일 - 파이썬 가상환경 적용