데이콘 대회 참여 - 02 GBM을 활용한 머신러닝 예제

공지 제 수업을 듣는 사람들이 계속적으로 실습할 수 있도록 강의 파일을 만들었습니다. 늘 도움이 되기를 바라며. 참고했던 교재 및 Reference는 꼭 확인하셔서 교재 구매 또는 관련 Reference를 확인하시기를 바랍니다. 개요 본 예제에서는 제주 빅데이터 경진대회에서 제공하는 베이스라인 코드를 살려서 작성하였다. 처음 대회를 입문하는 데 있어서, 빠르게 제출하는 것에 의미부여를 하기 바란다. 참조: https://dacon.io/competitions/official/235615/codeshare/1228 다만, 데이터를 불러오는 영역 및 머신러닝 모형 알고리즘만 조금 수정하였다. 향후 매일 업데이트 하면서 일종의 가이드라인이 되었으면 좋겠다.

ch 03 - PLS-SEM 주요 개념

개요 PLS-SEM의 주요 개념 및 유사용어에 대해 살펴본다. 영어로 논문을 써야하기 때문에, 한국어와 영어를 같이 표기했다. 주요개념 잠재변수(Latent Variable): 직접 측정되지 않는 비관측변수(Unobserved Variable)로 측정변수를 통해 간접적으로 측정. 잠재변인, 구인, 구성개념(construct), 차원(dimension), 요인, 이론변수라고도 하며 경로도에는 circle로 표시됨 측정변수(Measured Variable): 직접 측정되는 관측변수(Observed Variable)로 잠재변수를 측정하기 위해 사용된 변수를 말함. (설문문항이 여기에 해당됨 지표변수(Indicator Variable), 명시변수(Manifest Variable), 측정항목(Items)로 표기되며 직사각형 또는 정사각형으로 표시함 외생변수(Exogenous Variable): 독립변수의 개념으로 다른 변수의 변화에 원인(Causes)이나 동기의 역할을 하는 변수로 경로도에서 화살표가 시작이 되는 모든 변수 말함 잠재변수 개념과 결합되면 외생잠재변수(Exogenous Latent Variable)가 됨 내생변수(Endogenous Variable): 종속변수의 개념으로 다른 변수에 의해 영향을 받는 변수이며 화살표를 받는 변수를 말함.

Python for loops in different ways

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 I. 개요 여러 형태의 반복문을 배우고 실습한다. 한줄로 작성하는 반복문을 배우고 실습한다. II. For Loop Basic Syntax 파이썬의 기본 문법은 아래와 같다. for <변수> in <iterable>: <코드> 여기에서 iterable의 개념은 list와 tuple을 의미한다. 간단하게 for_loop 코드를 작성해보자.

ch 02 - 구조방정식의 기본 개념과 고려사항

개요 기본적으로 다변량 분석 1세대 분석 방법론 군집분석, EFA, 분산분석, 다항회귀, 로지스틱 회귀분석 2세대 분석 방법론 PLS-SEM and CB-SEM 간단한 용어 정리 SEM - Structural Equation Modeling CB - Covariance Based SEM PLS - Partial Least Squares SEM (= PLS path Modeling) CB-SEM의 주 목적은 실증적으로 검증 가능한 다중 변수들 간의 체계적 관계 확인 PLS-SEM은 주로 탐험적 연구에서의 이론발전에 주로 사용되며, 종속변수의 분산을 설명하는데 주 초점을 맞준다. 본 논문에서는 필리핀에서의 스타트업 등에 관련된 논문 및 자료 수집에 한계가 있기 때문에 PLS-SEM 분석방법론을 채택하여 탐험연구에 준하여 분석을 진행한다.

If else, and more

강의 홍보 취준생을 위한 강의를 제작하였습니다. 본 블로그를 통해서 강의를 수강하신 분은 게시글 제목과 링크를 수강하여 인프런 메시지를 통해 보내주시기를 바랍니다. 스타벅스 아이스 아메리카노를 선물로 보내드리겠습니다. [비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기 I. 개요 조건문에 대해 배우고 실습하는 시간을 갖는다. else와 elif에 대해 배우고 실습한다. 한줄로 작성하는 if_else에 대해 배우고 실습한다. II. If 조건문 소개 Excel을 배운 사람이라면 누구나 아는 문법이다. 다만, 위 문법을 파이썬 언어에 맞게 변형한 것이다.

ch 01 - PLS SEM Intro

개요 석사 학위 논문을 위해 작성하기 위해 만들었음 PLS SEM 모델링을 위한 R 패키지가 존재함 plspm: 2020년 5월 14일 R Cran에서 정식 패키지에서 내려감 위 패키지는 원서 약 230페이지 되는 교재도 있음 1차로 위 패키지를 고려했으나 5/14일 패키지가 내려간 이후 선택에서 제외시킴 또한, SMART PLS라는 상용프로그램도 존재함 특정 R semPLS와 위 상용 프로그램을 비교한 논문이 있었고, 다행히 두 프로그램의 결과값이 동일한 것으로 증명되었다. ref. Utilization of R Program for the Partial Least Square Model: Comparison of SmartPLS and R 아직 확정지은 것은 아니지만, 향후 추가적인 논문을 진행한다면 위 2개의 패키지와 SMART PLS 상용 소프트웨어를 비교하는 논문도 괜찮을 것이라 생각함 교재 이론적인 공부 및 Self-Study를 위해 크게 2가지 방향성을 잡고 공부하려고 함 이론서 1: PLS-SEM Book: A Primer on PLS-SEM (2nd Ed.

데이콘 대회 참여 - 01 제주시 빅데이터 카드 매출 경진대회 데이터 수집 및 저장

I. 개요 본 과정은 직업훈련기관 수업의 일환으로 진행하였음 수강생들이 기본적으로 어려워하는 클라우드 DB연동부터 구현하여 빠르게 EDA를 활용할 수 있도록 진행함 DB는 BigQuery를 활용함. (1) 대회 참여 및 파일 다운로드 상세 데이콘은 국내 빅데이터 경진대회이다. (2) 대회 개요 Ref. https://dacon.io/competitions/official/235615/overview/ 주제 AI 알고리즘 활용 카드 사용 금액 예측 목표 신용카드 사용 내역 데이터를 활용한 지역별, 업종별 월간 카드 사용 총액 예측 배경 신용카드 사용량을 분석을 통한 ‘Post COVID-19 시대’ 신용카드 사용량 예측 모델 개발 지역 경제 위축 및 중소상공인 경영난 해소를 위한 대책 마련 주최/주관

추천 시스템 개요 및 이론, Surprise Package

I. 개요 대고객 대상으로 한 대부분의 플랫폼 서비스 업체들은 고객 개개인에게 맞춤형의 추천 서비스를 도입하고 있음 전자상거래 업체, 유투브, 애플 뮤직 등 ML의 여러 알고리즘 중 비즈니스 관점에 부합하는 기법이 추천 시스템. 추천 시스템의 진정한 묘미는 사용자 본인도 모르는 취향 발견, 재구매로 연결하도록 설계 누가 필요할까? 모든 플랫폼 서비스 이유1: 플랫폼은 다수의 판매자와 소비자를 필요로 함, 문제는 카테고리와 메뉴구성이 복잡해지면 소비자의 제품 선택에 부작용 이유2: 만족도가 떨어지면 고객은 그 플랫폼을 떠날 가능성이 크며, 이는 플랫폼 서비스의 매출 하락과 직결 모든 플랫폼 서비스는 기본적으로 추천서비스를 장착하고 싶어함 영화 데이터를 기준으로 추천시스템을 단계별로 구현함을 목표로 함 II.

추천 시스템 패키지 소개 - recommenderlab

I. 개요 추천시스템을 처음 배우는 접하는 사람들을 위해 준비한 입문 Tutorial이다. 패키지 소개서에 있는 내용을 한글로 번역하였다. This R package provides an infrastructure to test and develop recommender algorithms. The package supports rating (e.g., 1-5 stars) and unary (0-1) data sets. Supported algorithms are: 이 R 패키지는 추천자 알고리즘을 테스트하고 개발할 수 있는 인프라를 제공한다. 이 패키지는 등급(예: 별 1-5개) 및 단항(0-1) 데이터 세트를 지원한다. 지원되는 알고리즘: User-based collborative filtering (UBCF) Item-based collborative filtering (IBCF) SVD with column-mean imputation (SVD) Funk SVD (SVDF) Alternating Least Squares (ALS) Matrix factorization with LIBMF (LIBMF) Association rule-based recommender (AR) Popular items (POPULAR) Randomly chosen items for comparison (RANDOM) Re-recommend liked items (RERECOMMEND) Hybrid recommendations (HybridRecommender) For evaluation, the framework supports given-n and all-but-x protocols with

추천 시스템 개요 및 이론, Baseline Code

I. 개요 대고객 대상으로 한 대부분의 플랫폼 서비스 업체들은 고객 개개인에게 맞춤형의 추천 서비스를 도입하고 있음 전자상거래 업체, 유투브, 애플 뮤직 등 ML의 여러 알고리즘 중 비즈니스 관점에 부합하는 기법이 추천 시스템. 추천 시스템의 진정한 묘미는 사용자 본인도 모르는 취향 발견, 재구매로 연결하도록 설계 누가 필요할까? 모든 플랫폼 서비스 이유1: 플랫폼은 다수의 판매자와 소비자를 필요로 함, 문제는 카테고리와 메뉴구성이 복잡해지면 소비자의 제품 선택에 부작용 이유2: 만족도가 떨어지면 고객은 그 플랫폼을 떠날 가능성이 크며, 이는 플랫폼 서비스의 매출 하락과 직결 모든 플랫폼 서비스는 기본적으로 추천서비스를 장착하고 싶어함 영화 데이터를 기준으로 추천시스템을 단계별로 구현함을 목표로 함 II.