R

Basic Objects - Vector

공지

본 Tutorial은 강사에게 강의를 듣는 과거-현재-미래 학생들을 위해 작성하였습니다.

이 글을 읽어주시는 분들에게 작은 도움이 되기를 바랍니다.

I. 벡터

본 포스트는 프로그래밍과 R을 처음 배우는 사람을 위해 작성하였습니다. 짧게 읽어두시기를 바랍니다. 공부하실 때는 복잡하게 생각하지는 마시기를 바랍니다. 영어의 기본단어 및 문법을 배우듯이 그냥 받아들이시기를 바랍니다.

벡터(Vector). R에서 다루는 가장 작은 단위값의 데이터다. 1차원으로 구성이 되어 있다.

(1) 4가지 벡터

크게 4가지의 벡터가 존재한다. 간단하게 코드를 작성해보자.

xNum <- c(1, 3.14, 5, 7)
xLog <- c(TRUE, FALSE, TRUE, FALSE)
xChar <- c("가", "나", "A", "B")
xMix <- c(1, TRUE, "Hello R!")

이렇게 작성한 코드는 실행한다. 실행할 때, 윈도우 사용자는 Ctrl + Enter, Mac사용자는 Command + Enter를 사용한다.

Ch02 Process Analysis Basic

I. 개요

지난시간에 patients에 관한 데이터를 통해서 프로세스 분석에 대한 일반적인 개념을 접했다.

이번 포스트에서는 bupaR에 대한 이론적인 내용과 함께 간단하게 실습을 진행하도록 한다.

지난시간과 마찬가지로 먼저 데이터를 획득하는 것에서부터 출발한다.

library(bupaR)
library(eventdataR)
patients <- patients
dim(patients)
## [1] 5442    7

5442행과 7개의 열이 확인되었다.

class(patients)
## [1] "eventlog"   "tbl_df"     "tbl"        "data.frame"

그리고, 데이터는 eventlog, tbl_df, data.frame으로 구성된 것을 확인할 수 있다. 기존에 R을 학습한 사람들은 tbl & data.frame에 대해서 한두번쯤 들었을 거라 생각한다. 그러나 eventlog는 생소한 객체임을 알 수 있다.

Ch04_bigquery_with_R

1. 구글 클라우드 설정

본격적인 빅쿼리 실습에 앞서서, R과 연동하는 예제를 준비하였다. 빅쿼리 시작에 앞서서 선행적으로 클라우드 사용을 해야 한다.

  1. 만약 GCP 프로젝트가 없다면, 계정을 연동한다. Go to Cloud Resource Manager
  2. 그리고, 비용결제를 위한 카드를 등록한다. Enable billing
  3. 마지막으로 BigQuery API를 사용해야 하기 때문에 빅쿼리 API 사용허가를 내준다.Enable BigQuery

위 API를 이용하지 않으면 Python 또는 R과 연동해서 사용할 수는 없다. 자주 쓰는것이 아니라면 비용은 거의 발생하지 않으니 염려하지 않아도 된다. 비용관리에 대한 자세한 내용은 BigQuery 권장사항: 비용 관리에서 확인하기를 바란다.

Ch01 Process Analysis Intro

I. Process Mining Intro

모든 비즈니스는 프로세스와 연관이 깊다. 이러한 데이터를 통상적으로 event라고 부르며, 다루는 데이터는 log 데이터와 연관이 깊다. 프로세스 마이닝(Process Mining)은 데이터의 추출, 프로세싱, 그리고 분석의 순으로 진행한다.

  • 데이터 추출 (Extraction): Raw DataEvent Data로 변환시킨다.
  • 프로세싱 (Processing): 데이터 가공과 비슷하며, 보통 Aggregation, Filtering, Enrichment의 용어가 등장한다.
  • 분석 (Analysis): Performance, Control-Flow 등과 연관된 분석이 진행된다.

우선 빠르게 시각화부터 진행해보자.

library(bupaR)
library(httr)
library(processmapR)
library(edeaR)

url <- 'https://github.com/chloevan/datasets/blob/master/log/log_eat_patterns.RDS?raw=true'
patterns <- readRDS(url(url))
trace_explorer(patients, coverage=1)

R 시각화 튜토리얼 Intro

Intro

A picture is worth a thousand words — English Language Adage The simple graph has brought more information to the data analyst’s mind than any other device. — John Tukey

한장의 그림이 수천단어보다 가치가 있다는 영어속담과, 명료한 시각화가 데이터분석가에게 다른 어떤 도구보다 더 많은 정보를 제공한다는 유명한 데이터 과학자의 조언. 핵심은 시각화이다.

본 장에서는 ggplot2 패키지를 활용한 시각화를 먼저 보여줄 것이다. 먼저 간단하게 ggplot2 패키지에 소개하자면 Grammar of Graphics1의 철학을 담아서 R 생태계에서 유명한 학자 중, Hadley Wickham에 의해 주도적으로 개발되었다. 그래프에도 문법이 있다는 패키지의 철학 아래, R의 시각화는 괄목할만한 발전을 이루었고 이는 R의 대중화에도 큰 영향을 끼쳤다.

Shiny 프로젝트 Review & 더 알아볼 것

공지

이번에 준비한 튜토리얼은 제 강의를 듣는 과거-현재-미래 수강생분들을 위해 준비한 자료이다. 많은 도움이 되기를 바란다

이번에 준비한 Tutorial 코로나 세계현황을 Shiny Dashboard로 만들어 가는 과정을 담았다.

I. Shiny Tutorial 소개

처음 shiny를 접하거나 shiny의 전체 튜토리얼이 궁금한 사람들을 위해 이전 글을 소개한다.

II. Shiny Project

현재 진행중인 프로젝트가 궁금하다면 아래를 확인해보자.

Corona Shiny Project 6_2 - Chart Automation

공지

이번에 준비한 튜토리얼은 제 강의를 듣는 과거-현재-미래 수강생분들을 위해 준비한 자료이다. 많은 도움이 되기를 바란다

이번에 준비한 Tutorial 코로나 세계현황을 Shiny Dashboard로 만들어 가는 과정을 담았다.

I. Shiny Tutorial 소개

처음 shiny를 접하거나 shiny의 전체 튜토리얼이 궁금한 사람들을 위해 이전 글을 소개한다.

II. Shiny Project

현재 진행중인 프로젝트가 궁금하다면 아래를 확인해보자.

Round 함수 - digits

Round 함수 소개

round 함수는 대개 소수점 자리에서 반올림 할 때 자주 쓰는다.

test <- c(1.24, 2.40, 3.56, 4.56)
round(test, digits = 1)
## [1] 1.2 2.4 3.6 4.6

digits = 1의 의미는 소수점 첫번째 자리에서 반올림 하라는 뜻이다.

그런데 digits = -1을 하게 되면 어떻게 될까?

정수 반올림

빠르게 실습을 해보자.

test2 <- c(-14, -26, 14, 26, 39, 124, 247)
round(test2, digits = -1)
## [1] -10 -30  10  30  40 120 250

digits = -1을 하게되면 정수의 첫번째 자리에서 반올림한다.

매우 기본적인 것이지만, 자주 쓰지 않으면 잘 모르는 기본함수 사용 요령법이다.

Corona Shiny Project 6_1 - 데이터 전처리

공지

이번에 준비한 튜토리얼은 제 강의를 듣는 과거-현재-미래 수강생분들을 위해 준비한 자료이다. 많은 도움이 되기를 바란다

이번에 준비한 Tutorial 코로나 세계현황을 Shiny Dashboard로 만들어 가는 과정을 담았다.

I. Shiny Tutorial 소개

처음 shiny를 접하거나 shiny의 전체 튜토리얼이 궁금한 사람들을 위해 이전 글을 소개한다.

II. Shiny Project

현재 진행중인 프로젝트가 궁금하다면 아래를 확인해보자.

GT 패키지 소개

공지

본 블로그는 2020-04-08에 소개된 Great Looking Tables: gt(v0.2) by Richard Iannone 글을 번역한 것이다. 함수와 관련된 설명은 가급적 원어를 직접 인용 했으니, 영어로 직접 함수의 사용처를 음미하시길 바란다.

I. Intro

gt라는 이름은 grammar of tables즉 “테이블의 문법"의 줄임말이며 gt의 목표는 ggplot2와 비슷하게 운영하는 것이다. 특정 테이블을 쉽게 만들 수 있을 뿐만 아니라 다양한 문제를 해결하기 위해 서로 다른 방법으로 재결합할 수 있는 기본 구성요소 집합을 기술하는 역할을 한다.