<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Process Mining on Data Science | DSChloe</title>
    <link>https://dschloe.github.io/tags/process-mining/</link>
    <description>Recent content in Process Mining on Data Science | DSChloe</description>
    <generator>Hugo</generator>
    <language>en-US</language>
    <lastBuildDate>Tue, 28 Apr 2020 10:20:39 +0900</lastBuildDate>
    <atom:link href="https://dschloe.github.io/tags/process-mining/rss.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>vcrts01 - Combining Vectors</title>
      <link>https://dschloe.github.io/programming/2020/04/vcrts01/</link>
      <pubDate>Tue, 28 Apr 2020 10:20:39 +0900</pubDate>
      <guid>https://dschloe.github.io/programming/2020/04/vcrts01/</guid>
      <description>&lt;h2 id=&#34;i-개요&#34;&gt;I. 개요&lt;/h2&gt;&#xA;&lt;p&gt;&lt;code&gt;vctrs&lt;/code&gt; 패키지. Vector Helpers 패키지&lt;sup id=&#34;fnref:1&#34;&gt;&lt;a href=&#34;#fn:1&#34; class=&#34;footnote-ref&#34; role=&#34;doc-noteref&#34;&gt;1&lt;/a&gt;&lt;/sup&gt;라고 불리운다. 벡터를 활용할 때, 어려운 부분은 데이터와 조합해서 사용할 때다. 특히 서로다른 성질의 &lt;code&gt;Vectors&lt;/code&gt;를 Combining 할 때 발생하는 에러에 대해 효과적으로 해결할 수 있는 대안을 제시한다.&lt;/p&gt;&#xA;&lt;h2 id=&#34;ii-vectors&#34;&gt;II. Vectors&lt;/h2&gt;&#xA;&lt;p&gt;벡터에 관한 기초 부분은 여기에서 생략하고, 필자가 작성한 기초 부분에서 참조하기를 바란다.&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;a href=&#34;https://chloevan.github.io/r/basics/basic_objects_vector/&#34;&gt;Basci Objects&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h3 id=&#34;1-벡터의-정의&#34;&gt;(1) 벡터의 정의&lt;/h3&gt;&#xA;&lt;p&gt;R의 기본문법에서 벡터의 정의는 다음과 같다.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;c&lt;/span&gt;(&lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;, &lt;span style=&#34;color:#ae81ff&#34;&gt;2&lt;/span&gt;, &lt;span style=&#34;color:#ae81ff&#34;&gt;3&lt;/span&gt;)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] 1 2 3&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;c&lt;/span&gt;(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;a&amp;#34;&lt;/span&gt;, &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;b&amp;#34;&lt;/span&gt;, &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;c&amp;#34;&lt;/span&gt;)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] &amp;#34;a&amp;#34; &amp;#34;b&amp;#34; &amp;#34;c&amp;#34;&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;h3 id=&#34;2-tidyverse&#34;&gt;(2) tidyverse&lt;/h3&gt;&#xA;&lt;p&gt;벡터와 관련되어서 일반적으로 다음과 같은 함수에서 넓게 활용된다.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ch03 Components of Process Data</title>
      <link>https://dschloe.github.io/programming/2020/04/ch03_components_of_process_data/</link>
      <pubDate>Mon, 27 Apr 2020 23:20:39 +0900</pubDate>
      <guid>https://dschloe.github.io/programming/2020/04/ch03_components_of_process_data/</guid>
      <description>&lt;h2 id=&#34;i-개요&#34;&gt;I. 개요&lt;/h2&gt;&#xA;&lt;p&gt;지난시간에 &lt;code&gt;patients&lt;/code&gt;에 관한 데이터를 통해서 프로세스 분석에 대한 일반적인 개념을 접했다.&lt;/p&gt;&#xA;&lt;p&gt;이번 포스트에서는 &lt;code&gt;bupaR&lt;/code&gt;에 대한 이론적인 내용과 함께 간단하게 실습을 진행하도록 한다.&lt;/p&gt;&#xA;&lt;p&gt;지난시간과 마찬가지로 먼저 데이터를 획득하는 것에서부터 출발한다.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(bupaR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(eventdataR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;patients &lt;span style=&#34;color:#f92672&#34;&gt;&amp;lt;-&lt;/span&gt; patients&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;dim&lt;/span&gt;(patients)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] 5442    7&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;5442행과 7개의 열이 확인되었다.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;class&lt;/span&gt;(patients)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] &amp;#34;eventlog&amp;#34;   &amp;#34;tbl_df&amp;#34;     &amp;#34;tbl&amp;#34;        &amp;#34;data.frame&amp;#34;&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;h2 id=&#34;ii-용어-정리&#34;&gt;II. 용어 정리&lt;/h2&gt;&#xA;&lt;p&gt;우선 용어 정리가 필요하다. Events, Event log, Activity 등등. 하나씩 살펴보자.&lt;/p&gt;&#xA;&lt;h3 id=&#34;1-events&#34;&gt;(1) Events&lt;/h3&gt;&#xA;&lt;p&gt;우선 Events에 관한 이해를 돕기 위해 아래 그림을 우선 살펴보자.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ch02 Process Analysis Basic</title>
      <link>https://dschloe.github.io/programming/2020/04/ch02_process_analysis_basic/</link>
      <pubDate>Thu, 23 Apr 2020 23:20:39 +0900</pubDate>
      <guid>https://dschloe.github.io/programming/2020/04/ch02_process_analysis_basic/</guid>
      <description>&lt;h2 id=&#34;i-개요&#34;&gt;I. 개요&lt;/h2&gt;&#xA;&lt;p&gt;지난시간에 &lt;code&gt;patients&lt;/code&gt;에 관한 데이터를 통해서 프로세스 분석에 대한 일반적인 개념을 접했다.&lt;/p&gt;&#xA;&lt;p&gt;이번 포스트에서는 &lt;code&gt;bupaR&lt;/code&gt;에 대한 이론적인 내용과 함께 간단하게 실습을 진행하도록 한다.&lt;/p&gt;&#xA;&lt;p&gt;지난시간과 마찬가지로 먼저 데이터를 획득하는 것에서부터 출발한다.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(bupaR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(eventdataR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;patients &lt;span style=&#34;color:#f92672&#34;&gt;&amp;lt;-&lt;/span&gt; patients&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;dim&lt;/span&gt;(patients)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] 5442    7&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;5442행과 7개의 열이 확인되었다.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;class&lt;/span&gt;(patients)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;## [1] &amp;#34;eventlog&amp;#34;   &amp;#34;tbl_df&amp;#34;     &amp;#34;tbl&amp;#34;        &amp;#34;data.frame&amp;#34;&#xA;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;그리고, 데이터는 &lt;code&gt;eventlog&lt;/code&gt;, &lt;code&gt;tbl_df&lt;/code&gt;, &lt;code&gt;data.frame&lt;/code&gt;으로 구성된 것을 확인할 수 있다. 기존에 R을 학습한 사람들은 &lt;code&gt;tbl &amp;amp; data.frame&lt;/code&gt;에 대해서 한두번쯤 들었을 거라 생각한다. 그러나 &lt;code&gt;eventlog&lt;/code&gt;는 생소한 객체임을 알 수 있다.&lt;/p&gt;</description>
    </item>
    <item>
      <title>Ch01 Process Analysis Intro</title>
      <link>https://dschloe.github.io/programming/2020/04/ch01_process_analysis_intro/</link>
      <pubDate>Mon, 20 Apr 2020 21:10:39 +0900</pubDate>
      <guid>https://dschloe.github.io/programming/2020/04/ch01_process_analysis_intro/</guid>
      <description>&lt;h2 id=&#34;i-process-mining-intro&#34;&gt;I. Process Mining Intro&lt;/h2&gt;&#xA;&lt;p&gt;모든 비즈니스는 프로세스와 연관이 깊다. 이러한 데이터를 통상적으로 &lt;code&gt;event&lt;/code&gt;라고 부르며, 다루는 데이터는 &lt;code&gt;log&lt;/code&gt; 데이터와 연관이 깊다. &lt;code&gt;프로세스 마이닝(Process Mining)&lt;/code&gt;은 데이터의 추출, 프로세싱, 그리고 분석의 순으로 진행한다.&lt;/p&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://dschloe.github.io/img/programming/2020/04/ch01_process_analysis_intro/ch01_workflow.png&#34; alt=&#34;&#34;&gt;&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;데이터 추출 (Extraction)&lt;/code&gt;: &lt;code&gt;Raw Data&lt;/code&gt;를 &lt;code&gt;Event Data&lt;/code&gt;로 변환시킨다.&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;프로세싱 (Processing)&lt;/code&gt;: 데이터 가공과 비슷하며, 보통 &lt;code&gt;Aggregation&lt;/code&gt;, &lt;code&gt;Filtering&lt;/code&gt;, &lt;code&gt;Enrichment&lt;/code&gt;의 용어가 등장한다.&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;분석 (Analysis)&lt;/code&gt;: Performance, Control-Flow 등과 연관된 분석이 진행된다.&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;우선 빠르게 시각화부터 진행해보자.&lt;/p&gt;&#xA;&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-r&#34; data-lang=&#34;r&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(bupaR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(httr)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(processmapR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;library&lt;/span&gt;(edeaR)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;url &lt;span style=&#34;color:#f92672&#34;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#39;https://github.com/chloevan/datasets/blob/master/log/log_eat_patterns.RDS?raw=true&amp;#39;&lt;/span&gt;&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;patterns &lt;span style=&#34;color:#f92672&#34;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;readRDS&lt;/span&gt;(&lt;span style=&#34;color:#a6e22e&#34;&gt;url&lt;/span&gt;(url))&#xA;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#a6e22e&#34;&gt;trace_explorer&lt;/span&gt;(patients, coverage&lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;)&#xA;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;img src=&#34;https://dschloe.github.io/img/programming/2020/04/ch01_process_analysis_intro/ch03_viz.png&#34; alt=&#34;&#34;&gt;&lt;!-- --&gt;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
