ch 09 - PLS-SEM 통계 분석기법(2)

Page content

I. PLS-SEM 통계 기초

  • 교재를 참고하여 통계 기초에 대한 간단한 설명을 서술한다.
    • 이는 다른 통계 책에도 있는 내용이기는 하다.
    • 지난 시간에, PLS-SEM의 분포, 유의 수준과 신뢰수준의 관계, 신뢰도와 타당도, 탐색적 요인분석과 확인적 요인분석, 회귀분석에 대해 설명함

(1) 추정과 신뢰구간

  • 추정(estimation)이란 모집단에 대한 어떠한 정보도 없는 상태에서 모집단을 대표할 수 있는 표본 추출하여 표본의 통계량을 구한 다음 이를 이용해서 모집단의 모수 예측
    • 점추정(Point Estimation): 추정하고자 하는 모수를 하나의 수치로 추정
    • 신뢰구간 추정(Confidence Interval Estimation): 추정하고자 하는 모수가 존재하리라고 예상되는 신뢰구간을 정하여 추정하는 방법
      • 신뢰구간에서는 보통 t분포 이용.
  • 신뢰구간의 결정방법은 다음과 같음
    • 첫째, 추출된 표본평균($\bar{x}$)를 구한다.
    • 둘째, 표본평균($\bar{x}$)의 표준편차인 표준오차(standard error)를 산출한다.
    • 셋째, 신뢰수준($1-\alpha$)에 따른 $t$값을 구한다.
    • 마지막으로, 표본평균($\bar{x}$)을 중심으로 표준오차와 $t$값을 곱한 값만큼 좌우($\pm$)로 떨어진 값$\bar{x}\pm t\left (\alpha/2, n-1\right)S/\sqrt{n}$으로 이루어진 구간이 신뢰구간이 됨

(2) SmartPLS에서 PLS 알고리즘

  • PLS Algorithm을 실행 시, 잠재변수 점수는 물론 이를 이용해 측정모델의 외부가중치(outer weights), 외부적재치(outer loadings)와 구조모델의 경로계수(path coefficients), 내생잠재변수의 $R^2$ 등의 추정이 가능함.

(3) 부트스트래핑

  • PLS-SEM은 데이터가 정규분포를 이룬다고 가정하지 않음
  • 무소적 검증을 통해 유의성을 검증하지 않음
  • 대신, 부트스트래핑을 통해 계수의 유의성 검증 진행
    • 비모수적 접근을 통해서 각 계수들에 대한 검증통계량인 t값을 추정.
  • 절차는 원데이터(raw data)로부터 많은 수의 부표본(subsamples)인 부트스트랩 표본을 복원추출하여 반복적인 회귀분석과정을 통해 t값 산출
    • 보통 부트스트랩 표본은 5,000개 필요
  • 예를 들면, 산출된 t값을 이용하여 계수의 유의성을 판단할 수 있음.
    • 5% 유의수준(양측검증)에서 특정 경로계수에 대해 산출된 t값이 $\pm1.96$보다 크면 통계적으로 유의한 차이를 나타낸다고 해석 가능

(4) 외부가중치, 외부적재치 및 경로계수

  • 경로계수(path coefficient)는 $P_{12}, P_{23}$와 같이 표시되며, 이는 표준화된 회귀계수
  • 외부가중치(outer weight)는 잠재변수와 형성적 측정변수 간 표준화 회귀계수 의미
    • ($W_{11},W_{12}$)와 같이 표시됨
  • 외부적재치(outer loading)는 잠재변수와 반영적 측정변수 간 표준화 회귀계수 의미
    • ($L_{35},W_{36}$)와 같이 표시됨
  • 모든 표준화 계수는 -1+1사이의 값을 가짐

(5) 블라인드 폴딩과 예측적 적합성

  • 예측적 적합성(predictive relevance)에 대한 기준으로 $R^2$과 함께 Stone-Geisser의 $Q^2$값을 확인할 필요가 있다.
    • 이 값은 누락거리 D(omission distance)에 의한 블라인드폴딩(Blindfolding) 절차를 통해 얻을 수 있다.
    • 0보다 큰 $Q^2$은 외생잠재변수가 내생잠재변수에 대해 예측적 적합성을 가지고 있음 의미
    • 반대로 0보다 작다면, 예측적 적합성이 부족하다고 봄

(6) 효과크기($f^2$)

  • 효과크기 $f^2$은 외생잠재변수의 내생잠재변수에 대한 $R^2$에 기여하는 정도를 평가하는 척도
  • 효과크기 $f^2$에 대한 평가는 다음과 같다.
    • 0.02: 작은 효과
    • 0.15: 중간 효과
    • 0.35: 큰 효과
  • 효과크기에 대한 수치는 다음과 같다.

$f^{2}=\frac{R_{선택된\ 외생잠재변수\ 포함}^{2}-R_{선택된\ 외생잠재변수\ 제거}^{2}}{1-R_{선택된\ 외생잠재변수\ 포함}^{2}}$

(7) 위계적 성분모델(HCM)

  • 1차성분요인과 2차요인으로 이루어져 있음
    • 가급적 3차성분 이상의 모델은 권장하지 않음
  • 예시는 다음과 같다.
    • 1차 성분: 서비스품질 만족도, 시스템품질 만족도, 정부폼질 만족도
    • 2차 성분: 모바일러닝 만족도

(8) 직접효과, 간접효과 및 총효과

  • PLS-SEM에서는 변수들 간의 다양한 인과관계 설정이 가능하여 직접효과, 간접효과 및 총효과를 추정할 수 있음 $$총효과 = 직접효과 + 간접효과 [총효과=c+(a \times b)]$$ png

  • 간접효과란 다른 변수에 의해 매개되어 두 변수들 간의 효과가 나타는 것

    • 독립변수가 매개변수를 통해 종속변수에 영향을 미치는 것
    • 첫 번째 경로계수(X $\rightarrow$ M) a와 두 번째 경로계수 (M $\rightarrow$) b를 곱하여 계산함
  • 직접효과란 다른 변수의 매개 없이 직접적으로 두 변수 간에 효과가 나타나는 것을 말함

(9) 매개효과와 조절효과

  • 매개변수와 조절변수는 의미가 다르다.
  • 매개변수(Mediator, mediating variable)는 독립변수와 종속변수 간의 관계를 설명하기 위해 개입되는 변수
  • 조절변수(moderator, moderating variable)는 독립변수와 종속변수 간의 관계에 영향을 주는 제3의 독립변수

Reference

신건권. (2018). 석박사학위 및 학술논문 작성 중심의 SmartPLS 3.0 구조방정식모델링. 서울: 청람.