ch 09 - PLS-SEM 통계 분석기법(2)
Page content
I. PLS-SEM 통계 기초
- 교재를 참고하여 통계 기초에 대한 간단한 설명을 서술한다.
- 이는 다른 통계 책에도 있는 내용이기는 하다.
- 지난 시간에,
PLS-SEM
의 분포, 유의 수준과 신뢰수준의 관계, 신뢰도와 타당도, 탐색적 요인분석과 확인적 요인분석, 회귀분석에 대해 설명함
(1) 추정과 신뢰구간
- 추정(
estimation
)이란 모집단에 대한 어떠한 정보도 없는 상태에서 모집단을 대표할 수 있는 표본 추출하여 표본의 통계량을 구한 다음 이를 이용해서 모집단의 모수 예측- 점추정(Point Estimation): 추정하고자 하는 모수를 하나의 수치로 추정
- 신뢰구간 추정(Confidence Interval Estimation): 추정하고자 하는 모수가 존재하리라고 예상되는 신뢰구간을 정하여 추정하는 방법
- 신뢰구간에서는 보통
t분포
이용.
- 신뢰구간에서는 보통
- 신뢰구간의 결정방법은 다음과 같음
- 첫째, 추출된 표본평균($\bar{x}$)를 구한다.
- 둘째, 표본평균($\bar{x}$)의 표준편차인 표준오차(standard error)를 산출한다.
- 셋째, 신뢰수준($1-\alpha$)에 따른 $t$값을 구한다.
- 마지막으로, 표본평균($\bar{x}$)을 중심으로 표준오차와 $t$값을 곱한 값만큼 좌우($\pm$)로 떨어진 값$\bar{x}\pm t\left (\alpha/2, n-1\right)S/\sqrt{n}$으로 이루어진 구간이 신뢰구간이 됨
(2) SmartPLS
에서 PLS 알고리즘
PLS Algorithm
을 실행 시, 잠재변수 점수는 물론 이를 이용해 측정모델의 외부가중치(outer weights
), 외부적재치(outer loadings
)와 구조모델의 경로계수(path coefficients
), 내생잠재변수의 $R^2$ 등의 추정이 가능함.
(3) 부트스트래핑
PLS-SEM
은 데이터가 정규분포를 이룬다고 가정하지 않음- 무소적 검증을 통해 유의성을 검증하지 않음
- 대신,
부트스트래핑
을 통해 계수의 유의성 검증 진행- 비모수적 접근을 통해서 각 계수들에 대한 검증통계량인
t값
을 추정.
- 비모수적 접근을 통해서 각 계수들에 대한 검증통계량인
- 절차는 원데이터(
raw data
)로부터 많은 수의 부표본(subsamples
)인 부트스트랩 표본을 복원추출하여 반복적인 회귀분석과정을 통해t값
산출- 보통 부트스트랩 표본은 5,000개 필요
- 예를 들면, 산출된
t값
을 이용하여 계수의 유의성을 판단할 수 있음.- 5% 유의수준(양측검증)에서 특정 경로계수에 대해 산출된
t값
이 $\pm1.96$보다 크면 통계적으로 유의한 차이를 나타낸다고 해석 가능
- 5% 유의수준(양측검증)에서 특정 경로계수에 대해 산출된
(4) 외부가중치, 외부적재치 및 경로계수
- 경로계수(
path coefficient
)는 $P_{12}, P_{23}$와 같이 표시되며, 이는 표준화된 회귀계수 - 외부가중치(
outer weight
)는 잠재변수와 형성적 측정변수 간 표준화 회귀계수 의미- ($W_{11},W_{12}$)와 같이 표시됨
- 외부적재치(
outer loading
)는 잠재변수와 반영적 측정변수 간 표준화 회귀계수 의미- ($L_{35},W_{36}$)와 같이 표시됨
모든
표준화 계수는-1
과+1
사이의 값을 가짐
(5) 블라인드 폴딩과 예측적 적합성
- 예측적 적합성(
predictive relevance
)에 대한 기준으로 $R^2$과 함께Stone-Geisser
의 $Q^2$값을 확인할 필요가 있다.- 이 값은 누락거리 D(omission distance)에 의한 블라인드폴딩(
Blindfolding
) 절차를 통해 얻을 수 있다. 0보다 큰 $Q^2$
은 외생잠재변수가 내생잠재변수에 대해 예측적 적합성을 가지고 있음 의미반대로 0보다 작다면
, 예측적 적합성이 부족하다고 봄
- 이 값은 누락거리 D(omission distance)에 의한 블라인드폴딩(
(6) 효과크기($f^2$)
- 효과크기 $f^2$은 외생잠재변수의 내생잠재변수에 대한 $R^2$에 기여하는 정도를 평가하는 척도
- 효과크기 $f^2$에 대한 평가는 다음과 같다.
- 0.02: 작은 효과
- 0.15: 중간 효과
- 0.35: 큰 효과
- 효과크기에 대한 수치는 다음과 같다.
$f^{2}=\frac{R_{선택된\ 외생잠재변수\ 포함}^{2}-R_{선택된\ 외생잠재변수\ 제거}^{2}}{1-R_{선택된\ 외생잠재변수\ 포함}^{2}}$
(7) 위계적 성분모델(HCM)
- 1차성분요인과 2차요인으로 이루어져 있음
- 가급적 3차성분 이상의 모델은 권장하지 않음
- 예시는 다음과 같다.
- 1차 성분: 서비스품질 만족도, 시스템품질 만족도, 정부폼질 만족도
- 2차 성분: 모바일러닝 만족도
(8) 직접효과, 간접효과 및 총효과
-
PLS-SEM에서는 변수들 간의 다양한 인과관계 설정이 가능하여 직접효과, 간접효과 및 총효과를 추정할 수 있음 $$총효과 = 직접효과 + 간접효과 [총효과=c+(a \times b)]$$
-
간접효과
란 다른 변수에 의해 매개되어 두 변수들 간의 효과가 나타는 것- 독립변수가 매개변수를 통해 종속변수에 영향을 미치는 것
- 첫 번째 경로계수(X $\rightarrow$ M)
a
와 두 번째 경로계수 (M $\rightarrow$)b
를 곱하여 계산함
-
직접효과
란 다른 변수의 매개 없이 직접적으로 두 변수 간에 효과가 나타나는 것을 말함
(9) 매개효과와 조절효과
- 매개변수와 조절변수는 의미가 다르다.
- 매개변수(Mediator, mediating variable)는 독립변수와 종속변수 간의 관계를 설명하기 위해 개입되는 변수
- 조절변수(moderator, moderating variable)는 독립변수와 종속변수 간의 관계에 영향을 주는 제3의 독립변수
Reference
신건권. (2018). 석박사학위 및 학술논문 작성 중심의 SmartPLS 3.0 구조방정식모델링
. 서울: 청람.