티스토리 뷰
서론
이전에 나는 국민순소득 NNI와 전체근로시간의 OLS(최소자승법) 회귀분석을 시도하였으나 OLS에 유의한 결과를 얻지 못하였다. 가장 큰 이유는 잔차의 자기상관성에 대응할 방도를 제대로 검토하지 못하였기 때문이다. 이번에 좀 더 방법들을 강구하여 유의한 결과를 얻게 되었다. 왠지 이로서 우리가 노동의 화폐적 표현(이하 MELT)에 대해 더 많은 지식을 얻을 가능성이 있지 않을까 생각도 드는데.. 아직은 더 많은 연구가 필요해보인다. 이 글은 단지 단순한 수준에서 그치지만 더 많은 가능성을 우리에게 주지할 수 있지 않을까 싶다.
회귀분석을 하려는 이유는 무엇인가
사실 내가 이 분석을 하려던 목적은 MELT를 정확한 비례상수로 바꾸는 것이었다. 물론 이로서 포기해야 할 정의가 무엇인지, 무엇이 수정되어야 하는 지에 대해 나는 그때 잘 몰랐던 것 같다. 그것을 정리하려면 좀 더 시간이 필요했던 것으로 보인다. 지금은 그 의미를 그때보다 잘 이해하고 있다. 이에 대해 설명해보자.
먼저 일반적으로 정의되는 MELT의 정의는 다음과 같다.
(1) $\mu=\frac{NNI}{T}$
$\mu$는 MELT이며, $NNI$는 국민순소득 또는 순부가가치, $T$는 전체노동시간이 된다. 새해석은 순부가가치와 전체노동시간이 둘 간에 일정한 관계를 갖는다고 정의했다. 이 정의를 받아들일 수 있다면 우리는 '가치'를 관측할 수는 없더라도 노동력의 가치를 다음과 같이 결정할 수 있다.
(2) $v=\mu^{-1}{w}$
$v$는 노동 1시간에 대해 노동력이 얻는 사회적 노동시간. 즉 노동력의 가치이며, $w$는 1시간 노동력에 대한 화폐 임금이다. 그리고 $\mu^{-1}$는 노동시간의 화폐적 표현의 역수를 표현하며 이는 화폐가치를 의미한다. 우리가 관측할 수 있는 임금과 비례상수 MELT 역시 관측가능한 변수로 이루어져있으므로 우리는 가치를 관측할 수 없더라도 노동력의 가치를 이렇듯 결정할 수 있게 되는 것이다. 1
하지만 이러한 정의는 이전에도 밝혔듯이 실증을 해보면 MELT는 증가하는 추세를 보인다. 즉 NNI와 T는 일정한 관계로 볼 수 없다.
이러한 잘못된 상황은 어디서 유래한 것인가? 나는 이에 대해 데이터가 잘못되었을 가능성에 무게를 두었다. 예컨대 내가 $T$의 관측데이터로 고용노동부의 [사업체노동력조사]를 참고하였는데 이는 실제 전 국민의 전체근로시간으로 볼 수 없는 문제가 있었다. 왜냐하면 모집단에서 표본을 추출하는 방식을 사용하기 때문이다. 따라서 해당 표본의 통계적 정보(평균, 분산 등)은 불편추정량이라 할 수 있더라도 우리가 관심을 갖는 모집단 산술합산 정보는 표본 산술합산과 당연히 차이가 있다. 예를 들어 고용노동부의 [사업체노동력조사]에서 표본의 추출방식은 산업과 기업체의 크기에 따라 표본수를 배분하는 방식을 사용하고 있다. 이러한 방식은 중소기업이 고용인력을 대부분 흡수하고 있다는 상황을 고려할 때, 합산 정보와 괴리될 가능성은 충분히 있는 것이다. 그리고 98년도까지 10인 이상 사업체를 대상으로 했고, 이후부터 5인 이상까지 확대하였다는 문제가 있다. 따라서 국민의 전체적인 노동시간보다 과소추정된 노동시간이라고 판단할 수 있다. 2
다음으로 우리는 순부가가치 NNI는 잘못되지 않았다고 판단했다. 국민계정은 국민경제의 전체적이고 전반적인 데이터의 합산이고 표본으로 추출된 것이 아니기 때문이다. 물론 정부가 확인할 수 없는 양성화되지 못한 경제부문은 문제의 소지가 있을 수 있으나 현재로서 무시할만한 수준으로 판단된다.
비례상수로서의 MELT
나는 표본합산한 국민노동시간이 과소추정되었으나 순부가가치를 설명할 수 있는 관측데이터라는 판단하에 회귀분석을 시도하였다. 만약 회귀식이 적합하다면 다음과 같이 정의할 수 있다.
(3) $NNI=b_{0}+b_{1}T+\epsilon$
$b_{0},b_{1}$은 절편 및 독립변수에 대한 기울기인 회귀계수이며, $\epsilon$은 해당 회귀식이 설명하지 못하고 남는 잔차라고 한다. 즉 $\epsilon=NNI-b_{0}-b_{1}T$ 표본 정보의 산술합산이 국민계정의 순부가가치를 적어도 설명할 수 있는 변수라고 확신한다면 모집단의 노동시간 합산을 할 필요가 없이 이 회귀식을 이용하면 되는 것이다. 예컨대 노동시간이 순부가가치를 설명하는 함수 $f(T)=\alpha+\beta{T}$라고 한다면
$NNI=f(T)$
이러한 관계가 확정되면 노동시간과 순부가가치는 일정한 관계를 갖게 된다. 즉 수정된 MELT
(4) $\mu=\frac{NNI}{f(T)}$
가 된다.
하지만 현실은 표본합산된 노동시간이 설명하지 못하고 남는 잔차가 있기 마련이다. 그런데 잔차의 존재는 연구자를 곤란하게 만드는 것이 아니다. 잔차가 무작위적이고 정규성을 갖는 등의 가정이 적절하다면 우리는 순부가가치에 영향을 주는 또 다른 변수를 찾을 고민을 할 필요 없이 회귀분석은 그냥 완결되는 것이다.
그러므로 나는 잔차(나는 이를 MELT 잔차라 부르고 싶다)를 포함하게 되는 확률변수를 포함하고자 하는 것이다.
(4)' $\mu*=\frac{1}{f(T)}(NNI+\epsilon)$
즉 잔차의 분포가 확률적 분포를 따른다면 MELT는 확률변수가 되며 이것이 정규분포라면 비례상수로 볼 수가 있게 된다. 그러므로 이는 MELT가 현실에서도 유의하다는 판단을 내릴 수가 있는 것이다. 물론 (4)'식 그대로 사용하지 않는다. 이는 단지 개념적 설명을 위해 보충되었을 뿐이다. 우리는 이러한 정의식을 포기하고 새로운 관점이 필요하게 된다.
대체 노동시간이 설명하지 못하는 순부가가치의 존재는 무엇인가?
MELT는 노동시간과 순부가가치 간에 일정한 관계가 유지되어야만 한다. 이는 바꿔말해 노동시간이 순부가가치를 설명하는 유일한 독립변수여야 한다는 소리와 같다. 나는 다음 챕터에서 이 변수들을 차분몫으로 새롭게 정의하면 이러한 물음에 대답할 수 있을 것이라고 희망한다.
실증분석
물론 (4)'식과 같이 시도한 내용은 실패했다. 예컨대 OLS 회귀식의 가정은 몇 가지 있지만 그중에서도 잔차의 (1)정규성 (2)등분산성 (3)비-자기상관성이라는 가정이 특히 중요하다. 이전의 분석은 자기상관성을 처리하지 못해 실패한 예이다.
몇 번의 시도 끝에 다음과 같은 회귀식이 유의하다는 점을 확인했다. 다만 우리가 생각했던 정의와 약간의 차이가 있다. 바로 잔차의 시계열적 자기상관성이 대체로 차분을 통해 해결된다는 점에 착안되었다. 3
먼저 $NNI$ 또는 $T$에 로그($\log_{e}$)를 취한 후, 현재시점 $t+1$과 과거시점 $t$로 하첨차에 표시하여 구분시켜주면 차분은 다음과 같이 정의된다.
$\ln{NNI_{t+1}}-ln{NNI_{t}},~~~\ln{T_{t+1}}-ln{T_{t}}$
또는
(5) $\ln{\frac{NNI_{t+1}}{NNI_{t}}},~~~\ln{\frac{T_{t+1}}{T_{t}}}$
과 같이 된다.
이제 이 두 변수로 OLS를 시도하면 다음과 같은 분포도를 보이고 있어 이전보다 훨씬 깔끔한 모습을 볼 수가 있다.
정규성이 성립하며 비-자기상관성을 보임을 확인했다. 아래는 D&W 자기상관성 검정을 이용한 결과이다.
ae <- data.frame(x=LaborTime, y=nni)
ols <- lm(y~x, ae)
durbinWatsonTest(ols)
lag Autocorrelation D-W Statistic p-value
1 -0.0966454 2.188068 0.346
Alternative hypothesis: rho != 0
그러나 이분산성을 확인하는 NCV 검정에서 등분산성이 성립하지 않고 이분산 현상을 보인다는 것을 확인했다.
ncvTest(ols)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 4.831244 Df = 1 p = 0.02794845
여기서 이분산 현상이란 이론적으로는 오차항 $\epsilon$의 분산이 모분산과 일치하지 않는 현상을 말한다. 물론 실제적으로 모분산을 알 수는 없는 경우가 많으므로. 대체로 잔차의 분산과 독립변수가 함수관계에 있을 때 발생하는 것이라고 한다. 이런 경우 OLS 추정량은 불편추정량은 유지되더라도 BLUE가 아니다. BLUE란 최소자승법으로 추정된 통계적 추정량이 불편성, 효율성, 선형성을 모두 가지고 있다는 점에서 최량선형불편추정량(BLUE:best linear unbiased estimator)이라고 부르는 것이다. 4 5
일반적으로 이분산 현상은 OLS 추정량에 초래할 편의나 불일치성 등을 초래하지 않는 것으로 알려져있다. 다만 회귀계수 $b_{0},b_{1}$의 분산이 편의를 갖는다는 점 때문에 t 검정이 의미를 상실할 뿐이다. 따라서 여기서는 이분산 현상에도 불구하고 OLS 추정량을 사용할 것이다. 물론 이를 GLS(일반화 최소자승법)를 통해 BLUE를 얻을 수 있었으나 MELT의 해석에 곤란함도 있고 해서 여기서는 이를 사용할 것이다. 6
이로써 얻은 회귀계수는 다음과 같다.
$b_{0}=0.01607209,~~b_{1}=1.02098965$
이제 (5)식의 좌변에 있는 NNI 로그 차분을 기존의 차분몫으로 복구시키려면 오일러 상수 $e$를 밑수로 넣어주어 로그변환해주면 된다.
$\frac{NNI_{t+1}}{NNI_{t}}=e^{\ln{\frac{NNI_{t+1}}{NNI_{t}}}}$
(5)식의 우변에 있는 T 로그 차분의 경우는 이를 독립변수로 하는 회귀예측치 $b_{0}+b_{1}\ln \Delta{T}$에 대하여 정리할 필요가 있는데 이는 로그변환 공식을 이용하여 간단히 할 수가 있다.
$\frac{NNI_{t+1}}{NNI_{t}}=\exp(0.01607209+1.02098965\times{\ln\frac{T_{t+1}}{T_{t}}}+\epsilon)$
$=\exp(b_{0})\times{exp(\ln{\Delta{T}}^{b_{1}})}\times{exp(\epsilon)}$
$=\exp(b_{0})\times{\Delta{T}^{b_{1}}}\times{exp(\epsilon)}$
이로써 우리는 순부가가치를 설명하는 노동시간의 함수를 $f(\Delta{T})=\exp(b_{0})\times{\Delta{T}^{b_{1}}}$로 취하면 다음과 같은 함수관계를 상정할 수 있다.
$\Delta{NNI}=f(\Delta{T})exp(\epsilon)$
순부가가치의 변화 배율은 노동시간의 변화 배율을 독립변수로 하는 함수와 MELT 잔차의 곱으로 표현된다. 이를 아래와 같이 정리하면
$p=\Delta{NNI}$
$f(\Delta{T})=1.0162019408\times{\Delta{T}}^{1.02098965}$
$z=\exp(\epsilon)$
따라서 다음과 같이 축약된다.
(6) $p=f(\Delta{T})z$
당연히 노동시간의 함수는
$\frac{p}{z}=f(\Delta{T})$, (단 z는 e의 지수 값이므로 0이 아니다)
MELT 잔차 $z$는 정규분포의 평균이 1이므로 이는 노동시간 차분몫의 함수 $f(\Delta{T})$는 대체로 $p$와 일치한다. 즉 노동시간이 차분몫이 순부가가치의 차분몫을 예측하지 못하는 오차값 잔차는 1 주위에서 정규분포로 분포되며 정규분포의 평균 1에서 가장 많은 빈도수를 가지므로 대체적으로 일치하며 따라서 국민순부가가치와 국민전체노동시간은 차분몫으로 변수를 변화시킬 때 일정한 관계를 갖는다는 것이 회귀분석의 결론이다.
MELT 잔차의 추이 분석
이로서 무엇을 알 수 있는가? 바로 노동시간이 설명할 수 없는, 즉 MELT에 오차를 만드는 요인이 무엇인가를 추세를 통해 확인해볼 수 있다는 점이다. 아래의 그림을 확인해보자.
97년과 2008년 정도에 MELT 잔차의 변동값이 추세선에서 가장 멀어진 점을 확인할 수 있다. 이는 두 개의 금융위기라는 역사적 순간을 돌이켜보면 이 금융적인 요인에 따른 외부충격은 국민순부가가치와 전체노동시간 간의 일정한 관계에 오차를 만드는 요인이라고 볼 수 있다는 것이다.
그러나 이러한 충격은 자기상관성이 없다보니 다음 기간에 영향을 거의 주지 않는 것으로 보인다. 추세적으로 잔차는 약한 하락추이를 보이는데, 즉 2000년도부터 2006년도까지 약간의 상승추이를 보이지만 나머지 기간은 모두 하락추이를 보이고 있다. 이것을 뭐라 판단해야 할지는 고민중이다.
[이관 글. 2017-05-08 작성]
- Foley, Duncan K., and Duncan K. Foley. Understanding capital: Marx's economic theory. Harvard University Press, 2009.(국역본)"자본의 이해". p66 ~ 67. 강경덕 역. 유비온. [본문으로]
- 고용노동부. "직종별사업체노동력조사보고서". p480. 2016.10. [본문으로]
- 조담. "금융계량분석.". p268~269. 도서출판 청람 (2006). [본문으로]
- 이종원. "계량경제학.". p318. 박엉사, 서울 (2001). [본문으로]
- 이종원. ibid. p142 [본문으로]
- 이종원. ibid. p330 [본문으로]
'정치경제학' 카테고리의 다른 글
직종별 노동자 주성분 분석 - 생산적 노동의 구분을 중심으로 (0) | 2021.05.28 |
---|---|
이채언의 「수리 마르크스 경제학」 서평에 대하여 (0) | 2021.05.24 |
생산적 노동의 구분 문제에 관한 노트 (0) | 2021.05.24 |
국민총소득과 전체근로시간의 회귀분석 시도 (0) | 2021.05.23 |
절대적 잉여가치와 상대적 잉여가치 (0) | 2021.05.23 |
- Total
- Today
- Yesterday
- 오블완
- 라멘아카네코
- 넷플릭스
- 가사노동
- 외톨이더락
- 암호화폐
- 뒤메닐
- 여성주의
- 가족임금
- 신카이마코토
- 살상무기지원
- 전형문제
- 시점간단일체계
- 자동분류
- 내청코
- 에릭올린라이트
- 인공지능
- 티스토리챌린지
- 논문읽기
- 엘스터
- 이윤율
- 생산력우위태제
- 초속5센티미터
- 코헨
- 셜록홈즈
- 잉여가치
- 여성혐오
- 시로바코
- 덕후감
- 노동력
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |