위너 과정(Wiener process)
마르코프 연쇄(Markov chain)
어떤 변수(X)가 시간(t)에 따라 변하는 어떤 과정(process)을 생각해보자. 시간에 따라 일어나는 사건들이 확률에 따르는 구조를 확률과정(stochastic process)이라고 부른다. 주식 가격이 X의 좋은 예가 될 것이다.일자( \( t \) ) | 주가( \( X_{n} \) ) |
---|---|
0 | 100,000 |
1 | 98,000 |
2 | 99,000 |
3 | 110,000 |
... | ... |
t가 0일 때 \( X_{0} \), t가 1일 때 \( X_{1} \), ..., t=n일 때 \( X_{n} \)과 같이 표기한다. 시간의 흐름에 따른 변수들 \( X_{0} \), \( X_{1} \), \( X_{2} \), ..., \( X_{n} \)에 대한 확률모델을 설정하고 싶다고 하자. 가장 간단한 방법은 각 시간의 변수들 \( X_{n} \)을 모두 독립적인 확률 변수로 정의하는 것이다.
그러나 주가의 경우 이런 가정이 맞지 않는데, 다음 날의 주가( \( X_{n+1} \) )는 현재 주가( \( X_{n} \) )에 영향을 받는다는 가정이 더 합리적이기 때문이다. 좀 더 풀어 말하면 내일의 주가는 오늘의 주가에만 영향을 받고, 어제 또는 그저께, 일주일 전이나 한 달 전, 일 년 전의 주가에는 영향을 받지 않는다(기술적 분석가들은 동의하지 않을 것 같다).
이는 \( X_{n+1} \)의 과거 모든 상태들을 고려한 조건부 확률분포(Conditional probability distribution)가 현재 상태( \( X_{n} \) )만 고려한 조건부 확률분포와 같다는 뜻이고 아래와 같이 표시할 수 있다. \( P_{ij} \)를 현재(n) 상태 i에서 다음 시간(n+1)의 j 상태로 이전할 확률이라고 하면
$$P(X_{n+1}=j|X_{n}=i, X_{n-1}=i_{n-1}, ..., X_{0}=i_{0})=P(X_{n+1}=j|X_{n}=i)$$
위와 같은 확률과정을 마르코프 연쇄(Markov chain)라고 한다.
주식의 가격이 마르코프 확률 과정을 따르는 변수라고 가정하는 것은 '효율적 시장 가설(Efficient Market Hypothesis)'의 약형 가설(Weak-form hypothesis)과 일맥상통한다. 약형 효율적 시장 가설에 따르면 과거의 모든 주가 정보(ex. 가격, 거래량 등)는 현재 주가에 반영되어 있으므로 과거 주가 분석은 미래 주가 예측에 의미가 없다.
*효율적 시장 가설에는 약형(weak-form), 준강형(semi-strong form), 강형(strong form) 세 가지가 있다.
주가의 확률과정_마르코프 확률 과정(Markov stochastic process)
주식의 가격(stock price)이 마르코프 확률과정을 따른다고 가정하자. 또 '주가의 변화(수익률)'는 일 년(T) 평균이 0이고 분산이 1인 정규분포를 따른다고 가정하자.$$주가수익률(1년) \sim \phi(0,1)$$ *\( \phi(\mu, \sigma) \)는 평균 \( \mu \), 분산 \( \sigma^{2} \)인 정규분포. 여기서는 1년이 한 기간이다.(1년=T)
2년(2기간; 2T) 주가수익률 확률분포는 어떻게 될까?
주가가 마르코프 확률과정을 따르므로 각 기간(T) 동안 수익률(return; change of the variable)의 분포는 독립이다. 따라서 수익률의 2기간(2년) 확률분포는 '평균 0, 분산 1을 가지는 두 개의 1기간(1년) 확률분포들을 합친 값'이 된다. 독립적인 두 개의 정규분포를 더하면 평균과 분산도 단순 덧셈으로 결합되므로, 결합한 분포는 평균 0, 분산 2의 정규분포가 된다.
$$주가수익률(2년) \sim \phi(0,2)$$
2기간(2T)의 분산( \( \sigma^{2} \) )이 2이므로 표준편차는 \( \sqrt{2} \)가 된다. 마찬가지로 3기간(3T; 3년) 수익률 분포는 \( \phi(0, 3) \), 표준편차는 \( \sqrt{3} \)이 되겠다.
T(1년)보다 짧은 기간 단위의 수익률 분포도 알아볼 수 있다. T를 두 기간(n=2)으로 나눈 6개월( \( \Delta t \) )을 살펴보자. 각 독립적인 정규분포의 결합은 평균과 분산의 합으로 정의된다고 하였다. 따라서 1년 수익률 분포는 두 개의 6개월 수익률 분포 결합의 결과이므로, 6개월( \( \Delta t \) ) 수익률 분포는 평균 0, 분산 0.5의 정규분포가 된다.
$$주가수익률(0.5년) \sim \phi(0, 0.5)$$
6개월 수익률의 표준편차는 \( \sqrt{0.5} \)가 된다. 마찬가지로 T를 네 구간(n=4)으로 나눈 3개월( \( \Delta t \) ) 수익률은 평균 0, 분산 0.25, 표준편차 \( \sqrt{0.25} \)의 정규분포를 한다.
$$주가수익률(0.25년) \sim \phi(0, 0.25)$$
어떤 한 기간(위 예에서는 1년) 동안 분산이 1이라면, 짧은 시간 단위( \( \Delta t \) )에서의 분산은 아래와 같다.
$$\sqrt{\Delta t}$$ $$\Delta t=\frac{T}{n} \quad or \quad n=\frac{T}{\Delta t}$$
위너 과정(Wiener process) or 브라운 운동(Brownian Motion)
위와 같이 평균이 0, 분산이 1인 마르코프 확률 과정을 위너 과정(Wiener process) 또는 브라운 운동(Brownian motion)이라고 한다. 짧은 시간 구간 \( \Delta t \)에서의 확률변수 z의 변화 \( \Delta z \)는 아래와 같다.$$\Delta z= \epsilon \sqrt{\Delta t}$$ *\( \epsilon \)은 표준정규분포 \( \phi(0, 1) \)이다.
\( \Delta z \)는 평균이 0, 분산이 1인 정규분포에 의해 결정된다. 따라서
- \( \Delta z \)의 평균: 0
- \( \Delta z \)의 분산: \( \Delta t \)
- \( \Delta z \)의 표준편차: \( \sqrt{\Delta t} \)
짧은 시간 단위 \( \Delta t \)가 아닌 T 구간에서 변수 z의 변화 \( z_{T}-z_{0} \)의 분포는 \( \Delta z \)의 분포를 n번 더한 값이다.
- \( z_{T}-z_{0} \)의 평균: 0
- \( z_{T}-z_{0} \)의 분산: \( \Delta t*n = T \)
- \( z_{T}-z_{0} \)의 표준편차: \( \sqrt{T} \)
T 안의 각 시간단위 \( \Delta t \)가 0으로 수렴할 때, 즉 \( n \rightarrow \infty \)일 때 \( dt \)로 표기한다. 마찬가지로 \( \Delta t \rightarrow 0 \)이면 \( \Delta z \)는 \( dz \)가 된다. 시간 단위 \( \Delta t \)동안 변수 x가 \( \Delta x \)만큼 변한다면 \( \Delta t \rightarrow 0 \)일 때 \( dx \)라고 쓴다.
$$dz= \epsilon \sqrt{dt}, \quad \Delta t \rightarrow 0$$
지금까지 다룬 '평균 0, 분산 1' 확률 과정은 Standard Wiener process이다. 이를 확장한 것으로 일반화된 위너 과정(Generalized Wiener process)이 있다. 확률변수 x가 위너과정을 따른다면, 짧은 시간 구간 \( \Delta t \)에서의 확률변수의 변화 \( \Delta x \)를 일반화된 위너 과정으로 표현할 수 있다.
$$\Delta x=a\Delta t + b\Delta z$$ $$\Delta x=a\Delta t + b\epsilon \sqrt{\Delta t}$$
확률 과정(stochastic process)에서 시간 단위( \( \Delta t \ or \ dt \) )당 평균 변화량을 drift rate이라고 하고, 단위당 분산을 variance rate이라고 한다. \( \Delta z \)의 drift rate은 0, variance rate은 1이므로 위 식에서 x의 drift rate은 \( a \)가 된다( \( \frac{\Delta x}{\Delta t}=a \) ). b가 단위당 \( \Delta x \)의 표준편차가 되고, 변화량의 표준편차는 \( \sqrt{\Delta t} \)에 비례한다.
\( \epsilon \)이 표준정규분포를 따르므로 \( \Delta x \)는 정규분포를 따른다.
- \( \Delta x \)의 평균: \( a\Delta t \)
- \( \Delta x \)의 분산: \( b^{2}\Delta t \)
- \( \Delta x \)의 표준편차: \( b\sqrt{\Delta t} \)
정리하면, 현재 시점(time 0)에서의 값이 \( x_{0} \)으로 주어졌다면 다음 시점(time \( \Delta t \))에서의 값 \( x_{\Delta t} \)는 평균이 \( x_{0}+a\Delta t \)이고 분산이 \( b^{2}\Delta t \)인 정규분포를 따른다. 만약 시간 간격이 \( \Delta t \)가 아닌 T라면, \( x_{T} \)는 평균이 \( x_{0}+aT \)이고 분산이 \( b^{2}T \)인 정규분포를 따른다.
일반화된 위너 과정(Generalized Wiener process)을 연속확률과정으로 다시 쓰면 다음과 같다.
$$dx=adt + bdz$$
금융시장에서 보통 dx의 평균값 \( a \)를 \( \mu \), 분산율 \( b^{2} \)을 \( \sigma^{2} \)으로 쓰는 것이 일반적인 것 같다. 이 경우 \( \Delta x \)의 분산과 표준편차는 \( \sigma^{2}\Delta t, \ \sigma\sqrt{\Delta t} \)로 쓸 수 있다.
별첨_마르코프 확률과정_2
다른 마르코프 확률 과정을 하나 더 알아본다. Drunkard's walk(drunkard: 술고래)라는 마르코프 체인이 있다. 걸음은 왼쪽 혹은 오른쪽으로 걸으며 좌우 대칭이다. 최초 위치를 0으로 하고 각 시간 단위(T) 마다 한 걸음을 걸으며, 왼쪽으로 걸을 때 -1, 오른쪽으로 걸을 때 1만큼 위치를 조정한다고 하자. 이 때 왼쪽으로 걷거나 오른쪽으로 발을 디딜 확률은 똑같이 \( \frac{1}{2} \), 즉 \( P_{i, i+1}=\frac{1}{2}=P_{i, i-1} \)이다.이제 하나의 걸음(x)을 작은 걸음( \( \Delta x \) )으로 나누어보자. 각 시간 단위 T를 더 작은 시간 간격 \( \Delta t \)로 쪼개고, \( \Delta t \) 동안 \( \Delta x \)를 이동한다고 하자. X(T)를 T시점의 위치라고 하면 아래와 같이 쓸 수 있다.
$$X(T)=\Delta x(X_{1}+X_{2}+ ... +X_{\frac{T}{\Delta t}})$$ \( X_{i}=1 \) (if the ith step of length \( \Delta x \) is to the right)
\( X_{i}=-1 \) (if the ith step of length \( \Delta x \) is to the left)
이 때 \( T/n=\Delta t \)이다.(시간 단위 T를 n으로 쪼갠 작은 시간 단위 \( \Delta t \) )
\( X_{i} \)는 독립적이며(independent) 아래와 같은 확률을 가진다.
$$P(X_{i}=1)=P(X_{i}=-1)=\frac{1}{2}$$
\( E(X_{i})=0, \ Var(X_{i})=E(X_{i}^{2})-E(X_{i})^{2}=1 \)이 된다. 그러므로 X(T)의 평균과 분산은 다음과 같다.
$$E[X(T)]=0$$ $$Var(X(T))=(\Delta x)^{2}*(\frac{T}{\Delta t})$$
*분산 \( Var(X(T))=Var(\Delta x(X_{1}+X_{2}+...+X_{\frac{T}{\Delta t}}))=Var(\Delta x \sum_{i=1}^{T/\Delta t}X_{i}) \) \( X_{i} \)는 독립이고, 어떤 상수 \( a \)에 대하여 \( Var(aX)=a^{2}Var(X) \)이므로 \( Var(X(T))=(\Delta x)^{2}*Var(\sum_{i=1}^{T/\Delta t}X_{i}) \) \( =(\Delta x)^{2}* \sum_{i=1}^{T/\Delta t}Var(X_{i}) \) \( =(\Delta x)^{2}* \sum_{i=1}^{T/\Delta t}1 \) \( =(\Delta x)^{2}*(\frac{T}{\Delta t}) \)
\( T=\Delta t \)라면(즉, n=1) \( Var(X(T))=(\Delta x)^{2} \)이 되고 \( \Delta x = \sigma \)로 쓸 수 있다. 한편 \( T \neq \Delta t \)라면, 위에서 확률과정에서의 표준편차는 \( \sqrt{\Delta t} \)에 비례한다고 하였으므로 \( \Delta x = \sigma \sqrt{\Delta t} \)로 놓을 수 있다. 따라서
$$Var(X(T))=(\Delta x)^{2}*\frac{T}{\Delta t}=(\sigma \sqrt{\Delta t})^{2}*\frac{T}{\Delta t}=\sigma^{2}T$$
위너과정 또는 브라운 운동의 정의는 이론서마다 약간의 차이는 있으나 개념은 동일한 것 같다. Introduction to Probability Models(SHELDON M.ROSS)에 나오는 정의를 차용하면,
- 확률과정 \( X(t), \ t \geq 0 \)이 아래 조건을 만족시킬 때 위너 확률 과정이라고 한다.
1) \( X(0)=0 \)
2) \( X(t), \ t \geq 0 \) has stationary and independent increments
3) For every \( t>0, \ X(t) \) is normally distributed with mean 0 and variance \( \sigma^{2}t \)
표준위너과정(Standard Wiener process)는 평균 0, 분산이 1인 위너과정을 말한다.