Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다.
3.5 예측 구간
예측 구간은 특정 확률로 관측값이 있을것으로 추정되는 구간이다. 예를 들어, 예측오차가 표준분포를 따른다고 가정했을때, h스텝 예측의 95% 예측 구간은 아래와 같이 계산된다.
좀더 일반적으로, 예측 구간은 아래의 공식으로 나타낼 수 있다.
위 공식에서 c는 포함하고자 하는 확률값으로, 만약 95% 예측구간이라고 치면 1.96이 된다.
벤치마크 방식
잔차들이 서로 상관관계가 없다는 가정하에 예측의 표준 편차를 계산하는 벤치마크 방식은 네가지가 있다. 만약 시그마(h)가 h스텝 예측 분포의 표준 편차이고, 시그마가 잔차의 표준 편차라면, 아래의 공식을 사용할 수 있다.
h=1이고 T가 충분히 크다면, 위 네 가지 방법 모두 최종값은 시그마로 나온다. 예측 구간은 위 네가지중 어떤 방식을 써도 계산이 가능하다.
부트스트랩(bootstrap) 방식으로 계산하기
예측오차의 표준분산을 가정할 수 없을 때 사용할 수 있는 방법이 부트스트랩 방식이며, 예측 오차가 서로 상관관계가 없다는 가정만 필요하다. 부트스트랩 방식은 아래와 같다. 기존의 관측값-예측값 = 예측오차라는 공식은 관측값을 왼쪽에 두고 아래처럼도 쓸 수 있다.
미래의 오차가 과거의 오차와 비슷할 것이라는 가정하에, 미래의 오차 e(T+1)을 과거의 오차 모음(예를 들면 잔차 같은)에서 샘플링해 뽑아 낼 수 있다. 이제 새로운 시뮬레이션 값을 데이터 셋에 추가하며, 우리는 다음 값을 얻을 수 있다.
이런 식으로, 갖고 있는 시계열 데이터의 전체 예측값을 시뮬레이션 해 볼 수 있다. 어쨌든, 이런 식으로 여러번 뽑아내면서 우리는 미래에 대한 예측값을 얻을 수 있고, 각각의 예측값의 퍼센트를 계산해서 예측 구간을 얻을 수 있다.
변환된 예측구간
데이터를 예측할때 수학적인 변환을 사용해서 단위가 바뀌었다면, 바뀐 단위로 예측구간을 계산하고, 그 다음에 원래의 데이터의 단위로 예측구간을 나타내기 위해 역변환 해야 한다. 이 방법은 결과적으로 예측구간이 비대칭적으로 나타날수 있지만, 예측구간의 확률 범위를 보존한다.
'Math & Statistics > Forecasting: Principles and Practice' 카테고리의 다른 글
챕터 4. 판단 예측 (0) | 2022.02.19 |
---|---|
챕터 3 연습문제 (0) | 2022.02.12 |
챕터 3 - 예측 정확도 평가 (0) | 2022.02.12 |
챕터 3 - 적합값, 잔차 (0) | 2022.02.11 |
챕터 3. 예측 기법 - 단순한 예측 기법 & 변환 (0) | 2022.02.08 |