Math & Statistics/Forecasting: Principles and Practice

챕터 2. 시계열 시각화 - ts함수

corycory 2022. 2. 1. 17:07
728x90
반응형
Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 

 

 

2.1 ts 객체

ts 함수 들여다보기

시계열 데이터는 여러가지 시간에 대한 정보를 숫자로 만든 것이다. R의 ts() 함수를 사용하면 숫자를 시계열 데이터로 바꿀 수 있다. ts함수에 대한 자세한 설명은 아래 링크를 보시면 된다.

 

https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/ts

 

ts function - RDocumentation

class to be given to the result, or none if NULL or "none". The default is "ts" for a single series, c("mts", "ts", "matrix") for multiple series.

www.rdocumentation.org

 

ts 함수 간단 예시

1년 주기로 관측값이 기록되는 경우의 예시. 2012년부터 시작, 5년치의 관측값을 기록하고 c(123, 39, 78, 52, 110) 안의 값을 각각 순서대로 부여합니다.

> y <- ts(c(123,39,78,52,110), start=2012)
> y
Time Series:
Start = 2012 
End = 2016 
Frequency = 1 
[1] 123  39  78  52 110

 

만약 1년보다 짧은 주기로 관측값이 기록되는 경우, 예를 들어 1년에 열두번 월별로 일어난다면 아래처럼 frequency를 추가해서 지정해 줍니다. 2003년부터 시작하되, 월별로 기록이 되는 데이터라는 의미입니다. 

> y <- ts(z, start=2003, frequency=12)

frequency(빈도)는 계절성 패턴이 반복되는 관측값의 수이다. R에서 사용하는 ts함수에서는 위처럼 frequency값을 지정해서 빈도를 나타내는데, 지정할 수 있는 frequency 값들의 예시는 아래와 같다. 주의 경우 1년은 윤년 때문에 52주로 딱 떨어지지 않는 해도 있지만, ts함수에서 요구하는 frequency 설정값이 정수이기 때문에 52로 설정됩니다.

데이터 주기 frequency 옵션값
1
분기 4
12
52

 

위의 기준은 기본 주기를 연도로 설정하고 frequency의 옵션을 바꿔주는 형식입니다. 하지만 다루는 데이터가 분(minute) 단위일수도 있고, 시간(hour) 단위 일수도 있고, 일(day) 단위 일수도 있습니다. 예를들어 일 단위일 경우 frequency = 7이 주별 계절성, frequency=365.25가 연간 계절정이 될 수 있습니다.

 

그 외에도 기존의 다른 숫자 데이터를 시계열 데이터로 바꾸고 싶다면 as.ts() 함수를 쓸 수 있습니다. 어떤 데이터가 시계열 데이터인지 확인하고자 할때는 is.ts()를 사용하면 됩니다.

> is.ts(y)
[1] TRUE

 

반응형