반응형

시계열분석 6

챕터5 - 연습문제

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 5.10 연습문제 1번 a. elecdaily 테이블을 그래프로 나타내고, 온도를 설명변수로 사용해서 수요값에 대한 회귀모델 찾기. 일반적으로 30도까지는 온도가 올라갈수록 추울때보다 난방에 에너지를 덜 사용하게 되어 음의 관계가 나온다. elecdaily 데이터의 모델의 계수, 절편값 구하기 > tslm(Demand ~ Temperature, data=daily20) Call: tslm(formula = Demand ~ Temperature, data = daily20) Coefficients: (Intercept) Temperature 39.212 6.757 autoplo..

챕터 5. 예측변수 선택

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 5.5 예측변수 선택 예측변수가 여러개 있을때, 변수를 전부 쓰는 것보다는 예측에 유의미한 변수들만 몇가지 추리는게 필요하다. 다음은 추천하지 않는 방식들이다. 1. 목표 예상변수 y와 상관관계가 크지 않은 변수를 버리는 것. 2. 다중선형회귀분석을 해서, 0.05보다 p-value가 크면 무시해버리는 것. 통계적 유의미함이 꼭 예측값을 나타내는 것은 아니다. 3. 2개 이상의 예측변수들이 서로 관련되어 있을 때, p값들의 해석이 난감해지므로 좋지 않다. 가장 좋은 것은 예측 정확도(predictive accuracy)를 측정하는 것이다. 이걸 측정하는데 사용할 수 있는 것은..

챕터 5. 회귀모델평가, 예측변수

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 5.3 회귀모델평가 관측된 y값과 예측한 y^hat 값의 차이를 잔차(residual)로 정의한다. 이 잔차는 관측값에서 모델이 예측할수 없는 부분이며, 아래의 성질을 가진다. 회귀모델을 만든 뒤에, 모델의 가정이 만족되는지 확인하기 위해 잔차를 그려보는 것이 필요하다. 잔차의 ACF 그래프 보통 현재 시점에 관측한 변수의 값은 이전 기간의 값과 비슷하거나, 그보다 이전 기간의 값과 비슷할 수 있다. 이를 보기 위해 잔차의 자기상관(autocorrelation)을 확인한다. 만약 자기상관관계가 있다고 나오면, 아직 모델이 다 잡지 못한 정보가 더 있다는 것을 의미. 잔차의 히..

챕터 2. 시계열 시각화 - 시계열 패턴

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 2.3 시계열 패턴 시계열 분석에 사용하는 용어는 세분화되어 정의가 되어 있다. 추세 (trend) 추세는 데이터의 장기적인 상승/하락 방향을 나타낸다. 추세는 꼭 선형적이지많은 않으며, 오르는지 내리는지의 방향을 언급할 때 많이 쓴다. 계절성 (seasonality) 특정한 주기(1주일, 특정요일, 특정 계절 등)와 같은 계절성 요인이 데이터에 영향을 줄때 계절성 패턴이 나타난다. 계절성은 빈도로 알 수 있는데, 이 빈도는 일정하다. 주기성 (cycle) 위의 계절성과 달리, 특정한 패턴이 고정된 빈도가 아닌 형태로 나타날때 주기라고 한다. 일반적으로 주기들의 평균 지속시간..

챕터 2. 시계열 시각화 - 시간 그래프

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 이 챕터의 코드를 돌려보려면 먼저 R에 패키지를 먼저 설치해야 한다. fpp2 패키지를 먼저 설치해야 예제 코드를 돌릴 수 있다. 2.2 시간 그래프 (time plot) time plot, 말 그대로 시간을 가로축에 두고 관측값을 선으로 연결하여 그리는 기본적인 그래프이다. fpp2 라이브러리를 불러온다음, 예제 코드를 실행시켜 보았다. > library(fpp2) ## 라이브러리를 불러와야 다음 코드를 돌릴 수 있다. Registered S3 method overwritten by 'quantmod': method from as.zoo.data.frame zoo ── At..

챕터 2. 시계열 시각화 - ts함수

Forecasting: Principles and Practice 2nd Edition을 공부한 내용을 기록, 정리하고 있습니다. 2.1 ts 객체 ts 함수 들여다보기 시계열 데이터는 여러가지 시간에 대한 정보를 숫자로 만든 것이다. R의 ts() 함수를 사용하면 숫자를 시계열 데이터로 바꿀 수 있다. ts함수에 대한 자세한 설명은 아래 링크를 보시면 된다. https://www.rdocumentation.org/packages/stats/versions/3.6.2/topics/ts ts function - RDocumentation class to be given to the result, or none if NULL or "none". The default is "ts" for a single se..

반응형