Time-Series Data
시계열은 chrononlogical 순서에 따라 정량적으로 관찰된 집합이다. 다른 말로, 시간 순서로 배열된 데이터의 수열이다. 일정 시간 간격의 데이터의 순차열이다. 일반적으로 x축에 시간, y축에 관찰한 값으로 표현한다.
Time-Series Components
- Trend : 긴 시간에 걸친 평균적 변화
- Seasonal : 정해진 간격에 따라 나타나는 패턴으로 frequency라고도 불린다.
- Cyclic : 고정되지 않은 간격에서 나타나는 패턴으로 보통 seasonal보다 길다.
- Irregular
Time-Series Property
- Stationary : 시간과 독립적으로 관찰되는 데이터
- Non-stationary : 평균과 분산이 시간에 따라 변화하는 모델이다. differencing 기법을 사용해 Stationary로 변환할 수 있다.
Autocorrelation Function(ACF)
시계열 분석을 위해 사용되는 함수이다.
Correlation
lag-n correlation : 최신값과 n step 전의 값 간의 correlation을 계산
모든 n에 대한 lag-n를 도출하는 것이 ACF의 역할이다.