Anomaly Detection in Time-series Data
- 시계열 데이터에서 이상치를 측정
- 구현 목적은 트랜드성이 강한 특정 키워드가 언제부터 쿼리가 폭발적으로 증가하는가?라는 질문에 답하기 위해
- 예를 들어, 겨울에 ‘목도리’라는 키워드는 언제 쿼리가 증가할까? 이를 자동적으로 측정할 순 없을까?
- 구글트랜드 에서 제공하는 개별 키워드의 주차별 쿼리 데이터
- 최근 데이터에 가중치를 주는 EMA(Exponential Moving Average)와 EMS(Exponential Moving Standard Deviation)를 사용하여, 일정 편차를 넘어서는 값을 이상치로 추정
출처: Data Science tricks: Simple anomaly detection for metrics with a weekly pattern.
- 아이디어의 구현은 R을 활용