Прогнозирование временных рядов с помощью машинного обучения
Временные ряды - это ряд наблюдений, собранных за последующий период времени. Переменная - все, что изменяется с течением времени Периоды времени могут быть ежедневными, еженедельными, ежемесячными, ежегодными и т.д. Поведение переменной - это количественное значение. || где-то взял...
Примеры временных рядов:
- ежедневные обменные курсы или движения цен акций
- ежегодное население страны за 50 лет
- еженедельное изменение веса в фунтах человека в течение года
- ежегодный ВВП страны в течение 50 лет
Можно уверенно сказать, что анализ временных рядов носит сложный характер. (Почти) Вся проблема в измерении, срытых факторах и шуме.
Большинство данных временных рядов зависит от их прошлых значений. Недавние прошлые значения являются хорошими показателями поведения переменной.
Отсутствующие данные часто заполняются прошлыми данными. Она также может быть вычислена на основе прошлых данных, например, путем взятия среднего значения (что обычно и делается в логистике).
Другой подход - брать взвешенную сумму текущих и прошлых значений.
Линейные тренды легче прогнозировать, и они являются более корректными данными. Нелинейные тренды могут быть экспоненциальными и временами квадратичными.
Линейные функции имеют постоянный градиент, известный как скорость роста/спада. Отрицательный градиент указывает на отрицательную корреляцию, а
положительный градиент указывает на положительную зависимость между временем и значениями переменной. (нелинейный ряд можно прологорифмировать - уже будет проще работать в ряде случаев)
Обычно выделяют метрики временного ряда: матожидание, дисперсия, ковариация, корреляция
|