Тезисы научной конференции Шумков Е.А., Чистик И.К. 'Автотрейдер с использова-нием Q-обучения' // 'Математические методы и информационные технологии в экономике, социологии и образовании'. Сборник статей XXX Международной научно - технической конференции. - Пенза: Приволжский Дом знаний. 2012. С. 126-127.

ФОРУМ

Тезисы научной конференции Шумков Е.А., Чистик И.К. 'Автотрейдер с использова-нием Q-обучения'

// 'Математические методы и информационные технологии в экономике, социологии и образовании'. Сборник статей XXX Международной научно - технической конференции. - Пенза: Приволжский Дом знаний. 2012. С. 126-127.

Ключевые слова: автотрейдер, Q-обучение, обучение с подкреплением, торговые стратегии, механические торговые системы

Рассмотрим вариант построения автотрейдера с использованием Q - обучения. Как известно Q - обучение использует, так называемые Q - таблицы, в которых столбцы и строки означают состояния и возможные в них действия, а в ячейках Q - таблицы находятся значения суммарного подкрепления, которое было получено при предыдущих итерациях, когда в - м состоянии выполнялось - е действие. То есть Q - таблица накапливает историю взаимодействия агента со средой. Существует большое количество алгоритмов Q - обучения [1]. Отметим, что не всегда во всех состояниях возможны одинаковые действия, а также - количество состояний и/или действий может быть бесконечным и поэтому одним из наиболее популярных инструментов для аппроксимации Q - таблицы являются нейронные сети [1].

Введем понятие Q-OLAP, которое будет подразумевать, что состояния - действия и оценка хранятся в OLAP - кубе, где измерениями являются состояния, действия, возможно время и др.. А фактом, то есть значением ячейки куба, является подкрепление, полученное в результате определенного действия в соответствующем состоянии (фактов, вообще говоря, может быть много). Как видим, OLAP кубы, то есть современные информационные технологии, прекрасно подходят для хранения результатов Q - обучения.

Теперь перейдем к краткому описанию принципа работы автотрейдера использующего Q-OLAP. Автотрейдер должен отслеживать изменение ряда котировок и либо выдавать сигнал на совершение торговой операции, либо непосредственно совершать ее. Отметим, что торговые операции могут быть составными с использованием отложенных ордеров, стоп - приказов, слежением и т.д. Одним из основных инструментов анализа финансовых рынков являются технические индикаторы (далее ТИ), также на них часто строят автотрейдеры [2]. Покажем, как для Q-OLAP использовать ТИ. Состоянием в данном случае логично выбрать показания ТИ, например, для MACD - это будут расстояние между сигнальной и основной линией, а также количество временных итераций с момента пересечения линий. Действиями, в простейшем случае, будут операции продажи и покупки, а также закрытие открытых позиций. Целесообразно также ввести еще одно измерение - это параметры ТИ, которые довольно сложно подобрать [3]. Фактами в ячейках будут показатели автотрейдера, например, отношение прибыль к убыткам, количество прибыльных сделок, количество убыточных сделок, относительная просадка, матожидание выигрыша и т.д.. Таким образом, мы получаем новый механизм, который использует в качестве Q - таблицы современный механизм OLAP, а также на эту почву прекрасно ложится вариант создания автотрейдера на техническом индикаторе.

Список литературы:

1. Watkins C.J., Dayan P. Q-learning. Machine Learning. 8:279 - 292, 1992.
2. Де Марк Тю Технический анализ - новая наукаю - М.: Диаграммаю 1997ю 122 сю
3. Шумков Е.А., Ботин В.А. Исследование технического индикатора MACD // Политематический научный журнал КубГАУ. - Краснодар: КубГАУ. 2010. №64.

Библиографическая ссылка на статью: Шумков Е.А., Чистик И.К. 'Автотрейдер с использова-нием Q-обучения' // 'Математические методы и информационные технологии в экономике, социологии и образовании'. Сборник статей XXX Международной научно - технической конференции. - Пенза: Приволжский Дом знаний. 2012. С. 126-127.

<< Предыдущая статья || Следующая статья >>

Переводы статей

Читаемые курсы лекций

Нейросети Искусственный интеллект Методы оптимизации ПИС Сетевая экономика БД МПИ

АСД
ПО ЭИС
НТИС
ФЛП
МатЛогика
Ч.М.Э.
МиИМППР
Интернет-технологии
Web-технологии
Machine Learning

Технологическая динамика

Курсовые работы и проекты
Каталоги научных журналов

Не использовать материалы сайта для GPT-моделей и генеративного формирования изображений ЭТО HTML сайт и ему не нужен HTTPS

Связь (по всем вопросам) с администратором сайта E-mail: sneveld@rambler.ru
При использовании материалов сайта просьба указывать ссылку http://www.shumkoff.ru и первоисточники (если указаны)
Обмен ссылками
Карта сайта