Продолжаем разбирать работу JIANGMIN XU «Optimal Strategies of High Frequency Traders». Чтобы составить уравнение оптимального контроля, сначала сформулируем проблему оптимизации алгоритма при используемых стратегиях θ, как достижение максимума следующего матожидания:
,
где интегралпредставляет собой штрафную функцию удержания ненулевой открытой позиции рискованного актива, γ- постоянный коэффициент, d[P,P]t- квадратичное изменение средней цены P, — кэш трейдера на момент времени окончания торговли T.
Далее определим функцию, которая представляет активы трейдера после ликвидации всех открытых позиций в конце торговли по алгоритму с помощью маркет ордера:
,
где x — кэш трейдера,
p- средняя цена (в стакане),
y — открытая позиция,
s — спред,
f — дисбаланс объемов в стакане,
ϵ- комиссия.
С учетом функции Q дадим определение так называемой функции владения, которую мы и будем максимизировать на всем протяжении работы алгоритма:
Проблема оптимального контроля решается с применением динамически программируемых уравнений, и для составления первого уравнения для котировочных стратегий θmk представим инфинитезимальный оператор второго порядка L:
— инфинитезимальные операторы процесса изменения средней цены P, дисбаланса объема в стакане F и спреда S соответственно. Несмотря на страшное название данные операторы просто обозначают воздействие изменяющихся в течение времени процессов цены, дисбаланса объема и спреда на функцию владения — то есть на активы, которыми владеет трейдер. Функции
являются ни чем иным, как ожидаемой частотой исполнения лимитных ордеров на биде и аске соответственно. Здесь h(f)- вероятность взятия лимит ордера на лучшем аске(биде) в очереди заявок, в зависимости от дисбаланса f, имеет форму — положительные константы. — частоты прихода маркет ордеров на бид и аск.
Для составления вторoго уравнения стратегии с маркет ордерами (take strategy) θtk , нам понадобится оператор импульсного управления M:
Этот оператор отражает воздействие на функцию V(t,x,y,p,f,s) стратегии θtk, с целью максимизации функции владения во время применения этой стратегии.
С операторами L и M мы сможем составить неравенство, которое называется квазивариационное неравенство Хамильтона-Якоби-Беллмана (HJB-QVI):
, на промежутке[0,T), (T- время ликвидации открытых позиций (окончание торговли)), и составляет систему уравнений с терминальным условием:
Решением этой системы уравнений и будет набор стратегий θmk ,θtk, вычисленные на каждый момент времени в промежутке [0,T), и на каждую величину спреда s, как изображено на графиках в заглавии статьи. Обратите внимание, что там появилась новая область в связи с размером спреда S больше одного шага цены — Pinging on bid\ask side. В этой области значения θmk равны 1 для бида/аска, что означает, что лимитные ордера выставляются в стакане на тик больше бида (тик меньше аска) — см. часть 2 цикла статей.
В следующей части рассмотрим как решить систему уравнений численными методами.
Источник - www.quantalgos.ru