Глава 4 Параметрические методы для других распределений

1 2 3 4 5 6 7 8 9

Из предыдущей главы мы узнали, как найти оптимальное f и его побочные продукты при нормальном распределении. Тот же метод применим к любому другому распределению, где известна функция распределения вероятности (то есть интеграл плотности распределения вероятности). О многих известных распределениях и об их функциях распределения вероятности рассказано в приложении В.

1 Интеграл функции, описывающей нормальное распределение, в действительности нельзя точно рассчитать, но его можно получить с большой степенью точности с помощью уравнения (3.21), чего нельзя сказать о многих других распределениях

К сожалению, большинство распределений торговых P&L плохо описываются функциями нормального и других распределений. В этой главе мы сначала обратимся к проблеме неопределенной природы распределения торговых P&L и далее изучим метод планирования сценария — естественное продолжение идеи оптимального/. Этот метод широко применяется и позволяет находить оптимальное f по ячеистым распределениям. Далее мы перейдем к следующей главе, посвященной опционам и одновременной торговле по нескольким позициям. Прежде чем смоделировать реальное распределение торговых P&L, мы должны найти метод сравнения двух распределений.

Тест Колмогорова-Смирнова (К-С)

Хи-квадрат тест, без сомнения, является наиболее популярным из всех методов сравнения двух распределений. Так как многие ориентированные на рынок приложения, помимо рассматриваемых в этой главе, часто используют хи-квадрат тест, то он описан в Приложении А. Однако для наших целей наилучшим методом будет тест К-С. Этот очень эффективный тест применим к неячеистым распределениям, которые являются функцией одной независимой переменной (в нашем случае, прибыль за одну сделку).

Все функции распределения вероятности имеют минимальное значение 0 и максимальное значение 1. То, как они ведут себя между ними, и отличает их. Тест К-С измеряет очень простую переменную D, которая определяется как максимальное абсолютное значение разности между двумя функциями распределения вероятности. Тест К-С достаточно прост. N объектов (в нашем случае сделок) нормируются (вычитается среднее значение, и полученная разность делится на стандартное отклонение) и сортируются в порядке возрастания. Когда мы проходим эти отсортированные и нормированные сделки, накопленная вероятность рассматриваемого количества сделок делится на N. Когда мы берем первую сделку в отсортированной последовательности с наименьшим стандартным значением, функция распределения вероятности (cumulative density function, далее — ФРВ) равна 1/N. Для каждого стандартного значения, которое мы проходим, приближаясь к наибольшему стандартному значению, к числителю прибавляется единица. В конце последовательности наша ФРВ будет равна N/N, или 1. Для каждого стандартного значения мы можем рассчитать теоретическое распределение. Таким образом, мы можем сравнить фактическую функцию распределения вероятности с любой теоретической функцией распределения вероятности. Переменная D, или статистика К-С (К-С statistic), равна наибольшему расстоянию между значением нашей фактической функции распределения вероятности и значением теоретического распределения ФРВ при этом же стандартном значении. При сравнении фактической ФРВ для данного стандартного значения с теоретической ФРВ для этого же стандартного значения мы должны также сравнить теоретическую ФРВ предыдущего стандартного значения с фактической ФРВ текущего стандартного значения.

Для того чтобы прояснить эту ситуацию, посмотрим на рисунок 4-1. Отметьте. что в точке А фактическая кривая находится выше теоретической. Поэтому мы сравниваем текущее значение фактической ФРВ с текущим теоретическим значением для нахождения наибольшей разности. Однако в точке В фактическая кривая находится ниже теоретической. Поэтому мы сравниваем предыдущее фактическое значение с текущим теоретическим значением. Идея состоит в том, что в результате мы выберем наибольшую разность.

Для каждого стандартного значения нам надо взять абсолютное значение разности между текущим значением фактической ФРВ и текущим значением теоретической ФРВ. Нам также надо взять абсолютное значение разности между предыдущим

значением фактической ФРВ и текущим значением теоретической ФРВ. Повторив эту операцию для всех стандартных значений точек, где фактическая ФРВ делает скачок вверх на 1/N, и взяв наибольшую разность, мы определим переменную D.

Накопленная вероятность

Таким образом, нашим первым значением является 1,452298. Теперь прибавим следующее значение:

J2 = (2 % 2) * 4 - 2 * ЕХР(-2 * 2^ 2 * (100^ (1/2) * 0,04)^2) =0*4-2* ЕХР(-2 * 2^ 2 * (10 * 0,04)^ 2) = -2 * ЕХР(-2 * 2^ 2 * 0,4^ 2) = -2*ЕХР(-2*4*0,16) = -2*ЕХР(-1,28) = -2 * 0,2780373 = -0,5560746

Прибавив -0,5560746 к нашей текущей сумме 1,452298, мы получим новую текущую сумму 0,8962234. Затем снова увеличим J на 1, теперь оно будет равно 3, и решим уравнение. Получившееся значение прибавим к текущей сумме 0,8962234. Следует поступать таким образом и дальше, пока текущая сумма в пределах допуска не перестанет изменяться. В нашем примере предельное значение будет равно 0,997. Этот ответ означает, что при 100 сделках и значении статистики К-С 0,04 мы можем быть уверены на 99,7%, что фактическое распределение генерировано функцией теоретического распределения. Другими словами, мы можем быть на 99,7% уверены, что функция теоретического распределения представляет фактическое распределение. В данном случае это очень хороший уровень значимости.

Создание характеристической функции распределения

Нормальное распределение вероятности далеко не всегда является хорошей моделью распределения торговых прибылей и убытков. Более того, ни одно из распространенных распределений вероятности не является идеальной моделью. Поэтому мы должны сами создать функцию для моделирования распределения наших торговых прибылей и убытков.

Распределение изменений цены в общем случае относится к распределениям Парето (см. приложение В). Распределение торговых P&L можно считать трансформацией распределения цен. Эта трансформация является результатом торговых методов, когда трейдеры пытаются понизить свои убытки и увеличить прибыли, следовательно, распределение торговых P&L можно отнести к распределениям Парето. Однако распределение, которое мы будем изучать, не является распределением Парето. Распределение Парето, как и все другие функции распределения, моделирует определенное вероятностное явление. Оно моделирует распределение сумм независимых, идентично распределенных случайных переменных. Функция распределения, которую мы будем изучать, не моделирует конкретное вероятностное явление. Она моделирует многие унимодальные функции распределения. Поэтому она может повторить форму и плотность вероятности распределения Парето, а также любого другого унимодального распределения. Теперь мы создадим эту функцию. Для начала рассмотрим следующее уравнение:

(4.02) Y=1/(X^ 2+1)

График этого уравнения — обычная колоколообразная кривая, симметричная относительно оси Y, как показано на рисунке 4-2.

Таким образом, мы будем строить свои рассуждения, используя это общее уравнение. Переменную Х можно представить как число стандартных единиц с каждой стороны от среднего, т.е. от оси Y. Мы можем использовать первый момент этого «распределения», расположение его среднего значения, добавив значение для изменения расположения на оси X. Уравнение изменится следующим образом:

(4.03) Y=1/(X-LOC^2+1),

где Y = ордината характеристической функции;

, SKEW = 0, KURT= 2

Таким образом, если бы мы хотели изменить расположение, передвинув график влево на 0,5 единицы, мы бы установили LOC на -0.5. Этот график изображен на рисунке 4-3.

Таким же образом, если бы мы хотели сместить кривую вправо, то использовали бы положительное значение для переменной LOC. LOC с нулевым значением не будет смещать график, как показано на рисунке 4-2.

Показатель в знаменателе влияет на эксцесс. До настоящего момента эксцесс был равен 2, но мы можем изменить его, изменив значение показателя. Теперь формулу нашей характеристической функции можно записать следующим образом:

= 0, KURT = 3

KURT = переменная, задающая эксцесс, четвертый момент распределения; SCALE = переменная, задающая ширину, второй момент распределения.

Рисунки 4-6 и 4-7 иллюстрируют изменение параметра ширины. Действие этого параметра можно представить как движение горизонтальной оси вверх или вниз Когда ось сдвигается вверх (при уменьшении ширины), график расширяется (см рисунок 4-6), как будто мы смотрим на его верхнюю часть. На рисунке 4-7 показана обратная ситуация, когда горизонтальная ось сдвигается вниз и кривая распределения сжимается. Теперь у нас есть характеристическая функция распределения, с помощью которой мы контролируем три из четырех моментов распределения Сейчас распределение симметрично. Для этой функции нам необходимо добавить коэффициент асимметрии, третий момент распределения. Характеристическая функция тогда будет выглядеть следующим образом:

(4.06) Y = (1 / (ABS((X - LOC) * SCALE) Л KURT + 1)) л С,

где С = показатель асимметрии, рассчитанный следующим образом:

(4.07) С = (1 + (ABS(SKEW) Л ABS(1 / (X - LOQ) *

* sign(X) * -sign(SKEW))) л 0,5; Y = ордината характеристической функции; Х= количество стандартных отклонений;

LOC= переменная, задающая расположение среднего значения, первый момент распределения; KURT = переменная, задающая эксцесс, четвертый момент распределения;

SCALE = переменная, задающая ширину, второй момент распределения; SKEW= переменная, задающая асимметрию, третий момент распределения; sign() = функция знака, число 1 или -1. Знак Х рассчитывается как X/ ABS(X) для X, не равного 0. Если Х равно нулю, знак будет считаться положительным;

Рисунки 4-8 и 4-9 показывают действие переменной асимметрии на распределение. Отметим несколько важных особенностей параметров LOC, SCALE, SKEW и KURT. За исключением переменной LOC (которая выражена как число стандартных значений для смещения распределения), другие три

переменные являются безразмерными, то есть их значения являются числами, которые характеризуют форму распределения и относятся только к этому распределению. Значения параметров будут другими, если вы примените стандартные измерительные методы, детально описанные в разделе «Величины, описывающие распределения» главы 3. Например, если вы определите один из коэффициентов асимметрии Пирсона на наборе данных, он будет отличаться от значения переменной SKEW для распределений, рассматриваемых здесь. Значения четырех переменных уникальны для рассматриваемого распределения и имеют смысл только в данном контексте. Крайне важен интервал возможных значений этих переменных. Переменная SCALE всегда должна быть положительной, кроме того, она не ограничена сверху. То же самое верно для переменной KURT. На практике, однако, лучше использовать значения от 0,5 до 3, в крайнем случае, от 0,05 до 5.

Вы можете использовать значения и за пределами этих крайних точек при условии, что они больше нуля.

Переменная LOC может быть положительной, отрицательной или нулем. Параметр SKEW должен быть больше или равен -1, и меньше или равен +1. Когда SKEW равен +1, вся правая сторона распределения (справа от пика) равна пику. Когда SKEW равен -1, пику равна вся левая сторона распределения. Интервалы значений переменных в общем виде таковы:

- бесконечность < LOC < + бесконечность

SCALE > 0

-1<=SKEW<=+1

KURT > О

Рисунки с 4-2 по 4-9 показывают, как легко изменяется распределение. Мы можем подогнать эти четыре параметра таким образом, чтобы получившееся в результате распределение было похоже на любое другое распределение.

Подгонка параметров распределения

Как и в процедуре, описанной в главе 3, по поиску оптимального f при нормальном распределении, мы должны преобразовать необработанные торговые данные в стандартные единицы. Сначала мы вычтем среднее из каждой сделки, а затем разделим полученное значение на стандартное отклонение. Далее мы будем работать с данными в стандартных единицах. После того как мы приведем сделки к стандартным значениям, можно отсортировать их в порядке возрастания. На основе полученных данных мы сможем провести тест К-С. Нашей целью является поиск таких значений LOC, SCALE, SKEW и KURT, которые наилучшим образом подходят для фактического распределения сделок. Для определения «наилучшего приближения» мы полагаемся на тест К-С. Рассчитаем значения параметров, используя «метод грубой силы двадцатого века». Мы просчитаем каждую комбинацию для KURT от 3 до 0,5 с шагом -0,1 (мы можем также взять интервал от 0,5 до 3 с шагом 0,1, так как направление не имеет значения). Далее просчитаем каждую

Для каждой комбинации проведем тест К-С. Комбинацию, которая даст наименьшую статистику К-С, будем считать оптимальной для параметров SKALE и KURT (на данный момент). Чтобы провести тест К-С для каждой комбинации, нам необходимо как фактическое распределение, так и теоретическое распределение (определяемое параметрами тестируемого характеристического распределения). Мы уже знаем, как создать функцию распределения вероятности X/N, где N является общим числом сделок, а Х является рангом (от 1 до N) данной сделки. Теперь нам надо рассчитать ФРВ для теоретического распределения при данных значениях параметров LOC, SCALE, SKEW и KURT. У нас есть характеристическая функция регулируемого распределения, она задается уравнением (4.06). Чтобы получить ФРВ из характеристической функции, необходимо найти интеграл характеристической функции. Мы обозначаем интеграл, т.е. площадь под кривой характеристической функции в точке X, как N(X). Таким образом, так как уравнение (4.06) дает первую производную интеграла, мы обозначим уравнение (4.06) как N'(X). В большинстве случаев вы не сможете вывести интеграл функции, даже если вы опытный математик. Поэтому вместо интегрирования функции (4.06) мы будем использовать другой метод. Этот метод потребует больших усилий, но он применим к любой функции. Вероятность для любой точки на графике характеристической функции можно оценить, если распределение представить себе как последовательность узких прямоугольников. Тогда для любого данного прямоугольника в распределении вы можете рассчитать вероятность, ассоциированную с этим прямоугольником, как отношение суммы площадей всех прямоугольников слева от вашего прямоугольника (включая площадь вашего прямоугольника) к сумме площадей всех прямоугольников в распределении. Чем больше прямоугольников вы используете, тем более точными будут полученные вероятности. Если бы вы использовали бесконечное число прямоугольников, то ваш расчет был бы точным. Рассмотрим процедуру поиска площадей под кривой характеристического распределения на примере. Допустим, мы хотим найти вероятности, ассоциированные с каждым отрезком длиной 0,1 в интервале от -3 до +3 сигма. Отметьте, что в таблице (с. 183) рассмотрен интервал от -5 до +5 сигма. Дело в том, что лучше выйти на 2 сигмы за ограничительные параметры (-3 и +3 сигма в нашем случае), чтобы получить более точные результаты. Отметьте, что Х — это число стандартных единиц, на которое мы смещены от среднего значения. Далее идут значения четырех параметров. Следующий столбец — это столбец N'(X), который отражает высоту кривой в точке Х при этих значениях параметров. N'(X) рассчитывается из уравнения (4.06). Воспользуемся уравнением (4.06). Допустим, нам надо рассчитать N'(X) для Х= -3 со значениями параметров 0,02, 2,76, 0 и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Сначала рассчитаем показатель

(4.06) Y = (1 / (ABS((X - LOC) * SCALE) л KURT + 1)) л С = (1 / (ABS((-3 - 0,02) * 2,76) л 1,78 + 1)) A 1 = (1 / ((3,02 * 2,76) л 1,78 + 1)) л 1 ' = (1/ (8,3352 л 1,78+1)) А 1 = (1/(43,57431058+ 1)) л 1 = (1/44,57431058) л 1 = 0,02243444681 л 1 = 0,02243444681

Таким образом, в точке Х = -3 N'(X) = 0,02243444681 (отметьте, что мы рассчитываем значения в столбце N'(X) для каждого значения X).

Рассчитаем очередной столбец, текущую сумму N'(X), накапливающуюся с ростом X. Это сделать достаточно просто. Далее рассчитаем столбец N(X) для вероятности, ассоциированной с каждым значением Х при данных значениях параметров. Формула для расчета N(X) выглядит следующим образом:

С С-1 М

(4.12) N(C) = ]Г

где С = текущее количество точек X; М = общее количество точек X.

Уравнение (4.12) означает, что при каждом изменении Х необходимо добавить текущую сумму при данном значении Х к текущей сумме предыдущего значения X, затем разделить полученную сумму на 2. Далее полученный результат следует разделить на последнее значение в столбце текущей суммы N'(X) (накопленная сумма значений N'(X)). Это даст нам вероятность для значения Х при данных значениях параметров.

Таким образом, для Х = -3 текущая сумма N(X) = 0,302225586, а для предыдущего значения Х = -3,1 текущая сумма равна 0,2797911392. Сумма двух этих величин равна 0,5820167252. При делении на 2 мы получаем 0,2910083626. Разделив эту величину на последнее значение в столбце накопленной суммы N'(X), равное 11,8535923812, мы получаем 0,02455022522. Это и есть вероятность N(X) при стандартном значении Х = -3.

После того как мы вычислили накопленные вероятности для каждой сделки в фактическом распределении и вероятности для каждого приращения стандартного значения в нашем характеристическом распределении, мы можем осуществить тест К-С для значений параметров характеристического распределения, которые используются в настоящий момент. Однако сначала рассмотрим два важных момента.

В примере с таблицей накопленных вероятностей, показанной ранее для нашего регулируемого распределения, мы рассчитывали вероятности с приращением стандартных значений 0,1. Это было сделано для наглядности. На практике вы можете получить большую степень точности, используя меньший шаг приращения. Приращение 0,01 в большинстве случаев является вполне приемлемым.

Скажем несколько слов о том, как для регулируемого распределения выбрать ограничительные параметры, то есть количество сигма с каждой стороны от среднего. В нашем примере мы использовали 3 сигма, но в действительности следует использовать абсолютное значение самой отдаленной точки от среднего. Для нашего примера с 232 сделками крайнее левое (самое меньшее) стандартное значение составляет -2,96 стандартной единицы, а крайнее правое (самое большое) составляет 6,935321 стандартной единицы. Так как 6,93 больше, чем ABS(-2,96),

мы должны взять 6,935321. Теперь добавим еще 2 сигма к этому значению для надежности и найдем вероятности для распределения от -8,94 до +8,94 сигма. Так как нам нужна хорошая точность, мы будем использовать приращение 0,01. Рассчитаем вероятности для стандартных значений:

-8,94 -8,93

-8,92 -8,91

+8,94

Последнее, что мы должны сделать, прежде чем провести тест К-С, — это округлить фактические стандартные значения отобранных сделок с точностью 0,01 (так как мы используем 0,01 в качестве шага для теоретического распределения). Например, значение 6,935321 не будет иметь соответствующей теоретической вероятности, ассоциированной с ним, так как оно находится между значениями 6,93 и 6,94. Так как 6,94 ближе к 6,935321, мы округляем 6,935321 до 6,94. Прежде чем начать процедуру оптимизирования наших параметров регулируемого распределения путем применения теста К-С, мы должны округлить фактические отсортированные нормированные сделки в соответствии с выбранным шагом. Вместо округления стандартных значений сделок до ближайшего десятичного Х можно использовать линейную интерполяцию по таблице накопленных вероятностей, чтобы вычислить вероятности, соответствующие фактическим стандартным значениям сделок. Чтобы больше узнать о линейной интерполяции, посмотрите хорошую книгу по статистике, например «Управление деньгами на товарном рынке» Фреда Гема. Другие интересные книги указаны в списке рекомендованной литературы. До настоящего момента мы оптимизировали только параметры KURT и SCALE. Может показаться, что при нормировании данных параметр LOC должен быть приравнен к 0, а параметр SCALE — к 1. Это не совсем верно, так как реальное расположение распределения может не совпадать со средним арифметическим, а оптимальное значение ширины отличаться от единицы. Значения KURT и SCALE сильно связаны друг с другом. Таким образом, мы сначала попытаемся приблизительно определить оптимальные значения параметров KURT и SCALE. Для наших 232 сделок получаем SCALE =2,7, а KURT =1,9. Теперь попытаемся найти наиболее подходящие значения параметров. Этот процесс займет достаточно много времени, даже если у вас хороший компьютер. Мы проведем цикл, изменяя параметр LOC от 0,1 до -0,1 по -0,05, параметр SCALE от 2,6 до 2,8 по 0,05, параметр SKEW от 0,1 до -0,1 по -0,05 и параметр KURT от 1,86 до 1,92 по 0,02. Результаты этого цикла дают оптимальное (самое низкое значение статистики К-С) при LOC = О, SCALE = 2,8, SKEW =0 и KURT =1,86. Затем мы осуществим третий цикл. На этот раз будем просматривать LOC от 0,04 до -0,04 по -0,02, SCALE от 2,76 до 2,82 по 0,02, SKEW от 0,04 до -0,04 по -0,02 и KURT от 1,8 до 1,9 по 0,02. Результаты третьего цикла дают оптимальные значения LOC = 0,02, SCALE = 2,76, SKEW = 0 и KURT = 1,8. Мы нашли оптимальную окрестность, в которой параметры дают наилучшее приближение регулируемой характеристической функции к распределению реальных данных. Для последнего цикла мы будем просматривать LOC от 0 до 0,03

по 0,01, SCALE от 2,76 до 2,73 по -0,01, SKEW от 0,01 до -0,01 и KURT от 1,8 до 1,75 по -0,01. Результаты этого последнего прохода дают следующие оптимальные параметры для наших 232 сделок: LOC = 0,02, SCALE =2,76, SKEW = 0 и KURT

=1,78.

Использование параметров для поиска оптимального f

Теперь, когда найдены наиболее подходящие значения параметров распределения, рассчитаем оптимальное f для этого распределения. Мы можем применить процедуру, которая была использована в предыдущей главе для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что вероятности для каждого стандартного значения (значения X) рассчитываются с помощью уравнений (4.06) и (4.12). При нормальном распределении мы находим столбец ассоциированных вероятностей (вероятностей, соответствующих определенному стандартному значению), используя уравнение (3.21). В нашем случае, чтобы найти ассоциированные вероятности, следует выполнить процедуру, детально описанную ранее:

1. Для данного стандартного значения Х рассчитайте его соответствующее N'(X) с
помощью уравнения (4.06).

2. Для каждого стандартного значения Х рассчитайте накопленную сумму зна
чений N'(X), соответствующих всем предыдущим X.

3. Теперь, чтобы найти N(X), т.е. итоговую вероятность для данного X, прибавьте
текущую сумму, соответствующую значению X, к текущей сумме,
соответствующей предыдущему значению X. Разделите полученную величину
на 2. Затем разделите полученное частное на общую сумму всех N'(X), т.е.
последнее число в столбце текущих сумм. Это новое частное является
ассоциированной 1-хвостой вероятностью для данного X.

Так как теперь у нас есть метод поиска ассоциированных вероятностей для стандартных значений Х при данном наборе значений параметров, мы можем найти оптимальное f. Процедура в точности совпадает с той, которая применяется для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что мы рассчитываем столбец ассоциированных вероятностей другим способом. В нашем примере с 232 сделками значения параметров, которые получаются при самом низком значении статистики К-С, составляют 0,02, 2,76, О и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Мы получили эти значения параметров, используя процедуру оптимизации, описанную в данной главе. Статистика К-С == 0,0835529 (это означает, что в своей наихудшей точке два распределения удалены на 8,35529%) при уровне значимости 7,8384%. Рисунок 4-10 показывает функцию распределения для тех значений параметров, которые наилучшим образом подходят для наших 232 сделок. Если мы возьмем полученные параметры и найдем оптимальное f по этому распределению, ограничивая распределение +3 и -3 сигма, используя 100 равноотстоящих точек данных, то получим f= 0,206, или 1 контракт на каждые 23 783,17 доллара. Сравните это с эмпирическим методом, который покажет, что оптимальный рост достигается при 1 контракте на каждые 7918,04 доллара на балансе счета. Этот результат мы получаем, если ограничиваем распределение 3 сигма с каждой стороны от среднего. В действительности, в эмпирическом потоке сделок у нас был проигрыш наихудшего случая 2,96 сигма и выигрыш наилучшего случая 6,94 сигма. Теперь, если мы вернемся и ограничим распределение 2,96 сигма слева от среднего и 6,94 сигма справа (и на этот раз будем использовать 300 равноотстоящих точек данных), то получим оптимальное f = 0,954, или 1 контракт на каждые

5062,71 доллара на балансе счета. Почему оно отличается от эмпирического оптимального f= 7918,04?

Проблема состоит в «грубости» фактического распределения. Вспомните, что уровень значимости наших наилучшим образом подходящих параметров был только 7,8384%. Давайте возьмем распределение 232 сделок и поместим в 12 ячеек от -3 до +3 сигма.

Ячейки		Количество сделок
-3,0	-2,5	2
-2,5	-2,0	1
-2,0	-1,5	2
-1,5	-1,0	24
-1,0	-0,5	39
,sr„. -0,5	0,0	43
ь-'0,0	0,5	69
0,5	1,0	38
1,0	1,5	7
1,5	2,0	2
2,0	2,5	0
2,5	3,0	2

Отметьте, что на хвостах распределения находятся пробелы, т.е. области, или
ячейки, где нет эмпирических данных. Эти области сглаживаются, когда мы
приспосабливаем наше регулируемое распределение к данным, и именно эти
сглаженные области вызывают различие между параметрическим и эмпирическим
оптимальным f. Почему же наше характеристическое распределение при всех
возможностях регулировки его формы не очень хорошо приближено к
фактическому распределению? Причина состоит в том, что наблюдаемое
распределение имеет слишком много точек перегиба. Параболу можно направить
ветвями вверх или вниз. Однако вдоль всей параболы направление вогнутости или
выпуклости не изменяется. В точке перегиба направление вогнутости изменяется.

Рисунок 4-11 Точки перегиба колоколообразного распределения

так как направление вогнутости никогда не изменяется. Объект, имеющий форму буквы S, лежащий на боку, имеет одну точку перегиба, т.е. точку, где вогнутость изменяется. Рисунок 4-11 показывает нормальное распределение. Отметьте, что в колоколообразной кривой, такой как нормальное распределение, есть две точки перегиба. В зависимости от значения SCALE наше регулируемое распределение может иметь ноль точек перегиба (если SCALE очень низкое) или две точки перегиба. Причина, по которой наше регулируемое распределение не очень хорошо описывает фактическое распределение сделок, состоит в том, что реальное распределение имеет слишком много точек перегиба. Означает ли это, что полученное характеристическое распределение неверно? Скорее всего нет. При желании мы могли бы создать функцию распределения, которая имела бы больше двух точек перегиба. Такую функцию можно было бы лучше подогнать к реальному распределению. Если бы мы создали функцию распределения, которая допускает неограниченное количество точек перегиба, то мы бы точно подогнали ее к наблюдаемому распределению. Оптимальное f, полученное с помощью такой кривой, практически совпало бы с эмпирическим. Однако чем больше точек перегиба нам пришлось бы добавить к функции распределения, тем менее надежной она была бы (т.е. она хуже представляла бы будущие сделки). Мы не пытаемся в точности подогнать параметрическое ж наблюдаемому, а стараемся лишь определить, как распределяются наблюдаемые данные, чтобы можно было предсказать с большой уверенностью будущее оптимальное 1(если данные будут распределены так же, как в прошлом). В регулируемом распределении, подогнанном к реальным сделкам, удалены ложные точки перегиба. Поясним вышесказанное на примере. Предположим, мы используем доску Галтона. Мы знаем, что асимптотически распределение шариков, падающих через доску, будет нормальным. Однако мы собираемся бросить только 4 шарика. Можем ли мы ожидать, что результаты бросков 4 шариков будут распределены нормально? Как насчет 5 шариков? 50 шариков? В асимптотическом смысле мы ожидаем, что наблюдаемое распределение будет ближе к нормальному при увеличении числа сделок. Подгонка теоретического распределения к каждой точке

перегиба наблюдаемого распределения не даст нам большую степень точности в будущем. При большом количестве сделок мы можем ожидать, что наблюдаемое распределение будет сходиться с ожидаемым и многие точки перегиба будут заполнены сделками, когда их число стремится к бесконечности. Если наши теоретические параметры точно отражают распределение реальных сделок, то оптимальное f, полученное на основе теоретического распределения, при будущей последовательности сделок будет точнее, чем оптимальное f, рассчитанное эмпирически из прошлых сделок. Другими словами, если наши 232 сделки представляют распределение сделок в будущем, тогда мы можем ожидать, что распределение сделок в будущем будет ближе к нашему «настроенному» теоретическому распределению, чем к наблюдаемому, с его многочисленными точками перегиба и «зашумленностью» из-за конечного количества сделок. Таким образом, мы можем ожидать, что будущее оптимальное f будет больше похоже на оптимальное f, полученное из теоретического распределения, чем на оптимальное f, полученное эмпирически из наблюдаемого распределения.

Итак, лучше всего в этом случае использовать не эмпирическое, а параметрическое оптимальное f. Ситуация аналогична рассмотренному случаю с 20 бросками монеты в предыдущей главе. Если мы ожидаем 60% выигрышей в игре 1:1, то оптимальное f= 0,2. Однако если бы у нас были только эмпирические данные о последних 20 бросках, 11 из которых были выигрышными, наше оптимальное f составило бы 0,1. Мы исходим из того, что параметрическое оптимальное f ($5062,71 в этом случае) верно, так как оно оптимально для функции, которая «генерирует» сделки. Как и в случае только что упомянутой игры с броском монеты, мы допускаем, что оптимальное f для следующей сделки определяется параметрической генерирующей функцией, даже если параметрическое f отличается от эмпирического оптимального f.

Очевидно, что ограничительные параметры оказывают большое влияние на оптимальное f. Каким образом выбирать эти ограничительные параметры? Посмотрим, что происходит, когда мы отодвигаем верхнюю границу. Следующая таблица составлена для нижнего предела 3 сигма с использованием 100 равноотстоящих точек данных и оптимальных параметров для 232 сделок:

Верхняя граница	f	ff$
3 Sigmas	0,206	$23783,17
4 Sigmas	0,588	$8332,51
5 Sigmas	0,784	$6249,42
6 Sigmas	0,887	$5523,73
7 Sigmas	0,938	$5223,41
8 Sigmas * *	0,963 * *	$5087,81 * *
100 Sigmas	0,999	$4904,46

Отметьте, что при постоянной нижней границе, чем выше мы отодвигаем верхнюю границу, тем ближе оптимальное f к 1. Таким образом, чем больше мы отодвигаем верхнюю границу, тем ближе оптимальное f в долларах будет к нижней границе (ожидаемый проигрыш худшего случая). В том случае, когда

наша нижняя граница находится на -3 сигма, чем больше мы отодвигаем верхнюю границу, тем ближе в пределе оптимальное f в долларах будет к нижней границе, т.е. к $330,13 -(1743,23 * 3) = = -$4899,56. Посмотрите, что происходит, когда верхняя граница не меняется (3 сигма), а мы отодвигаем нижнюю границу Достаточно быстро арифметическое математическое ожидание такого процесса оказывается отрицательным. Это происходит потому, что более 50% площади под характеристической функцией находится слева от вертикальной оси. Следовательно, когда мы отодвигаем нижний ограничительный параметр, оптимальное f стремится к нулю. Теперь посмотрим, что произойдет, если мы одновременно начнем отодвигать оба ограничительных параметра. Здесь мы используем набор оптимальных параметров 0,02, 2,76, 0 и 1,78 для распределения 232 сделок и 100 равноотстоящих точек данных:

Верхняя и нижняя граница		F £$
3 Sigmas	0,206	$23783,17
4 Sigmas	0,158	$42 040,42
5 Sigmas	0,126	$66 550,75
6 Sigmas	0,104	$97 387,87
*	*	*
	*
*		*
100 Sigmas	0,053	$322625,17

Отметьте, что оптимальное f приближается к 0, когда мы отодвигаем оба ограничительных параметра. Более того, так как проигрыш наихудшего случая увеличивается и делится на все меньшее оптимальное f, наше f$, т.е. сумма финансирования 1 единицы, также приближается к бесконечности.

Проблему наилучшего выбора ограничительных параметров можно сформулировать в виде вопроса: где могут произойти в будущем наилучшие и наихудшие сделки (когда мы будем торговать в этой рыночной системе)? Хвосты распределения в действительности стремятся к плюс и минус бесконечности, и нам следует финансировать каждый контракт на бесконечно большую сумму (как в последнем примере, где мы раздвигали обе границы). Конечно, если мы собираемся торговать бесконечно долгое время, наше оптимальное f в долларах будет бесконечно большим. Но мы не собираемся торговать в этой рыночной системе вечно. Оптимальное f, при котором мы собираемся торговать в этой рыночной системе, является функцией предполагаемых наилучших и наихудших сделок. Вспомните, если мы бросим монету 100 раз и запишем, какой будет самая длинная полоса решек подряд, а затем бросим монету еще 100 раз, то полоса решек после 200 бросков будет скорее всего больше, чем после 100 бросков. Таким же образом, если проигрыш наихудшего случая за нашу историю 232 сделок равнялся 2,96 сигма (для удобства возьмем 3 сигма), тогда в будущем мы должны ожидать проигрыш больше 3 сигма. Поэтому вместо того, чтобы ограничить наше распределение прошлой историей сделок (-2,96 и +6,94 сигма), мы ограничим его -4 и +6,94 сигма. Нам, вероятно, следует ожидать, что в будущем именно верхняя, а не нижняя граница будет нарушена. Однако это обстоятельство мы не будем принимать в расчет по нескольким причинам. Первая состоит в том, что торговые системы в будущем ухудшают свою результативность по сравнению с работой на исторических данных, даже если они не используют оптимизируемых параметров. Все сводится к принципу, что эффективность механических торговых систем постепенно снижается. Во-вторых, тот факт, что мы платим меньшую цену за

ошибку в оптимальном f при смещении влево, а не вправо от пика кривой f, предполагает, что следует быть более консервативными в прогнозах на будущее. Мы будем рассчитывать параметрическое оптимальное f при ограничительных параметрах -4 и +6,94 сигма, используя 300 равноотстоящих точек данных. Однако при расчете вероятностей для каждой из 300 равноотстоящих ячеек данных важно, чтобы мы рассмотрели распределение на 2 сигмы до и после выбранных ограничительных параметров. Поэтому мы будем определять ассоциированные вероятности, используя ячейки в интервале от -6 до +8,94 сигма, даже если реальный интервал -4 — +6,94 сигма. Таким образом, мы увеличим точность результатов. Использование оптимальных параметров 0,02, 2,76, 0 и 1,78 теперь даст нам оптимальное f =0,837, или 1 контракт на каждые 7936,41 доллара. Пока ограничительные параметры не нарушаются, наша модель точна для выбранных границ. Пока мы не ожидаем проигрыша больше 4 сигма ($330,13 -(1743,23 * 4) =-$6642,79) или прибыли больше 6,94 сигма ($330,13 + + (1743,23 * 6,94) = $12 428,15), можно считать, что границы распределения будущих сделок выбраны точно. Возможное расхождение между созданной моделью и реальным распределением является слабым местом такого подхода, то есть оптимальное f, полученное из модели, не обязательно будет оптимальным. Если наши выбранные параметры будут нарушены в будущем, f может перестать быть оптимальным. Этот недостаток можно устранить с помощью опционов, которые позволяют ограничить возможный проигрыш заданной суммой. Коль скоро мы обсуждаем слабость данного метода, необходимо указать на последний его недостаток. Следует иметь в виду, что реальное распределение торговых прибылей и убытков является распределением, где параметры постоянно изменяются, хотя и медленно. Следует периодически повторять настройку по торговым прибылям и убыткам рыночной системы, чтобы отслеживать эту динамику.

Проведение тестов «что если»

После того как найдено параметрическое оптимальное f, можно реализовывать сценарии «что если» с помощью полученной функции распределения. Для этого нужно варьировать параметры функции распределения LOC, SCALE, SKEW и KURT для моделирования различных ожидаемых результатов (различных распределений, которые могут быть в будущем). Мы знаем, как применять процедуру растяжения и сжатия в нормальном распределении, и похожим образом можем работать с параметрами LOC, SCALE, SKEW и KURT регулируемого распределения.

Рисунок 4-12 Изменение параметра расположения распределения

Сценарии «что если» при параметрическом подходе помогают смоделировать изменения фактического распределения торговых P&L. Параметрические методы позволяют увидеть воздействие изменений на распределение фактических торговых прибылей и убытков до того, как они произойдут.

Когда вы работаете с параметрами, следует помнить о важной детали. При поиске оптимального f вместо того, чтобы изменять LOC, т.е. расположение распределения, лучше изменять долларовую арифметическую среднюю сделку, используемую в качестве входного данного. Это видно из рисунка 4-12. Отметьте (см. рисунок 4-12), что изменение параметра расположения LOC передвигает распределение вправо или влево в «окне» ограничительных параметров, но сами ограничительные параметры при этом не двигаются. Таким образом, изменение параметра LOC также затрагивает количество равноотстоящих точек данных слева и справа от моды распределения. Если изменить фактическое среднее арифметическое (или использовать переменную сжатия при поиске f в нормальном распределении), «окно» ограничительных параметров передвинется. Когда вы изменяете арифметическую среднюю сделку или изменяете переменную сжатия в механизме нормального распределения, у вас остается то же число равноотстоящих точек данных справа и слева от моды распределения.

Приведение f к текущим ценам

В методе, описанном в этой главе, были использованы неприведенные данные. Мы можем использовать тот же подход для приведенных данных. Если необходимо определить приведенное параметрическое оптимальное f, то следует преобразовать необработанные торговые прибыли и убытки в процентные повышения и понижения, основываясь на уравнениях с (2.10а) по (2.10в). Затем надо преобразовать полученные процентные прибыли и убытки, умножив их на текущую цену базового инструмента. Например, P&L номер 1 составляет 0,18. Допустим, что цена входа в этой сделке равна 100,50, тогда процентное повышение для этой сделки равно 0,18/100,50=0,001791044776. Теперь допустим, что текущая цена базового инструмента равна 112,00. Умножив 0,001791044776 на 112,00, получим приведенное значение P&L, равное 0,2005970149. Если мы хотим

использовать приведенные данные, то следует провести аналогичную операцию со всеми 232 торговыми прибылями и убытками. Затем следует рассчитать среднее арифметическое и стандартное отклонение по приведенным сделкам и использовать уравнение (3.16) для нормирования данных. Далее необходимо найти набор оптимальных параметров LOC, SCALE, SKEW и KURT по приведенным данным так же, как было показано в этой главе для неприведенных данных. Процедура определения оптимального f, среднего геометрического и TWR аналогична уже рассмотренной нами. Побочные продукты: средняя геометрическая сделка, средняя арифметическая сделка и порог геометрической торговли — действительны только для текущей цены базового инструмента. Если цена базового инструмента изменится, расчет следует повторить, вернувшись к первому шагу, умножив процентные прибыли и убытки на новую цену базового инструмента. Когда вы перейдете к этой процедуре с другой ценой базового инструмента, то получите такое же оптимальное f, среднее геометрическое и TWR. Однако средняя арифметическая сделка, средняя геометрическая сделка и порог геометрической торговли будут другими в зависимости от новой цены базового инструмента.

Количество контрактов для торговли, определяемое уравнением (3.34), также должно измениться. Ассоциированное P&L наихудшего случая (переменная W из уравнения (3.35)) будет другим в уравнении (3.34) в результате изменений, вызванных приведением данных к другой текущей цене.

Оптимальное F для других распределений и настраиваемых кривых

Существует много других способов, с помощью которых можно определить параметрическое оптимальное f. В предыдущей главе мы рассмотрели процедуру поиска оптимального f для нормально распределенных данных. Итак, у нас есть процедура, которая дает оптимальное f для любого нормально распределенного явления. Та же процедура используется для поиска оптимального/в любом распределении, если существует функция распределения (подобные функции описаны для многих других распространенных распределений в приложении В). Когда функции распределения не существует (т.е. когда функция плотности вероятности не интегрируется), оптимальное f можно найти с помощью численного метода, описанного в этой главе, приблизительно рассчитав функцию распределения.

Данная глава посвящена моделированию фактического распределения сделок с помощью регулируемого распределения, то есть поиску функции и ее подходящих параметров, которые моделируют фактическую функцию плотности вероятности торговых P&L с двумя точками перегиба. Вы можете использовать уже известные функции и методы, например, полиномиальную интерполяцию или экстраполяцию, интерполяцию и экстраполяцию рациональной функции (частные многочленов), или использовать сплайн-интерполяцию. После того как теоретическая функция найдена, можно определить ассоциированные вероятности тем же методом расчета интеграла, который использовался при поиске ассоциированных вероятностей регулируемого распределения, или рассчитать интеграл с помощью методов математического анализа. Одна из целей этой книги — позволить трейдерам, использующим немеханические системы, применять те же методы управления счетом, что и трейдерам, использующим механические системы. Регулируемое распределение требует расчета параметров, они относятся к первым четырем моментам распределения. Именно эти моменты — расположение, масштаб, асимметрия и эксцесс — описывают распределение. Таким образом, кто-либо, торгующий по немеханическому методу, например по волнам Эллиотта,

может рассчитать параметры и получить оптимальное f и побочные продукты. Наличие прошлой истории сделок не является необходимым условием для расчета данных параметров. Если бы вы использовали другие упомянутые выше методы подгонки, вам также не обязательно было бы знать исторические данные, но значения параметров такой подгонки не обязательно относились бы к моментам распределения. Эти методы могут лишить вас возможности посмотреть, что произойдет, если увеличится эксцесс или изменится асимметрия, изменится масштаб и т.д. Наше регулируемое распределение является логичным выбором теоретической функции, которая хорошо описывает фактическое распределение, так как параметры не только задают моменты распределения, они дают нам контроль над этими моментами при прогнозировании будущих изменений в распределении. Более того, рассчитать параметры рассматриваемого здесь регулируемого распределения легче, чем подогнать какую-либо произвольную функцию.

Планирование сценария

Специалисты, которые в силу своей профессии занимаются прогнозированием (экономисты, аналитики фондового рынка, метеорологи, правительственные чиновники и т.д.), довольно часто ошибаются, но надо признать, что большинство решений, которые человек должен принять в жизни, обычно требуют прогноза.

Здесь есть две ловушки. Во-первых, люди делают слишком оптимистичные предположения о будущем. Большинство из нас уверены, что в этом месяце мы скорее выиграем в лотерею, чем погибнем в автокатастрофе, даже если вероятность последнего выше. Это верно не только на уровне отдельного лица, но и на уровне группы. Когда люди работают вместе, они стремятся видеть благоприятный результат как наиболее вероятный результат (иначе не было бы смысла работать, пока, конечно, все мы не стали автоматами, безрассудно надрывающимися на «тонущих кораблях»).

Вторая и более пагубная ловушка состоит в том, что мы делаем прямые прогнозы, например пытаемся предсказать цену галлона бензина через два года или пытаемся предсказать, что произойдет с нашей карьерой, кто будет следующим президентом, каким будет следующий стиль, и так далее. Что бы мы ни говорили о будущем, мы стремимся думать о единственном, наиболее вероятном результате. Таким образом, когда необходимо принять решение или самостоятельно, или коллективно, мы принимаем его, основываясь на том, что прогноз есть единственный наиболее вероятный результат. В итоге, мы часто получаем неприятные сюрпризы.

Планирование сценария отчасти решает эту проблему. Сценарий просто является возможным прогнозом, одним из путей, по которому могут развиваться события. Планирование сценария предполагает набор сценариев для покрытия возможного спектра исходов. Конечно, полный спектр никогда не будет получен, но вы можете рассмотреть столько сценариев, сколько сочтете нужным. Таким образом, в противоположность прямому прогнозу наиболее вероятного результата вы можете подготовиться к будущему. Более того, планирование сценария подготовит вас к тому, что может быть в противном случае неожиданным событием.

Допустим, вы занимаетесь долгосрочным планированием для компании, которая производит некий продукт. Вместо того, чтобы сделать один наиболее вероятный прямой прогноз, используйте метод планирования сценария. Методом «мозгового штурма» вместе с коллегами определите возможные пути развития событий. Что будет, если вы не сможете получить достаточно сырья, чтобы произвести этот продукт? Как изменится ситуация, если один из ваших

конкурентов обанкротится? Как будут развиваться события, если на рынке появится новый конкурент? Что произойдет, если вы серьезно недооцените спрос на этот продукт? Что будет, если где-либо начнется война? А если начнется ядерная война? Так как каждый сценарий возможен, его нужно рассматривать серьезно. Теперь надо понять, что вы будете делать после того, как определите эти сценарии. Вы должны определить цель, которую хотите достичь при том или ином сценарии. В зависимости от сценария цель не обязательно должна быть положительной. Например, при пессимистическом сценарии это могут быть просто ремонтно-восстановительные работы на предприятии. После того как вы определите цель для данного сценария, надо составить план на случай непредвиденных ситуаций, относящихся к этому сценарию, для достижения необходимой цели. Например, как уже было сказано, при невероятно мрачном сценарии вашей целью могут быть ремонтно-восстановительные работы, и вам надо иметь план, чтобы минимизировать ущерб. Помимо всего прочего, планирование сценария даст вам алгоритм, которому надо следовать, если определенный сценарий реализуется. Существует тесная связь между планированием сценария и оптимальным f. Оптимальное f позволяет разместить оптимальное количество ресурсов при определенном наборе возможных сценариев. На самом деле, реализуется только один сценарий, даже если мы планируем их несколько. Планирование сценария ставит нас в ситуацию, когда необходимо принять решение, какое количество ресурсов размещать сегодня при возможных сценариях на завтра. Эта количественная оценка последствий — поистине «сердце» планирования сценария.

Чтобы определить, сколько ресурсов разместить при наличии определенного набора сценариев, мы можем использовать еще один параметрический метод поиска оптимального f. Сначала следует описать каждый сценарий. Далее мы должны оценить вероятность (это число между 0 и 1) реализации каждого сценария. Сценарии с вероятностью 0 мы не будем рассматривать. Отметьте, что вероятность каждого сценария уникальна. Допустим, вы принимаете решения в производственной корпорации АБВ. Два сценария (из нескольких) выглядят следующим образом. При одном сценарии корпорация АБВ подает документы на банкротство с вероятностью 0,15, в другом сценарии АБВ уходит с рынка из-за напряженной конкуренции с иностранными корпорациями с вероятностью 0,07. Теперь мы должны понять, включает ли первый сценарий заявление о банкротстве из-за второго сценария, т.е. напряженной конкуренции. Если это так. то вероятность первого сценария не учитывает вероятность второго сценария, и мы должны уменьшить вероятность первого сценария до 0,08 (0,15 — 0,07). Отметьте также, что уникальность вероятности важна для каждого сценария, чтобы сумма вероятностей всех рассматриваемых сценариев была равна в точности 1, а не 1,01 или 0,99.

Для каждого сценария мы определяем вероятность его осуществления. Следует также определить конечный результат, то есть численное значение. Оно может быть в долларах или лотах — в чем угодно. Однако ваши выходные данные должны быть в тех же единицах, что и входные данные. Чтобы использовать этот метод, вы должны обязательно иметь, по крайней мере, один сценарий с отрицательным результатом. Если вы хотите знать размер ресурса, который следует разместить сегодня при возможных сценариях на завтра, и не имеете отрицательного сценария, тогда следует разместить 100% этого ресурса. Без сценария с отрицательным результатом маловероятно, что данный набор сценариев реалистичен.

Последнее условие использования этого метода состоит в том, что математическое ожидание, сумма всех результатов, умноженных на их соответствующие вероятности, должно быть больше нуля.

1>(

(1.03) МО=^(Р.*А),

где Р = вероятность сценария i; А = результат сценария i;

N == общее число рассматриваемых сценариев.

Если математическое ожидание равно нулю или отрицательное, метод нельзя использовать. Это не означает, что нельзя использовать само планирование сценария. Можно и нужно. Однако оптимальное f может быть получено только в том случае, если математическое ожидание больше нуля. Когда математическое ожидание равно нулю или отрицательное, мы не должны размещать ресурсы.

И наконец, вы должны рассмотреть максимально возможный спектр результатов. Другими словами, следует рассмотреть 99% возможных исходов. Многие сценарии можно сделать шире, так что вам не надо будет расписывать 10 000 сценариев, чтобы охватить 99% спектра. При расширении сценариев не следует слишком упрощать ситуацию, выбрав только три сценария: оптимистический, пессимистический и нейтральный. В этом случае полученные ответы будут слишком грубы, чтобы иметь какую-либо практическую ценность. Захотите ли вы искать оптимальное f для торговой системы по трем сделкам?

Какое количество сценариев оптимально? Используйте то количество, с которым вы справитесь. Здесь хорошим помощником будет компьютер. Допустим, речь идет о компании АБВ и о размещении ее нового продукта на рынке отсталой далекой страны. Рассмотрим пять возможных сценариев (в действительности сценариев должно быть больше, но мы возьмем пять для примера). Эти пять сценариев отражают то, что может произойти в данной стране в будущем, — то есть вероятность определенных событий и прибыль или убыток от инвестирования.

Сценарий	Вероятность	Результат
Война	0,1	-$500 000
Кризис	0,2	-$200 000
Застой	0,2	0
Мир	0,45	$500 000
Процветание	0,05	$1000000
	Сумма 1,00

Таким образом, сумма вероятностей равна 1. Обратите внимание, что у нас есть 1 сценарий с отрицательным результатом, но математическое ожидание больше нуля:

(0,1 * -$500 000) + (0,2 * -$200 000) +... = $185 000

С таким набором сценариев мы можем использовать данный метод. Отметьте, что

если бы мы использовали метод наиболее вероятного результата, то пришли бы к

заключению, что в этой стране скорее всего будет мир, и действовали бы, исходя

из этой единственной возможности, только расплывчато осознавая наличие других

исходов.

Рассчитаем оптимальное f. Как мы уже знаем, оптимальное f (это число между О и

1) максимизирует среднее геометрическое:

TWR, полученное из уравнения (4.14), является промежуточным значением для расчета среднего геометрического. После того как мы найдем среднее геометрическое, фактическое TWR можно получить с помощью уравнения (4.17). Мы можем произвести расчеты по этим уравнениям следующим образом. Сначала выберем схему оптимизации, то есть способ поиска f, максимизирующего уравнение. Можно сделать это с помощью подбора Ют 0,01 до 1, используя метол итераций или параболическую интерполяцию. Затем мы должны определить наихудший возможный результат для всех рассматриваемых сценариев независимо от того, насколько малы вероятности подобных сценариев. В примере с корпорацией АБВ наихудшие ожидаемые потери — это -500 000 долларов. Теперь для каждого сценария мы должны сначала разделить наихудший возможный результат на отрицательное f. В примере с корпорацией АБВ мы собираемся просмотреть значения Ют 0,01 до 1. Начнем со значения f=0,01. Теперь, если мы разделим наихудший возможный результат рассматриваемых сценариев на отрицательное значение f, то получим:

-$500 000 / -0,01 = $50 000 000

Для каждого сценария разделим его результат на полученное только что значение. Так как исход первого сценария является наихудшим с убытком 500 000 долларов, то:

-$500 000 / $50 000 000 = -0,01 Теперь прибавим это значение к 1:

1 + (-0,01) = 0,99

Наконец, возведем полученный ответ в степень вероятности осуществления данного сценария (в нашем примере 0,1):

0,99^0,1=0,9989954713

Затем перейдем к следующему сценарию под названием «Кризис» с вероятностью 0,2 проигрыша 200 000 долларов. Наш результат наихудшего случая все еще -$500

000. Значение f, с которым мы работаем, по-прежнему 0,01, поэтому число, на которое надо разделить результат этого сценария, составляет 50 000 000 долларов: -$200 000/$50 000 000 = -0,004

Проведем дальнейшие вычисления для получения HPR: 1 + (-0,004) = 0,996 0,99^0,2 = 0,9991987169

Если мы рассмотрим остальные сценарии при тестируемом значении f=0,01, то найдем три значения HPR, соответствующие последним 3 сценариям:

Застой 1,0

Мир 1,004487689

Процветание 1,000990622

После того как найдены все HPR для данного значения f, необходимо перемножить полученные HPR:

0,9989954713*0,9991987169*1,0*1,004487689*1,000990622=1,003667853

Мы получили промежуточное TWR = 1,003667853. Следующим шагом будет возведение этого значения в степень, равную единице, деленной на сумму вероятностей. Так как сумма вероятностей составляет 1, то, чтобы получить среднее геометрическое, TWR возведем в степень 1. Таким образом, среднее геометрическое равно в этом случае TWR, то есть 1,003667853. Если, однако, убрать ограничение. что каждый сценарий должен иметь уникальную вероятность, то можно получить сумму вероятностей больше 1. В таком случае, чтобы получить среднее геометрическое, надо возвести TWR в степень, равную единице, деленной на эту сумму вероятностей.

Ответ, полученный в нашем примере, является средним геометрическим, соответствующим значению f= 0,01. Теперь перейдем к значению f= 0,02 и повторим весь процесс, пока не найдем среднее геометрическое, соответствующее этому f. Мы будем продолжать, пока не дойдем до такого значения f, которое даст наивысшее среднее геометрическое.

В нашем примере наивысшее среднее геометрическое достигается при f=0,57 и равно 1,1106. Разделив возможный результат наихудшего сценария (-$500 000) на отрицательное оптимальное f, мы получим 877 192,35 доллара. Другими словами, если корпорации АБВ надо разместить на рынке новый продукт в этой далекой стране, следует инвестировать именно эту сумму. С течением времени и развитием событий, когда изменятся возможные исходы и вероятности, изменится также и сумма f. Чем чаще корпорация АБВ будет учитывать эти изменения, тем более правильными будут ее решения. Отметьте. что если корпорация АБВ инвестирует в этот проект меньше 877 192,35 доллара. тогда она находится левее пика кривой f. Это аналогично ситуации, когда у трейдера открыто слишком мало контрактов (по сравнению с оптимальным f). Если корпорация АБВ вкладывает в проект большую сумму, это аналогично ситуации, когда у трейдера открыто слишком много позиций.

Количество, рассмотренное здесь, является количеством денег, но это могут быть не только деньги, и метод будет работать. Данный подход можно использовать для любого количественного решения в среде благоприятной неопределенности .

Если вы создадите различные сценарии для фондового рынка, оптимальное f. полученное с помощью этого метода, даст вам процент средств, которые надо в

данный момент инвестировать в акции. Например, если f= 0,65, то 65% вашего баланса должно быть на рынке, а оставшиеся 35%, например, в деньгах. Этот подход даст вам наибольший геометрический рост капитала. Конечно, результат будет зависеть от того, какие входные данные вы использовали в системе (сценарии. их вероятности осуществления, выигрыши и проигрыши, издержки). Все сказанное ранее об оптимальном f применимо здесь, и это означает также, что ожидаемые проигрыши могут достигать 100%. Если вы осуществляете планирование сценария для размещения активов, то должны ожидать, что около 100% активов, размещенных в соответствии с рассматриваемым сценарием, могут быть потеряны в какое-либо время в будущем. Например, вы используете данный метод, чтобы определить сумму средств, предназначенных для инвестирования в акции. Допустим, вы приходите к выводу, что 65% средств должно быть инвестировано в акции, а оставшиеся 35% в безрисковые активы. Следует ожидать, что проигрыш в будущем может достичь 100% суммы, размещенной на фондовом рынке. Другими словами, вы должны быть готовы, что в какой-либо точке в будущем почти 100% активов от ваших 65%, размещенных в акции, будут проиграны. Однако именно таким образом вы достигнете максимального геометрического роста. Ту же процедуру можно использовать для альтернативного параметрического метода определения оптимального f в торговле. Допустим, вы принимаете торговые решения, основываясь на фундаментальных данных. Вы намечаете различные сценарии, которые могут произойти в процессе торговли. Чем больше сценариев и чем точнее сценарии, тем лучше будут полученные результаты. Предположим, вы решили купить муниципальные облигации, но при этом не планируете удерживать их до срока погашения. Вы можете рассмотреть множество сценариев будущих событий и использовать эти сценарии для определения оптимального размера инвестиций.

Концепцию планирования сценария для определения оптимального f можно использовать во многих областях: от военных стратегий до определения оптимального уровня участия в подписке на акции или оптимальной предоплаты за дом. Этот метод, вероятно, является лучшим и уже точно самым легким для тех, кто не использует механические решения при входе и выходе с рынка. Трейдеры, которые торгуют по фундаментальным данным, графикам, волнам Эллиотта или с помощью любого другого метода, требующего субъективного суждения, могут найти оптимальные f с помощью этого подхода — он намного проще, чем поиск значений параметров распределения. Арифметическое среднее HPR группы сценариев можно рассчитать следующим образом:

(4.18) AHPR= (Ё (1 + (A/ (W/ -f))) *

где N = число сценариев;

А = результат (выигрыш или проигрыш) сценария i;

Р = вероятность сценария i;

W= наихудший результат среди всех сценариев.

AHPR будет важно позднее, при поиске эффективной границы совокупности нескольких рыночных систем, когда необходимо будет определить ожидаемую прибыль (арифметическую) данной рыночной системы. Эта ожидаемая прибыль равна AHPR-1. Рассмотренный метод не обязательно должен быть основан на параметрическом подходе. Возможен и эмпирический подход. Другими словами, мы можем взять отчет о сделках данной рыночной системы и использовать

каждую из этих сделок в качестве сценария, который может произойти в будущем. Величина прибыли или убытка будет выходным результатом данного сценария. В этом случае каждый сценарий (сделка) имеет равную вероятность осуществления — 1/N, где N — общее число сделок (сценариев). В результате мы получим эмпирическое оптимальное f. Когда есть несколько решений на основе нескольких сценариев, выбор того. чье среднее геометрическое, соответствующее оптимальному f, самое большое. максимизирует решение в асимптотическом смысле. Зачастую это будет происходить вопреки общепринятым правилам принятия решения, таким как Правило Гурвица, максимакс, минимакс, минимаксная потеря (minimax regret) и наивысшее математическое ожидание. Предположим, мы должны выбрать одно их двух возможных решений, которые назовем «белым» и «черным». Белое решение представляет следующие возможные сценарии:

Белое решение

Сценарий	Вероятность	Результат
А	0,3	-20
В	0,4	0
С	0,3	30
Математическое ожидание = $3,00
Оптимальное f	= 0, 17
Среднее геометрическое = 1,0123

Черное решение представляет следующие сценарии:

Черное решение
Сценарий	Вероятность	Результат
А	0,3	-10
В	0,4	5
С	0,15	6
D	0,15	20

Математическое ожидание = $2,90

Оптимальное f=0,31

Среднее геометрическое = 1,0453

Многие выбрали бы белое решение, так как оно имеет большее математическое ожидание. При белом решении вы можете ожидать «в среднем» выигрыш в 3 доллара против выигрыша черного решения в 2,90 доллара. Однако выбор черного решения будет более правильным, так как оно дает наибольшее среднее геометрическое. При черном решении можно ожидать «в среднем» выигрыш в 4,53% (1,0453 - 1) против выигрыша белого решения в 1,23%. При реинвестировании черное решение, в среднем, выиграет в три раза больше, чем белое решение! Вы можете возразить, отметив, что мы не реинвестируем по тому же сценарию каждый раз, и можно добиться большего, если всегда выбирать наивысшее арифметическое математическое ожидание для каждого представленного набора. Мы будем принимать решение, основываясь на большем арифметическом математическом ожидании, только в том случае, если не

Теперь мы рассмотрим поиск оптимального f и его побочных продуктов по ячеистым данным. Этот подход также является гибридом параметрического и эмпирического метода и аналогичен процессу поиска оптимального f по различным сценариям; только на этот раз мы будем использовать среднюю точку ячейки. Для каждой ячейки у нас будет ассоциированная вероятность, рассчитанная как общее число элементов (сделок) в этой ячейке, деленное на общее число элементов (сделок) во всех ячейках. Для каждой ячейки у нас будет ассоциированный результат, рассчитанный по центральной точке ячейки. Например, у нас есть 3 ячейки и 10 сделок. Первую ячейку мы определим для P&L от -1000 долларов до -100 долларов. В этой ячейке будет два элемента. Следующая ячейка предназначена для сделок от -100 до 100 долларов, она вмещает 5 сделок. Наконец, в третью ячейку попадут 3 сделки, которые имеют P&L от 100 до 1000 долларов.

Ячейка	Ячейка	Сделки	Ассоциированная	Ассоциированный
			вероятность	результат
-1000	-100	2	0,2	-550
-100	100	5	0,5	0
100	1000	3	0,3	550

Теперь нам нужно решить уравнение (4.16), где каждая ячейка представляет отдельный сценарий. Таким образом, для случая с 3 ячейками оптимальное f составляет 0,2, или 1 контракт на каждые 2750 долларов на счете (наш проигрыш наихудшего случая будет средней точкой первой ячейки, или (-$1000 + -$100) / /2 =-$550). Этот метод можно использовать в реальной торговле, хотя он и недостаточно точен, поскольку допускает, что наибольший проигрыш находится в середине наихудшей ячейки, а это не совсем верно. Часто полезно иметь одну лишнюю ячейку, чтобы включить проигрыш наихудшего случая. Допустим, как и в примере с 3 ячейками, у нас была сделка с проигрышем в 1000 долларов. Такая сделка попадает в ячейку -1000 до -100 долларов и поэтому будет записана как 550 долларов (средняя точка ячейки), но мы можем разместить в ячейки те же данные следующим образом:

Ячейка	Ячейка	Сделки	Ассоциированная вероятность	Ассоциированный результат
-1000	-1000	1	0,1	-1000
-999	-100	1	0,1	-550
-100	100	5	0,5	0
100	1000	3	0,3	550

Теперь оптимальное f составляет 0,04, или 1 контракт на каждые 25 000 долларов на счете. Вы видите, насколько приблизителен этот метод? Поэтому, хотя этот метод даст нам оптимальное f для ячеистых данных, надо понимать, что потеря информации при размещении данных в ячейки может сделать результаты настолько неточными, что они станут бесполезными. Если бы у нас было больше точек данных и больше ячеек, метод был бы намного точнее. Фактически, если бы у нас было бесконечное количество данных и бесконечное число ячеек, метод был бы абсолютно точным (если бы данные в каждой из ячеек были равны средним

точкам соответствующих ячеек, то этот метод также был бы точным). Другой недостаток предлагаемого метода заключается в том, что среднее значение ячейки не обязательно расположено в центре ячейки. В реальности среднее значение элементов в ячейке будет ближе к моде всего распределения, чем к средней точке ячейки. Следовательно, полученная дисперсия будет больше, чем есть на самом деле. Существуют способы корректировки, но и они могут быть неточными. Проблему можно было бы преодолеть, и результаты были бы точными при бесконечном количестве элементов (сделок) и бесконечном количестве ячеек. Если у вас есть достаточно большое количество сделок и достаточно большое количество ячеек, вы можете использовать этот метод с большей уверенностью. Вы также можете провести тесты «что если», изменяя число элементов в различных ячейках, чтобы получить более точное приближение.

Какое оптимальное f лучше?

Мы знаем, что можно найти оптимальное f, используя эмпирический подход, а также используя некоторые параметрические методы как для ячеистых, так и для неячеистых данных. Мы также знаем, что можно привести данные к текущей цене. Какое оптимальное f действительно оптимально — полученное по приведенным или неприведенным данным?

Неприведенное эмпирическое оптимальное f рассчитывается на прошлых данных. Эмпирический метод для нахождения оптимального f, описанный в главе 1, даст оптимальное f, которое реализовало бы наивысший геометрический рост по прошлому потоку результатов. Однако нам надо определить, какое значение оптимального f использовать в будущем (особенно в следующей сделке), учитывая, что у нас нет достоверной информации об исходе следующей сделки. Мы точно не знаем, будет это прибыль (тогда оптимальное f будет 1) или убыток (тогда оптимальное f будет 0). Мы можем выразить результат следующей сделки только распределением вероятности. Лучшим подходом для трейдеров, применяющих механическую систему, будет расчет f путем использования параметрического метода с помощью регулируемой функции распределения, описанной в этой главе, с приведенными или неприведенными данными. Если есть значительное различие в использовании приведенных данных по сравнению с неприведенными, тогда, вероятно, расчеты сделаны по слишком большой истории сделок, или же данных на уровне текущих цен недостаточно. Для несистемных трейдеров лучшим может оказаться подход планирования сценария.

Теперь вы имеете представление как об эмпирических, так и параметрических методах, а также о некоторых гибридных методах поиска оптимального f. В следующей главе мы рассмотрим проблему поиска оптимального f (параметрическим способом) для случая, когда одновременно открыто несколько позиций.

1 2 3 4 5 6 7 8 9 Наверх ↑