2.6. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО ОБЪЕМА ПРОИЗВОДСТВА ШВЕЙНОГО ПРЕДПРИЯТИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

2.6.1. Верхняя и нижняя цена игры

Рассмотрим платежную матрицу игры Е = |еу ||, раскрытую в

виде (2.2.1). Здесь /-я строка соответствует А,-й стратегии игрока A,j-й столбец соответствует Bf й стратегии игрока В.

Пусть игрок А выбирает некоторую стратегию А „ тогда, в наи­худшем случае (например, если выбор станет известен игроку В), он получат выигрыш равцый minp,-,. Предвидя эту возможность,

игрок А должен выбрать такую стратегию, чтобы максимизиро­вать свой минимальный в каждой стратегии выигрыш а. Таким образом,

а = шах min or,-..                                                                  (2.6.1)

' i

Величина а называется нижней ценой игры (а — это гаранти­рованный выигрыш игрока А). Очевидно а находится в одной из

91

 

строк матрицы Е, пусть в 1а, тогда стратегия А10 называется мак- симинной.

Итак, если игрок А будет придерживаться максиминной стра­тегии, то ему при любом поведении игрока В гарантирован выиг­рыш, во всяком случае не меньший а.

(2.6.2)

С другой стороны, противник — игрок В, заинтересован в том, чтобы обратить выигрыш игрока А в минимум, поэтому он дол­жен пересмотреть каждую свою стратегию с точки зрения макси­мального выигрыша игроком А при этой стратегии. Другими сло­вами, при выборе некоторой стратегии В, он должен исходить из максимального проигрыша в этой стратегии, равного тахау, и найти такую стратегию, при которой этот проигрыш буДет наи­меньшим, то есть не более, чем

Р = гат шах а, ] <

Величина /3 называется верхней ценой игры, а соответствую­щая ему стратегия В]0 — минимаксной.

Принцип осторожности, диктующий игрокам выбор страте­гий максиминной ими минимаксной соответственно, в теории игр именуют принципом «минимакса», а сами стратегии максимин- ные и минимаксные — общим термином «минимаксные страте­гии».

(2.6.3)

Вполне определенной игрой или игрой с седловой точкой на­зывается игра, у которой совпадают нижняя и верхняя цены игры, то есть выполняется равенство:

а = шах тт ау = тш шах = ац = (3

/ 1 " 1

При этом V = а = /3 называется ценой игры, а элемент а,0у0, соответствующий равенству, называется седловой точкой.

Простота решения игры с седловой точкой заключается в том, что оптимальные стратегии обоих игроков находятся сразу. Для игрока А это стратегия А, для игрока В — В р. Причем, такое решение обладает свойством устойчивости в том смысле, что, если один из игроков применяет свою оптимальную стратегию, то лю­бое отклонение другого игрока от оптимальной стратегии может оказаться не выгодным для него.

 

Действительно, пусть игрок А выбрал оптимальную страте­гию А,о, соответствующую а = max min ау = а^, то есть игрок/4

обеспечивает себе выигрыш, равный одному из элементов i0 стро­ки, причем, элемент в jo столбце наименьший среди них (aj0j>ai0j0, j Ф jo)- и если игрок В выберет j- Ю стратегию отличную ОТ jo, то он проиграет сумму, равную (aioj - (Xiojo), а игрок А соответственно выиграет ее. Аналогичные рассуждения показывают невыгодность стратегии, отличной от оптимальной, для игрока А, когда В при­держивается своей оптимальной стратегии.

Среди конечных игр, имеющих практическое значение, срав­нительно редко встречаются игры с седловой точкой. Более ти­пичным является случай, когда нижняя и верхняя цены игры не совпадают (а Ф ß), причем, нетрудно показать, что тогда а < ß.

Действительно, пусть а = max min ai} =aKS, это означает, что

в к-ой строке элемент O-ks наименьший, то есть при нахождении а.1 = max«,-, в их число попадут значения не меньшие a^s, так как

даже в этой строке элементы в других столбцах больше или рав­ны ocks- Значит и

min {max а } = min Off >aKS. ij i

Откуда следует, что ß> а, но мы рассматриваем случай ß±a, зна­чит ß> а. Итак, в играх не имеющих седловой точки, нижняя цена игры а всегда меньше верхней ß.

Установленный факт означает, что если игра одноходовая, то есть партнеры играют один раз, выбирая по одной чистой страте­гии, то в расчете на разумно играющего противника они должны придерживаться принципа минимакса, это гарантирует выигрыш V> а игроку А и проигрыш V< ß игроку В. Следовательно, при применении минимаксных стратегий величина платежа V огра­ничена неравенством а< V<ß.

Если же игра повторяется неоднократно, то постоянное при­менение минимаксных стратегий становится неразумным. Напри­мер, если игрок В будет уверен в том, что на следующем ходу А применит прежнюю стратегию, то он несомненно выберет стра­тегию, отвечающую наименулему элементу в этой строке, а не прежнюю.

Таким образом, мы пришли к выводу, что при неоднократ­ном повторении игры обоим игрокам следует менять свои страте­гии. Тогда возникает вопрос: а каким образом их менять, чтобы в среднем выигрыш одного и проигрыш другого был аналогич­но одноходовой игре, ограничиваясь снизу и сверху соответ­ственно?

Для ответа на этот вопрос введем вероятность (относитель­ную частоту) Xt применения игроком А г'-й стратегии, и У, — ве­роятность применения j-й стратегии игроком В. Совокупности ЭТИХ ВерОЯТНОСТеЙ ОПреДеЛЯЮТ ВеКТОрЫ Х= {Xl, Х2, хт}, где

т                                                                      т

^х, =1 и Y = {у\,уг, ...у„}, где ^у} =1

1=1                                                                  7=1

Эти векторы или наборы вероятностей выбора чистых стра­тегий называются смешанными стратегиями игроков.

В частности, решение игры с седловой точкой дается вектора­ми X и У , Среди компонент которых Xio = 1, X, = 0 (/Ф Іо) и уjo= 1, У] = 0 (J Ф]с).

Для получения ограничений на средний выигрыш или проиг­рыш рассмотрим математическое ожидание выигрыша первого игрока

п т

=                                                                                              (2.6.4)

М i=1

Если второй игрок В выбрал некоторую смешанную стратегию У, то первому игроку, естественно, считать лучшей ту смешан­ную стратегию X, при которой достигается max М(Х; F):

М(Х;К') = тахМ(Х;К')

Аналогично, при выборе первым игроком некоторой стратегии X второму игроку следует выбирать стратегию Y такую, что

M(X',Y) = шіпМ(Х';У)

Ясно, что X зависит от Т и Y зависит от X. Перед каждым игроком, таким образом, возникает задача выбора оптимальной стратегии, под которой для игрока понимается смешанная стра­тегия X, которая максимизирует математическое ожидание его выигрыша, для игрока В — стратегия У*, минимизирующая мате­матическое ожидание его проигрыша.

Основная теорема теории игр (доказана фон Нейманом в 1928 году) утверждает:

каждая матричная игра с нулевой суммой имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий, то есть существуют стратегии X и Y , оптимальные для обоих игроков, причем

шах min М (X; Y) = min max М (X; Y) = М (X'; У*).

Число V- М(Х*\ Y*) называют ценой игры.

Примечание. Нулевая сумма означает, что выигрыш одного игрока равен проигрышу другого.

Из основной теоремы следует, что каждая конечная игра име­ет цену и она лежит между нижней и верхней ценами игры

a<V<ß                                                                               (2.6.5)

И если один из игроков придерживается своей оптимальной стратегии, то выигрыш (проигрыш) его остается неизменным не­зависимо от тактики другого игрока, если, конечно, последний не выходит за пределы своих «полезных» стратегий, иначе выигрыш (проигрыш) возрастает.

Это означает выполнение неравенств

т

х* > V(j -1, п),

i=i

п

^aljy]<V(i = l,m).                                                               (266)

М

Примечание. Эти неравенства будут необходимы при сведе­нии матричной игры к задаче лилейного программирования.

2.6.2. Сведение матричной игры к задаче линейного программирования

При наличии неопределенности, причиной которой является при­сутствие нескольких принципов оптимальности G = {G,}, i=l,m, удобно воспользоваться двойственной задачей линейного про­граммирования.

Будем считать, что принципу G, соответствует определенный критерий оптимальности К{. В качестве К,, могут выступать: эко­номические, технические, социальные и иные критерии оптималь­ности. Показатели К;, являются функцией управляемых факторов

X =;} i = 1, т и неуправляемых факторов Y = } i = 1, т.

Итак, набору принципов G\{X, У), С2(Х, У), ..., Gm(X, У) соот­ветствует набор критериев оптимальности К\(Х, У), К2(Х, У), ...,

Кт{Х, У). Располагая множеством критериев К = {K(X,Y)l} i = l,m, необходимо определить вектор управляемых переменных Х= (Ä"i, Х2, ..., Хт), принадлежащий допустимой области решений X, ко­торый обеспечивает оптимальное (в определенном смысле) реше­ние по каждому из частных критериев.

Рассмотрим матрицу игры (2.2.1). Соотношениям отыскания нижней а и верхней ß цены игры можно поставить в соответствие эквивалентные им задачи:

max {а: М(Х; Y) > а},                                                         (2.6.7)

min {ß: М(Х; Y)< ß},                                                        (2.6.8)

т т

где М(Х; У) = X Е ачх>У}                                                 (2-6.9)

j=1 i=i

есть математическое ожидание выигрыша первого игрока. Тогда для любой чистой стратегии Y(j) игрока П

Y(j) = {У\ = 0,У2= о, ..., yj_ 1 = 0, yj = 1, yj+l = 0, ..., ут = 0) можно записать

т

М(ЛГ; Уф) = ]£>,,                                                             (2-6.10)

i=i

а для любой чистой стратегии X(i) игрока Р

X(i) = (xi = 0, х2 = 0, ..., = 0, Xi = 1, Х/+1 = 0, ..., хт = 0) м^жно записать

т

M(X(i);Y) = ^etjyj.                                                                  (26П)

7=1

Следовательно, задачи (2.6.7) — (2.6.11) допускают следую­щую запись в форме задач линейного программирования:

т                                                   _____________ т

max{er: Л/ (X; У (у)) = e,jXt >a,j = 1, m; xt > 0, i = l,m; ^Гх,- =1}, i=i i=i

(2.6.12)

тт{Р:М(Ха);¥) = ^е^<Р, 1 = 1,т; у, >0, 7 = 1,т;

(2.6.13)

Нетрудно видеть, что задачи (2.6.12) и (2.6.13) взаимнодвой- ственные, а поэтому их оптимальные значения должны совпадать, т.е. аопт = ропт = V, где V — цена игры (требуемое значение эф­фективности).

Для задачи (2.6.12) положим:

и Г = 1,                                                                              (2.6.14)

а для задачи (2.6.13) положим:

Тогда отыскание оптимальной смешанной стратегии Хот иг­рока Р приводит к необходимости решения следующей задачи линейного программирования:

минимизировать линейную функцию

1 + /2+... +*т                                                              (2.6.16)

при условиях

т

X V« ^ 1 = !.«; '< ^о, 1 = 1,/и,                                           (2.6.17)

1=1

а отыскание оптимальной смешанной стратегии КОГ1Т игрока П приводит к необходимости решения следующей задачи линейно­го программирования:

максимизировать линейную функцию

г = щ + «2 + ... + и„                                                             (2.6.18)

при условиях

п

XV; -1' 1 = и] 1 = 1>п-                                                           (2.6.19)

н

Исходя из основной теоремы теории двойственности, задачи (2.6.16) -Г- (2.6.19) имеют конечное решение И Гит =

2.6.3. Выбор оптимального ассортимента продукции

Применяя изложенный математический аппарат двойственной задачи линейного программирования, рассмотрим пример выбо­ра оптимального ассортимента и объема продукции швейного предприятия. Эта социальная задача сферы сервиса связана с удов­летворением потребностей населения в бытовых услугах и направ­лена на улучшение основных производственных показателей эф­фекта бытового обслуживания, заключающегося в снижении сто­имости товаров, экономии свободного времени и улучшении качества обслуживания.

Рассмотрим работу швейного предприятия, выпускающего детские костюмы, платья и плащи, сбыт которых зависит от со­стояния погоды, при этом реализация продукции происходит че­рез фирменные магазины.

По данным наблюдений за предшествующие одиннадцать лет предприятие в течении апреля — мая в условиях теплой погоды может реализовать 600 костюмов, 2000 платьев и 300 плащей, в условиях прохладной погоды —1000 костюмов, 500 платьев и 800 плащей и в условиях обычной погоды — 800 костюмов, 1100 пла­тьев и 600 плащей. Затраты на единицу продукции в течение указанных месяцев составили для костюмов 30 ден. ед., для плать­ев 10 ден. ед. и для плащей 15 ден. ед., а цена реализации равна соответственно 50 ден. ед., 20 ден. ед. и 28 ден. ед.

Задача заключается в максимизации средней величины при­были от реализации выпущенной продукции с учетом неопреде­ленности погоды в рассматриваемые месяцы.

Подобная задача рассматривается как игра с природой. Ее отличительная особенность состоит в том, что в ней сознательно действует только один из участников (предприятие), называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не дей­ствует, а выступает как не имеющий конкретной цели и случай­ным образом выбирающий очередные ходы партнер по игре.

Первоочередной задачей является построение платежной мат­рицы.

Предприятие располагает тремя чистыми стратегиями: страте­гия Р] с расчетом на теплую погоду, стратегия Рг с расчетом па про­хладную погоду и стратегия Р3 с расчетом на обычную погоду.

Природа, рассматриваемая как второй игрок, также распола­гает тремя стратегиями: обычная погода (стратегия ПО, прохлад­ная погода (стратегия П2) и теплая погода (стратегия Пз).

Если предприятие выберет стратегию Рь то в случае обычной погоды (стратегия природы П|) доход составит:

(50 - 30) 600 + (20 - 10)1100 + (28 - 15)300 - (20 - 10)(2000 - 1000)=

= 17900 ден. ед.,

в случае прохладной погоды (стратегия природы П2) доход будет равен

20 • 600 + 10 • 500 + 13 • 300 - 10(2000 - 500) = 5900 ден. ед.,

и в случае теплой погоды (стратегия природы Пз) имеем доход, равный

20 • 600 + 10 • 2000 + 13 • 300 = 35900 ден. ед.

Если предприятие выберет стратегию Рг, то реализация про­дукции в условиях обычной погоды дает доход:

20 • 800 + 10 • 500 + 13 • 600 - 20(1000 - 800) - 13(800 - 600) = = 22000 ден. ед.,

в условиях прохладной погоды доход будет:

20 • 1000 + 10 • 500 + 13 • 800 = 35400 ден. ед.,

а в условиях теплой погоды имеем доход:

20 • 600 + 10 • 500 + 13 • 300 - 20(1000 - 600) - 13(800 - 300) =

= 6400 ден. ед.

Если предприятие выберет стратегию Рз, то в случае обычной погоды доход будет равен:

20 • 800 + 10 • 1100 + 13 • 600 = 34800 ден. ед.,

при прохладной погоде имеем доход, равный:

20 • 800 + 10 • 500 + 13 • 600 - 10(1100 - 500) = 22800 ден. ед.,

и в случае теплой погоды доход составит:

20 • 600 + 10 • 1100 + 13 • 300 - 20(800 - 600) - 13(600 - 300) = = 16000 ден. ед.

 

Результаты вычислений сведены в табл. 2.8.

Таблица 2.8

Стратегия ^~\природы Стратегия^^. предприятия

Обычная

п,

Прохладная

п2

Теплая Пз

Теплая — Р1

17 900

5 900

35 900

Прохладная — Р2

22 000

35 400

6400

Обычная — Р3

34 800

22 800

16 000

 

Платежная матрица рассматриваемой производственной си­туации имеет вид:

17900 5900 35900 22000 35400 6400 34800 22800 16000

Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игро­ком 1 и объединенных в понятие «природа»). В данной ситуации платит само предприятие, получая меньшую или большую при­быль.

Можно задавать матрицу игры с природой и в виде так назы­ваемой матрицы рисков И = || или матрицы упущенных возмож­ностей. Величина риска — это размер платы за отсутствие инфор­мации о состоянии среды. Матрицу Я построим на основе матри­цы выигрышей Е = |ву ||.

Риском г у игрока при использовании им стратегий Р\, Р2 или Рз и При состоянии природы Пи П2 или Щ будем назы­вать разность между выигрышем, который игрок получил бы, если бы он узнал, что состоянием среды будет или П\, или П2, или Пз и выигрышем, который игрок получит, не имея этой ин­формации.

Платежная матрица

(2.6.20)

Матрицу рисков находим по формуле (2.2.2).

 

Для матрицы (2.6.20) имеем /3, = 34 800, ß2 = 35 400, /З3 = 35 900. Получаем матрицу рисков:

 


 

(2.6.21)

R =

(16900 29500 0 ^ 12800 0 29500 0 12600 19900

 


 

Для определения критериев эффективности построим табл. 2.9.

Т а б л и ц а 2.9

Вспомогательная таблица

\ П; pi

п.

п2

Пз

min с,.

j

max Су

Pi

17 900

5900

35 900

5900

35 900

p2

22 000

35 400

6400

6400

35 400

Рз

34 800

22 800

16 000

16 000

34 800

 

Для предприятия лучшими являются стратегии: по критерию гарантированного результата:

Ег = шах min etj = max {5900, 6400,16000} = 16000 - Р3; i j

по критерию оптимизма:

Е0 = max max*?,, = max{35900, 35400, 34800} = 35900-Р,; < i

по критерию пессимизма:

Е„ = min min е,. = min {5900, 6400,16000} = 5900- Р,; ' j

по критерию Сэвиджа, исходя из матрицы рисков (2.6.21):

Erc = min max rtj = min{29500, 29500,19900} = 19900 - P3;

i j y i

по критерию Гурвица при коэффициенте оптимизма к = 0,6

Ег = max{A: min еи + (1 - к) max etj } = ' J   i

= max{17900,18000, 23520} = 23520-P3.

i

 

Стратегия Я3 повторяется в качестве оптимальной по трем критериям выбора из пяти критериев, а стратегия Р\ — по двум критериям. Однако, преимущество дал критерий Гурвица, зави­сящий от коэффициента оптимизма к и, если принять к = 0,9, то по критерию Гурвица оптимальной будет стратегия Рг■ Поэтому к практическому применению можно рекомендовать как страте­гию Р\, так и стратегию Р3.

В данном случае видно, что однозначного ответа о выборе оптимальной стратегии, исходя из критериев оптимальности, дать нельзя.

Дальнейший экономический анализ, с целью определения оп­тимального объема производства, проведем с использованием те­ории двойственности задач линейного программирования.

Для матрицы (2.6.20), исходя из общей постановки (2.6.16) — (2.6.19) имеем следующую пару двойственных задач:

для определения оптимальной стратегии игрока Р нужно ре­шить задачу линейного программирования: найти минимум функции

Т- /1 + /2 + Ь                                                                    (2.6.22)

при ограничениях

17900Г, +22000/2 + З4800г3 >1, 5900г, +35400г2 +22800г3 >1, 35900^ + 6400г2 +16000?3 > 1,      (2.6.23)

г, >0, ; = 1,2,3.

гп

Оптимальную стратегию игрока П определим, решив задачу ли­нейного программирования: найти максимум функции

г = щ + и2 + иг                                                                    (2.6.24)

т оп

при ограничениях

V

17900м, +5900м2 + 35900«3 <1, 22000к, + 35400м2 + 6400м3 < 1,

34800«! + 22800« 2 +16000м 3 < 1,                                     (2.6.25)

Ц] >0, ] = 1,2,3.

Решаем более простую обратную задачу (2.6.24) — (2.6.25). Вво­дя положительные базисные переменные (б.п.) «4,1/5, щ, систему не­равенств (2.6.24) — (2.6.25) записываем в виде системы уравнений

17900м, + 5900м2 + 35900м 3 + м4 = 1, 22000м, + 35400м2 + 6400м3 + и5 =1, 34800м, + 22800м2 + 16000м36 = 1,                                                                                           (2.6.26)

-м,-м23 + г = 0.

Систему (2.6.26) записываем в виде табл. 2.10.

Таблица 2. 10

 

и,

и2

и3

1

ил

17 900

5900

35 900

!

1

и5

22 000

35 400

6400

1

и6

34 800

22 800

16 000

1

г

- 1

-1

- 1

0

 

Совершая последовательно три шага модифицированных жор- дановых исключения, получим табл. 2.11.

Таблица 2.11

\с.п б.п\

и6

и5

и*

1

и3

17587661581

14703

45973049029

43237368013

679081024890800

1410461980

509289611738400

2037243074672400

и2

489549

2094351

35148

113361

14104619800

42313859400

5289232245

5289232425

123406727061

524987

44031622991

32266536049

1772401474964988

14104619800

2037158446953600

8076781399859952

г

4919630499

16008

11495892639

532279964702

1772327848 849632

705230990

509289611738400

11077509218531175

 

Так как в табл. 2.11 все элементы в 2-строке и 1-столбце нео­трицательны, то получаем оптимальное решение.

Переходим к решению прямой задачи. Установим соответствие переменных двойственных задач:

СП.                                            Б. П.

и\                                        1/3              «4         1/5 Мб

/4                                        <6                           12 Н

Транспонируем табл. 2.11, знаки перед всеми элементами, кро­ме элементов Z — строки, меняем на обратные, переменные I] за­меняем на соответствующие переменные и,-, получаем табл. 2.12.

Таблица 2.12

\.п.

бЛ

te

h

h

1

tj

0,259 • 10"4

0,347 • 10"4

-0,697 ■ 10"4

0,028 ■ 10"4

h

-0,104 - 10"4

-0,495 • 10"4

0,372 ■ 10"4

0,227 ■ 10"4

h

-0,903 • 10~4

-0,066- 10"4

0,216 • 10"4

0,225 • 10~4

Т

-0,217- 10"4

-0,221 • 10"4

-0,041 • 10"4

0,480 - 10"4

 


Из табл. 2.12 получаем оптимальное решение. Так как


Т = у = 0.48 ■ Ю-4, то цена игры V = 20833. Из г, = 0,225-10"4

получаем xi = 0.469. Аналогично получим = 0,472 и х3 = 0,059.

Это означает, что стратегию Р\ нужно применять с вероятно­стью 0,469, стратегию Рг — с вероятностью 0,472 и стратегию Ръ — с вероятностью 0,059.

Формируем оптимальный план производства:

(600 кост. + 2000 плат. + 300 плащ.) • 0,469 + (1000 кост. + + 500 плат. + 800 плащ.) • 0,472 + (800 кост. + 1100 плат. + + 600 плащ.) ■ 0,059 = 801 кост. + 1239 плат. + 554 плащ.

Таким обратом, предприятие при производстве 801 костюма, 1239 платьев и 554 плащей получит наибольшую прибыль, кото­рая в среднем составит 20833 ден. ед.

Для приведенной формулировки производственной задачи получили однозначный ответ.

Недостатком данного метода является достаточно большой объем вычислительных операций даже для матрицы с размерностью 3x3. Однако, существуют стандартные программы применения симплек­сного метода на ЭВМ и это снимает подобное неудобство.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48  Наверх ↑