2.6. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО ОБЪЕМА ПРОИЗВОДСТВА ШВЕЙНОГО ПРЕДПРИЯТИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
2.6.1. Верхняя и нижняя цена игры
Рассмотрим платежную матрицу игры Е = |еу ||, раскрытую в
виде (2.2.1). Здесь /-я строка соответствует А,-й стратегии игрока A,j-й столбец соответствует Bf й стратегии игрока В.
Пусть игрок А выбирает некоторую стратегию А „ тогда, в наихудшем случае (например, если выбор станет известен игроку В), он получат выигрыш равцый minp,-,. Предвидя эту возможность,
игрок А должен выбрать такую стратегию, чтобы максимизировать свой минимальный в каждой стратегии выигрыш а. Таким образом,
а = шах min or,-.. (2.6.1)
' i
Величина а называется нижней ценой игры (а — это гарантированный выигрыш игрока А). Очевидно а находится в одной из
91
строк матрицы Е, пусть в 1а, тогда стратегия А10 называется мак- симинной.
Итак, если игрок А будет придерживаться максиминной стратегии, то ему при любом поведении игрока В гарантирован выигрыш, во всяком случае не меньший а.
(2.6.2) |
С другой стороны, противник — игрок В, заинтересован в том, чтобы обратить выигрыш игрока А в минимум, поэтому он должен пересмотреть каждую свою стратегию с точки зрения максимального выигрыша игроком А при этой стратегии. Другими словами, при выборе некоторой стратегии В, он должен исходить из максимального проигрыша в этой стратегии, равного тахау, и найти такую стратегию, при которой этот проигрыш буДет наименьшим, то есть не более, чем
Р = гат шах а, ] <
Величина /3 называется верхней ценой игры, а соответствующая ему стратегия В]0 — минимаксной.
Принцип осторожности, диктующий игрокам выбор стратегий максиминной ими минимаксной соответственно, в теории игр именуют принципом «минимакса», а сами стратегии максимин- ные и минимаксные — общим термином «минимаксные стратегии».
(2.6.3) |
Вполне определенной игрой или игрой с седловой точкой называется игра, у которой совпадают нижняя и верхняя цены игры, то есть выполняется равенство:
а = шах тт ау = тш шах = ац = (3
/ 1 " 1
При этом V = а = /3 называется ценой игры, а элемент а,0у0, соответствующий равенству, называется седловой точкой.
Простота решения игры с седловой точкой заключается в том, что оптимальные стратегии обоих игроков находятся сразу. Для игрока А это стратегия А1о, для игрока В — В р. Причем, такое решение обладает свойством устойчивости в том смысле, что, если один из игроков применяет свою оптимальную стратегию, то любое отклонение другого игрока от оптимальной стратегии может оказаться не выгодным для него.
Действительно, пусть игрок А выбрал оптимальную стратегию А,о, соответствующую а = max min ау = а^, то есть игрок/4
обеспечивает себе выигрыш, равный одному из элементов i0 строки, причем, элемент в jo столбце наименьший среди них (aj0j>ai0j0, j Ф jo)- и если игрок В выберет j- Ю стратегию отличную ОТ jo, то он проиграет сумму, равную (aioj - (Xiojo), а игрок А соответственно выиграет ее. Аналогичные рассуждения показывают невыгодность стратегии, отличной от оптимальной, для игрока А, когда В придерживается своей оптимальной стратегии.
Среди конечных игр, имеющих практическое значение, сравнительно редко встречаются игры с седловой точкой. Более типичным является случай, когда нижняя и верхняя цены игры не совпадают (а Ф ß), причем, нетрудно показать, что тогда а < ß.
Действительно, пусть а = max min ai} =aKS, это означает, что
в к-ой строке элемент O-ks наименьший, то есть при нахождении а.1 = max«,-, в их число попадут значения не меньшие a^s, так как
даже в этой строке элементы в других столбцах больше или равны ocks- Значит и
min {max а } = min Off >aKS. ij i
Откуда следует, что ß> а, но мы рассматриваем случай ß±a, значит ß> а. Итак, в играх не имеющих седловой точки, нижняя цена игры а всегда меньше верхней ß.
Установленный факт означает, что если игра одноходовая, то есть партнеры играют один раз, выбирая по одной чистой стратегии, то в расчете на разумно играющего противника они должны придерживаться принципа минимакса, это гарантирует выигрыш V> а игроку А и проигрыш V< ß игроку В. Следовательно, при применении минимаксных стратегий величина платежа V ограничена неравенством а< V<ß.
Если же игра повторяется неоднократно, то постоянное применение минимаксных стратегий становится неразумным. Например, если игрок В будет уверен в том, что на следующем ходу А применит прежнюю стратегию, то он несомненно выберет стратегию, отвечающую наименулему элементу в этой строке, а не прежнюю.
Таким образом, мы пришли к выводу, что при неоднократном повторении игры обоим игрокам следует менять свои стратегии. Тогда возникает вопрос: а каким образом их менять, чтобы в среднем выигрыш одного и проигрыш другого был аналогично одноходовой игре, ограничиваясь снизу и сверху соответственно?
Для ответа на этот вопрос введем вероятность (относительную частоту) Xt применения игроком А г'-й стратегии, и У, — вероятность применения j-й стратегии игроком В. Совокупности ЭТИХ ВерОЯТНОСТеЙ ОПреДеЛЯЮТ ВеКТОрЫ Х= {Xl, Х2, хт}, где
т т
^х, =1 и Y = {у\,уг, ...у„}, где ^у} =1
1=1 7=1
Эти векторы или наборы вероятностей выбора чистых стратегий называются смешанными стратегиями игроков.
В частности, решение игры с седловой точкой дается векторами X и У , Среди компонент которых Xio = 1, X, = 0 (/Ф Іо) и уjo= 1, У] = 0 (J Ф]с).
Для получения ограничений на средний выигрыш или проигрыш рассмотрим математическое ожидание выигрыша первого игрока
п т
= (2.6.4)
М i=1
Если второй игрок В выбрал некоторую смешанную стратегию У, то первому игроку, естественно, считать лучшей ту смешанную стратегию X, при которой достигается max М(Х; F):
М(Х;К') = тахМ(Х;К')
Аналогично, при выборе первым игроком некоторой стратегии X второму игроку следует выбирать стратегию Y такую, что
M(X',Y) = шіпМ(Х';У)
Ясно, что X зависит от Т и Y зависит от X. Перед каждым игроком, таким образом, возникает задача выбора оптимальной стратегии, под которой для игрока понимается смешанная стратегия X, которая максимизирует математическое ожидание его выигрыша, для игрока В — стратегия У*, минимизирующая математическое ожидание его проигрыша.
Основная теорема теории игр (доказана фон Нейманом в 1928 году) утверждает:
каждая матричная игра с нулевой суммой имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий, то есть существуют стратегии X и Y , оптимальные для обоих игроков, причем
шах min М (X; Y) = min max М (X; Y) = М (X'; У*).
Число V- М(Х*\ Y*) называют ценой игры.
Примечание. Нулевая сумма означает, что выигрыш одного игрока равен проигрышу другого.
Из основной теоремы следует, что каждая конечная игра имеет цену и она лежит между нижней и верхней ценами игры
a<V<ß (2.6.5)
И если один из игроков придерживается своей оптимальной стратегии, то выигрыш (проигрыш) его остается неизменным независимо от тактики другого игрока, если, конечно, последний не выходит за пределы своих «полезных» стратегий, иначе выигрыш (проигрыш) возрастает.
Это означает выполнение неравенств
т
х* > V(j -1, п),
i=i
п
^aljy]<V(i = l,m). (266)
М
Примечание. Эти неравенства будут необходимы при сведении матричной игры к задаче лилейного программирования.
2.6.2. Сведение матричной игры к задаче линейного программирования
При наличии неопределенности, причиной которой является присутствие нескольких принципов оптимальности G = {G,}, i=l,m, удобно воспользоваться двойственной задачей линейного программирования.
Будем считать, что принципу G, соответствует определенный критерий оптимальности К{. В качестве К,, могут выступать: экономические, технические, социальные и иные критерии оптимальности. Показатели К;, являются функцией управляемых факторов
X = {Х;} i = 1, т и неуправляемых факторов Y = } i = 1, т.
Итак, набору принципов G\{X, У), С2(Х, У), ..., Gm(X, У) соответствует набор критериев оптимальности К\(Х, У), К2(Х, У), ...,
Кт{Х, У). Располагая множеством критериев К = {K(X,Y)l} i = l,m, необходимо определить вектор управляемых переменных Х= (Ä"i, Х2, ..., Хт), принадлежащий допустимой области решений X, который обеспечивает оптимальное (в определенном смысле) решение по каждому из частных критериев.
Рассмотрим матрицу игры (2.2.1). Соотношениям отыскания нижней а и верхней ß цены игры можно поставить в соответствие эквивалентные им задачи:
max {а: М(Х; Y) > а}, (2.6.7)
min {ß: М(Х; Y)< ß}, (2.6.8)
т т
где М(Х; У) = X Е ачх>У} (2-6.9)
j=1 i=i
есть математическое ожидание выигрыша первого игрока. Тогда для любой чистой стратегии Y(j) игрока П
Y(j) = {У\ = 0,У2= о, ..., yj_ 1 = 0, yj = 1, yj+l = 0, ..., ут = 0) можно записать
т
М(ЛГ; Уф) = ]£>,, (2-6.10)
i=i
а для любой чистой стратегии X(i) игрока Р
X(i) = (xi = 0, х2 = 0, ..., = 0, Xi = 1, Х/+1 = 0, ..., хт = 0) м^жно записать
т
M(X(i);Y) = ^etjyj. (26П)
7=1
Следовательно, задачи (2.6.7) — (2.6.11) допускают следующую запись в форме задач линейного программирования:
т _____________ т
max{er: Л/ (X; У (у)) = e,jXt >a,j = 1, m; xt > 0, i = l,m; ^Гх,- =1}, i=i i=i
тт{Р:М(Ха);¥) = ^е^<Р, 1 = 1,т; у, >0, 7 = 1,т;
(2.6.13)
Нетрудно видеть, что задачи (2.6.12) и (2.6.13) взаимнодвой- ственные, а поэтому их оптимальные значения должны совпадать, т.е. аопт = ропт = V, где V — цена игры (требуемое значение эффективности).
Для задачи (2.6.12) положим:
и Г = 1, (2.6.14)
а для задачи (2.6.13) положим:
Тогда отыскание оптимальной смешанной стратегии Хот игрока Р приводит к необходимости решения следующей задачи линейного программирования:
минимизировать линейную функцию
1 + /2+... +*т (2.6.16)
при условиях
т
X V« ^ 1 = !.«; '< ^о, 1 = 1,/и, (2.6.17)
1=1
а отыскание оптимальной смешанной стратегии КОГ1Т игрока П приводит к необходимости решения следующей задачи линейного программирования:
максимизировать линейную функцию
г = щ + «2 + ... + и„ (2.6.18)
при условиях
п
XV; -1' 1 = и] 1 = 1>п- (2.6.19)
н
Исходя из основной теоремы теории двойственности, задачи (2.6.16) -Г- (2.6.19) имеют конечное решение И Гит =
2.6.3. Выбор оптимального ассортимента продукции
Применяя изложенный математический аппарат двойственной задачи линейного программирования, рассмотрим пример выбора оптимального ассортимента и объема продукции швейного предприятия. Эта социальная задача сферы сервиса связана с удовлетворением потребностей населения в бытовых услугах и направлена на улучшение основных производственных показателей эффекта бытового обслуживания, заключающегося в снижении стоимости товаров, экономии свободного времени и улучшении качества обслуживания.
Рассмотрим работу швейного предприятия, выпускающего детские костюмы, платья и плащи, сбыт которых зависит от состояния погоды, при этом реализация продукции происходит через фирменные магазины.
По данным наблюдений за предшествующие одиннадцать лет предприятие в течении апреля — мая в условиях теплой погоды может реализовать 600 костюмов, 2000 платьев и 300 плащей, в условиях прохладной погоды —1000 костюмов, 500 платьев и 800 плащей и в условиях обычной погоды — 800 костюмов, 1100 платьев и 600 плащей. Затраты на единицу продукции в течение указанных месяцев составили для костюмов 30 ден. ед., для платьев 10 ден. ед. и для плащей 15 ден. ед., а цена реализации равна соответственно 50 ден. ед., 20 ден. ед. и 28 ден. ед.
Задача заключается в максимизации средней величины прибыли от реализации выпущенной продукции с учетом неопределенности погоды в рассматриваемые месяцы.
Подобная задача рассматривается как игра с природой. Ее отличительная особенность состоит в том, что в ней сознательно действует только один из участников (предприятие), называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные ходы партнер по игре.
Первоочередной задачей является построение платежной матрицы.
Предприятие располагает тремя чистыми стратегиями: стратегия Р] с расчетом на теплую погоду, стратегия Рг с расчетом па прохладную погоду и стратегия Р3 с расчетом на обычную погоду.
Природа, рассматриваемая как второй игрок, также располагает тремя стратегиями: обычная погода (стратегия ПО, прохладная погода (стратегия П2) и теплая погода (стратегия Пз).
Если предприятие выберет стратегию Рь то в случае обычной погоды (стратегия природы П|) доход составит:
(50 - 30) 600 + (20 - 10)1100 + (28 - 15)300 - (20 - 10)(2000 - 1000)=
= 17900 ден. ед.,
в случае прохладной погоды (стратегия природы П2) доход будет равен
20 • 600 + 10 • 500 + 13 • 300 - 10(2000 - 500) = 5900 ден. ед.,
и в случае теплой погоды (стратегия природы Пз) имеем доход, равный
20 • 600 + 10 • 2000 + 13 • 300 = 35900 ден. ед.
Если предприятие выберет стратегию Рг, то реализация продукции в условиях обычной погоды дает доход:
20 • 800 + 10 • 500 + 13 • 600 - 20(1000 - 800) - 13(800 - 600) = = 22000 ден. ед.,
в условиях прохладной погоды доход будет:
20 • 1000 + 10 • 500 + 13 • 800 = 35400 ден. ед.,
а в условиях теплой погоды имеем доход:
20 • 600 + 10 • 500 + 13 • 300 - 20(1000 - 600) - 13(800 - 300) =
= 6400 ден. ед.
Если предприятие выберет стратегию Рз, то в случае обычной погоды доход будет равен:
20 • 800 + 10 • 1100 + 13 • 600 = 34800 ден. ед.,
при прохладной погоде имеем доход, равный:
20 • 800 + 10 • 500 + 13 • 600 - 10(1100 - 500) = 22800 ден. ед.,
и в случае теплой погоды доход составит:
20 • 600 + 10 • 1100 + 13 • 300 - 20(800 - 600) - 13(600 - 300) = = 16000 ден. ед.
Результаты вычислений сведены в табл. 2.8.
Таблица 2.8
|
Платежная матрица рассматриваемой производственной ситуации имеет вид:
17900 5900 35900 22000 35400 6400 34800 22800 16000
Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»). В данной ситуации платит само предприятие, получая меньшую или большую прибыль.
Можно задавать матрицу игры с природой и в виде так называемой матрицы рисков И = || или матрицы упущенных возможностей. Величина риска — это размер платы за отсутствие информации о состоянии среды. Матрицу Я построим на основе матрицы выигрышей Е = |ву ||.
Риском г у игрока при использовании им стратегий Р\, Р2 или Рз и При состоянии природы Пи П2 или Щ будем называть разность между выигрышем, который игрок получил бы, если бы он узнал, что состоянием среды будет или П\, или П2, или Пз и выигрышем, который игрок получит, не имея этой информации.
Платежная матрица |
(2.6.20) |
Матрицу рисков находим по формуле (2.2.2).
Для матрицы (2.6.20) имеем /3, = 34 800, ß2 = 35 400, /З3 = 35 900. Получаем матрицу рисков:
|
(2.6.21) |
R = |
(16900 29500 0 ^ 12800 0 29500 0 12600 19900
|
Для определения критериев эффективности построим табл. 2.9.
Т а б л и ц а 2.9
\ П; pi |
п. |
п2 |
Пз |
min с,. j |
max Су |
Pi |
17 900 |
5900 |
35 900 |
5900 |
35 900 |
p2 |
22 000 |
35 400 |
6400 |
6400 |
35 400 |
Рз |
34 800 |
22 800 |
16 000 |
16 000 |
34 800 |
Для предприятия лучшими являются стратегии: по критерию гарантированного результата:
Ег = шах min etj = max {5900, 6400,16000} = 16000 - Р3; i j
по критерию оптимизма:
Е0 = max max*?,, = max{35900, 35400, 34800} = 35900-Р,; < i
по критерию пессимизма:
Е„ = min min е,. = min {5900, 6400,16000} = 5900- Р,; ' j
по критерию Сэвиджа, исходя из матрицы рисков (2.6.21):
Erc = min max rtj = min{29500, 29500,19900} = 19900 - P3;
i j y i
по критерию Гурвица при коэффициенте оптимизма к = 0,6
Ег = max{A: min еи + (1 - к) max etj } = ' J i
= max{17900,18000, 23520} = 23520-P3.
i
Стратегия Я3 повторяется в качестве оптимальной по трем критериям выбора из пяти критериев, а стратегия Р\ — по двум критериям. Однако, преимущество дал критерий Гурвица, зависящий от коэффициента оптимизма к и, если принять к = 0,9, то по критерию Гурвица оптимальной будет стратегия Рг■ Поэтому к практическому применению можно рекомендовать как стратегию Р\, так и стратегию Р3.
В данном случае видно, что однозначного ответа о выборе оптимальной стратегии, исходя из критериев оптимальности, дать нельзя.
Дальнейший экономический анализ, с целью определения оптимального объема производства, проведем с использованием теории двойственности задач линейного программирования.
Для матрицы (2.6.20), исходя из общей постановки (2.6.16) — (2.6.19) имеем следующую пару двойственных задач:
для определения оптимальной стратегии игрока Р нужно решить задачу линейного программирования: найти минимум функции
Т- /1 + /2 + Ь (2.6.22)
при ограничениях
17900Г, +22000/2 + З4800г3 >1, 5900г, +35400г2 +22800г3 >1, 35900^ + 6400г2 +16000?3 > 1, (2.6.23)
г, >0, ; = 1,2,3.
гп
Оптимальную стратегию игрока П определим, решив задачу линейного программирования: найти максимум функции
г = щ + и2 + иг (2.6.24)
при ограничениях
V
17900м, +5900м2 + 35900«3 <1, 22000к, + 35400м2 + 6400м3 < 1,
34800«! + 22800« 2 +16000м 3 < 1, (2.6.25)
Ц] >0, ] = 1,2,3.
Решаем более простую обратную задачу (2.6.24) — (2.6.25). Вводя положительные базисные переменные (б.п.) «4,1/5, щ, систему неравенств (2.6.24) — (2.6.25) записываем в виде системы уравнений
17900м, + 5900м2 + 35900м 3 + м4 = 1, 22000м, + 35400м2 + 6400м3 + и5 =1, 34800м, + 22800м2 + 16000м3 +и6 = 1, (2.6.26)
-м,-м2-м3 + г = 0.
Систему (2.6.26) записываем в виде табл. 2.10.
Таблица 2. 10
|
Совершая последовательно три шага модифицированных жор- дановых исключения, получим табл. 2.11.
Таблица 2.11
|
Так как в табл. 2.11 все элементы в 2-строке и 1-столбце неотрицательны, то получаем оптимальное решение.
Переходим к решению прямой задачи. Установим соответствие переменных двойственных задач:
СП. Б. П.
и\ 1/3 «4 1/5 Мб
/4 <6 12 Н
Транспонируем табл. 2.11, знаки перед всеми элементами, кроме элементов Z — строки, меняем на обратные, переменные I] заменяем на соответствующие переменные и,-, получаем табл. 2.12.
Таблица 2.12
|
Из табл. 2.12 получаем оптимальное решение. Так как |
Т = у = 0.48 ■ Ю-4, то цена игры V = 20833. Из г, = 0,225-10"4
получаем xi = 0.469. Аналогично получим = 0,472 и х3 = 0,059.
Это означает, что стратегию Р\ нужно применять с вероятностью 0,469, стратегию Рг — с вероятностью 0,472 и стратегию Ръ — с вероятностью 0,059.
Формируем оптимальный план производства:
(600 кост. + 2000 плат. + 300 плащ.) • 0,469 + (1000 кост. + + 500 плат. + 800 плащ.) • 0,472 + (800 кост. + 1100 плат. + + 600 плащ.) ■ 0,059 = 801 кост. + 1239 плат. + 554 плащ.
Таким обратом, предприятие при производстве 801 костюма, 1239 платьев и 554 плащей получит наибольшую прибыль, которая в среднем составит 20833 ден. ед.
Для приведенной формулировки производственной задачи получили однозначный ответ.
Недостатком данного метода является достаточно большой объем вычислительных операций даже для матрицы с размерностью 3x3. Однако, существуют стандартные программы применения симплексного метода на ЭВМ и это снимает подобное неудобство.
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Наверх ↑