Институт проблем управления им. В.А. Трапезникова РАН
УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
СБОРНИК ТРУДОВ
Выпуск 10 Москва – 2005
www.mtas.ru ИНТЕРНЕТ-сайт теории управления организационными системами С октября 2003 года открыт Интернет-сайт теории управления организационными системами Целью сайта является предоставление специалистам по теории и практике управления организационными системами (ученым, преподавателям, аспирантам, студентам, а также реальным управленцам) доступа к ресурсам, отражающим современное состояние теории и возможности обмена идеями и результатами. На сайте представлены разделы: Теория – с обзором теории управления организационными системами, глоссарием, информацией для аспирантов; Практика – с обзором результатов внедрения механизмов управления в реальных организациях; Библиография – около 2000 публикаций по теории управления, снабжена классификатором и аннотациями; Электронная библиотека – более 100 полнотекстовых монографий, статей и учебных пособий; а также многое другое. На сайте работает форум, на котором можно обсудить вопросы, относящиеся к математике, экономике, управлению организациями, узнать новости теории управления и ознакомиться с планируемыми конференциями и семинарами. За время работы сайта его посетили более 15000 человек.
РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления им. В.А. Трапезникова
УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ СБОРНИК ТРУДОВ
Выпуск 10
Общая редакция – Д.А. Новиков
Москва – 2005
УДК 007 ББК 32.81 У 67 У 67
Управление большими системами / Сборник трудов. Выпуск 10. Общая редакция – Д.А. Новиков. М.: ИПУ РАН, 2005. – 130 с.
В сборнике представлены статьи ученых, специализирующихся в области разработки и внедрения моделей
и
методов
управления
социально-
экономическими системами.
Утверждено к печати Редакционным советом Института
Ó ИПУ РАН, 2005
СОДЕРЖАНИЕ Архипова И.Л., Заложнев А.Ю., Ярусова И.Н. Задача определения оптимального способа доставки груза с консигнационного склада....................................................................5 Беляков А.Ю. , Елохова И.В., Харитонов В.А. Активная экспертиза класса несимметричности матрицы свертки……………………………………………………23 Богатырев В.Д. Управление сбытом продукции на примере ОАО "Автоваз".…………………………………....…...26 Выборнов Р.А. Стимулирование в организационной системе с недобросовестным поведением агента…………………………..34 Ермаков Н.С., Иващенко А.А. Репутация фирм с точки зрения потребителей…………………..40 Залесов А.И. Влияние взаимной информированности агентов на оптимальную структуру организации (базовая модель)……….55 Заложнев А.Ю., Москвитина М.А., Ярусова И.Н. Организация бухгалтерского учета и методы внутрифирменного управления………………………….67 Искаков М.Б. Эффект завышения малых вероятностей…………………………76 Корюхина Т.Н., Положишников В.Б., Соболев А.В. Применение динамических прогнозов в задаче оперативного управления парком порожних вагонов……………………………...81
3
Куропаткин М.А. Задача стимулирования сотрудников отдела снабжения………..87 Матвеев А.А. Модели и методы распределения ресурса при управлении портфелями проектов………………………….…98 Суханов А.Л. Согласованное управление научными проектами….....….………107 Сухачев К.А., Цветков А.В. Сетевые модели реализации портфеля заказов………………….119 СВЕДЕНИЯ ОБ АВТОРАХ..............................................................129
4
ЗАДАЧА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО СПОСОБА ДОСТАВКИ ГРУЗА С КОНСИГНАЦИОННОГО СКЛАДА Архипова И.Л., Заложнев А.Ю., Ярусова И.Н. (Институт проблем управления РАН, Москва)
[email protected] В данной работе рассматривается задача выбора оптимального способа доставки консолидированной партии товаров с консигнационного склада, находящегося вне таможенной территории, на которой осуществляет свою деятельность фирмаимпортер, на таможенный склад временного хранения. Выбор способа доставки производится между авиа- и автодоставкой грузов. Оптимальность способа доставки понимается в смысле минимизации издержек фирмы-импортера. В работе [1] решается задача определения оптимального периода времени консолидации поступающих грузов в одну партию на консигнационном складе. Установлено, что случаев авиа- и автодоставки значения t 1* и t *2 для оптимального периода времени консолидации задаются, соответственно, следующими выражениями: (1) t 1* = +
tn2 + 2 ´
G , hs
(2) t *2 = +
tn2 + 2 ´
( D + G) . hs
Переменные, фигурирующие в выражениях (1) и (2) как и в [1] несут следующую смысловую нагрузку: 1. tn – нормативный промежуток времени между моментом поступления товара на консигнационный склад и моментом, начиная с которого на фирму-импортера накладываются штрафные санкции со стороны конечного покупателя за просрочку поставки товара. Величина tn равна среднему по совокупности контрактов (или средневзвешенному по стоимости товара) нормативному (указываемому в контрактах) интервалу времени от момента оплаты товара (или оговоренной части его стоимости) до момента отгрузки 5
(передачи) товара конечному покупателю (tc ) за минусом суммы среднего времени между моментом заказа товара фирмойимпортером, предположительно совпадающим с моментом его оплаты конечным покупателем, и моментом поступления товара на консигнационный склад со складов производителей или поставщиков (tp1), за минусом среднего времени доставки товара с консигнационного склада на таможенный склад временного хранения (СВХ), на котором зарегистрирована фирма-импортер (tp2), за минусом среднего времени обработки груза на СВХ (tp3), включая его растаможивание, и, наконец, за минусом среднего времени обработки груза на складе фирмы до момента его передачи (отгрузки) конечному покупателю (tp4): tn = tc – tp1 – tp2 – tp3 – tp4 (суток). 2. s – средняя интенсивность поступления товара на консигнационный склад, выражаемая в условных единицах в сутки (у.е./сутки). 3. h – средняя (средневзвешенная) ставка штрафных санкций, фиксируемая в договорах на поставку (продажу) товаров между фирмой-импортером и конечными покупателями. В модели [1] штрафные санкции начинают начисляться после того, как товар, поступивший на консигнационный склад в момент t, пробудет на нем промежуток времени, равный tn, т.е. с момента t + tn (безразмерная величина). 4. G – стоимость услуг таможенного брокера, не зависящая от количества партий товаров, консолидированных в одну на консигнационном складе (условных единиц). 5. D – стоимость доставки трака (фуры) от консигнационного склада до таможенного склада временного хранения (условных единиц). В модели, рассматриваемой в работе [1], содержатся также другие переменные, не входящие в финальные выражения (1) и (2), но существенные с точки зрения настоящего рассмотрения. Относительно этих переменных в [1] формулируются следующие предположения и допущения: 1. m – средний вес (кг) партии товара стоимости s, поступающей на консигнационный склад, т. е. на консигнационный склад ежесуточно поступает товар весом m кг; m ´ t – масса товара, поступившего на консигнационный склад за время t (кг/сутки). 6
2. b – стоимость доставки 1 кг груза авиатранспортом с консигнационного склада на СВХ (у.е./кг). В настоящей работе мы в целях повышения адекватности модели будем рассматривать некоторые из этих предпосылок в уточненном виде: 1. Предполагается, что при доставке груза автотранспортом существует возможность выбора фуры (трака) из некоторого набора фур различной грузоподъемности – P1, P2, …, Pk, например, 3.5, 5.0,…, 20 тонн, каждая из которых имеет свою стоимость доставки с консигнационного склада до СВХ – D1, D2, …, Dk. 2. В рассматриваемой модели мы отказываемся от упрощающего предположения, что интенсивность поступления товаров на консигнационный склад составляет m кг/сутки по весу и s у.е./сутки по стоимости. В данной модели рассматривается поток грузов, в том виде, в котором он поступает на консигнационный склад, т.е. за промежуток времени ti (за i суток от начала формирования консолидируемой партии) на склад поступает груз массой mi и стоимостью si. 3. Из предположения 2 следует, что рассматриваемая задача является задачей с дискретным временем. 4. Суммарный вес груза, накопленный за первые i периодов времени (суток) консолидации, составит i
M (ti ) = M (i ) = M i = å mi , где ti = i ´ Di = i, поскольку Di = 1. j =1
В ходе дальнейшего рассмотрения будут уточнены и некоторые другие из предпосылок, сформулированных выше. Используя имеющуюся информацию, попытаемся ответить на вопрос: в каких случаях при доставке консолидированной партии грузов с консигнационного склада на СВХ следует использовать авиадоставку, а в каких – автодоставку. В схематическом виде решаемая задача может быть проиллюстрирована рисунком 1.
7
8 Схема доставки товара
Поставщик 1 Покупатель 1 АВИАДОСТАВКА ?
Поставщик 2
Консигнационный склад
Склад временного хранения, таможня
Склад фирмыимпортера
АВТОДОСТАВКА ?
Покупатель М
Поставщик N
Рис. 1
Отметим, что выражения (1) и (2) для величин t 1* и t *2 получены в [1] на основании решения задачи, в которой время, в отличие от настоящей модели, рассматривалась как непрерывная величина. В [1] при построении формул (1) и (2) также делались определенные допущения, позволяющие использовать не конкретные значения переменных и параметров, а их определенным образом усредненные значения. В настоящей работе на первом этапе мы будем использовать выражения для оптимального времени консолидации в видах (1) и (2), а затем покажем, как можно отказаться от предпосылок, сформулированных в [1]. Заранее укажем, что отказ от использования этих предпосылок приводит к существенному усложнению алгоритма решения задачи. Отметим также, что в настоящей модели уже в ее исходной постановке величина t *2 (случай автодоставки) изменяется в зависимости от значения величины Dj – стоимости доставки фуры грузоподъемностью Pj с консигнационного склада на СВХ, т.е. t *2 = (t *2 j , j=1,k) = (t *2 (Dj), j=1,k) – вектор размерности k. Сформулированная выше задача может быть решена с использованием нижеследующего алгоритма 1-5. 1. Основываясь на предыдущих рассуждениях, можно определить момент времени t**(D1,M) = ti = i, начиная с которого автодоставка груза фурой наименьшей грузоподъемности P1 и, соответственно, наименьшей стоимости D1 становится более предпочтительной, чем авиадоставка (см. рисунок 2): (3) t**(D1,M) = ti : M(ti) = Mi ³
D1 , b
или, что то же самое, t**(D1,M) = ti : b ´ Mi ³ D1 при выполнении условий: (4) Mi < P1, ti £ t 1* . Выполнение соотношения (5) Mi ³
D1 Û b ´ Mi ³ D1 b
означает, что стоимость доставки единицы веса груза способом автодоставки меньше, чем способом авиадоставки, начиная с момента t** = ti. А соотношения (4) означают, во-первых, что общий вес консолидированного груза не превосходит грузоподъемности 9
фуры наименьшей грузоподъемности – P1 и, во-вторых, время консолидации партии груза на момент t** не превысило оптимального времени консолидации при авиационном способе доставки – t 1* . 2. Формирование партии груза продолжается до тех пор, пока для какого-то момента ti = i не выполнится одно из соотношений: (6) ti = i ³ t *21 либо Mi ³ P1. 2.1. Если при этом выполняется соотношение (7) Mi ³
D2 , b
то можно продолжить накопление товара на складе с целью формирования следующей по грузоподъемности (P2) фуры до тех пор, пока не выполнится одно из соотношений (8) ti = i ³ t *22 либо Mi ³ P2, аналогичных соотношениям (6) и т.д. Этот процесс может быть продолжен до тех пор, пока при выполнении соотношений аналогичных соотношениям (6) или (8) не нарушится соотношение аналогичное соотношению (7) (см. график М1 на рисунке 2). Если при выполнении одного из соотношений (6) не выполняется соотношение (7), то следует завершить формирование фуры грузоподъемностью P1 и стоимостью D1. Аналогично следует поступать и в дальнейшем при формировании фур большей грузоподъемности – P2, P3,…, Pk-1. 3. При формировании фуры грузоподъемностью Pk (если до этого дойдет) проверка соотношения аналогичного соотношениям (5) и (7) не производится, т.к. фуры большей грузоподъемности у перевозчика отсутствуют. Ее формирование завершается при выполнении одного из условий аналогичных парам условий (6) и (8): (9) ti = i ³ t *2k либо Mi ³ Pk. 4. Если при завершении формирования фуры грузоподъемностью Pj условие (10) Mi ³ Pj выполняется как строгое неравенство, то партия (партии) товаров, прибывшая последней в фуру не загружается, поскольку, исходя из технических соображений – в целях недопущения перегруза автомашины, должно выполняться соотношение 10
(11) Mi £ Pj. Последняя (последние) из пришедших на консигнационный склад партий остается на нем, и с нее (с того времени, когда она поступила на склад) начинается формирование (отсчет времени формирования) новой консолидированной партии товаров для дальнейшей отправки на СВХ. 5. Если при формировании фуры грузоподъемностью P1 соотношение (12) ti = i ³ t 1* выполняется ранее чем соотношение (5), то процесс консолидации партии завершается, фура не формируется, а перевозка партии товара с консигнационного склада на СВХ производится способом авиадоставки.
11
12 P3
M, m
Завершено формирование фуры грузоподъемностью Р2 (оптимальный способ доставки – АВТОДОСТАВКА)
Ф3 P2
M2(t *23 )
D3 b
Ф2
M1(t *22 )
P1
mj
D2 b D1 b
Ф1
АВИА
t ** (D1,M)
t 1*
t *2 (D1)
t *2 (D2)
t *2 (D3)
t
АВИА, Ф1, Ф2, Ф3 – области решения задачи, в которых оптимальным способом доставки будет АВИАДОСТАВКА или АВТОДОСТАВКА фурами, грузоподъемностью, соответственно, Р1, Р2, Р3
Рис. 2
В продолжение рассмотрения сформулированной выше задачи покажем, каким образом в целях повышения адекватности принимаемых управленческих решений можно отказаться от предпосылок, сделанных в работе [1], на основании которых были получены оценки (1) и (2) для оптимального времени консолидации грузов на консигнационном складе для случаев авиа- и автодоставки, и получить более точные оценки этих величин. Рассмотрим выражения для накопленных к моменту ti = i суммарных относительных ожидаемых издержек по консолидированной партии товаров, которые будет нести фирма-импортер с момента поступления грузов на консигнационный склад до момента отгрузки товаров с ее собственного склада в адрес конечных покупателей. Выражения представляют собой отношения суммы издержек по обработке грузов на консигнационном складе, доставке грузов с консигнационного склада на СВХ, растаможиванию грузов и уплате штрафных санкций за несвоевременную отгрузку товаров конечным покупателям к общей стоимости товаров, вошедших в консолидированную партию на момент ti. Общий вид этих выражений (функций) для случаев авиа- и автодоставки аналогичен виду функций относительных издержек, предложенных в работе [1], и имеет вид:
H (t i ) L(t i ) R(ti ) b ´ M (ti ) + G + + + , S (ti ) S (t i ) S (t i ) S (ti ) D +G H (t i ) L(t i ) R(ti ) + + + i . (14) F2(ti, Dj) = S (ti ) S (t i ) S (t i ) S (ti ) (13) F1(ti,b) =
Переменные, входящие в выражения (13) и (14), имеют слеi
дующие смысловые значения. S(ti) = Si =
ås
i
– суммарная стои-
j =1
мость партии груза, накопленного на консигнационном складе к моменту ti за первые i периодов времени консолидации (суток). H(ti) = Hi – накопленные к моменту ti ожидаемые суммарные штрафные санкции за несвоевременную отгрузку товаров конечным покупателям по товарам, включенным в данную консолидированную партию; эта величина является оценочной и рассчитывается с учетом того, что после отгрузки с консигнационного склада до момента отгрузки конечному покупателю товары, входящие в 13
консолидируемую партию, как было указано выше, должны будут пройти еще несколько этапов продвижения (А, Б, В) как в виде единой партии, так и отдельно друг от друга. Эти этапы могут быть описаны усредненными временными характеристиками, поскольку их реализация относится к будущему времени. А) этап доставки партии товара с консигнационного склада на СВХ, характеризуемый средним временем доставки – tp2, Б) этап обработки партии на СВХ, характеризуемый средним временем tp3, В) этап обработки товаров на складе фирмы-импортера, заканчивающийся отгрузкой товара конечному покупателю, характеризуемый средним временем tp4 (для различных типов товаров время обработки, вообще говоря, различно). Отметим, что по отдельным контрактам, товары, относящиеся к которым входят в консолидированную партию, ставки штрафных санкций, вообще говоря, различны. L(ti) = Li – суммарные издержки по обработке грузов на консигнационном складе по товарам, накопленным на складе к моменту ti. R(ti) = Ri – ожидаемые суммарные издержки по растаможиванию грузов, накопленных на консигнационном складе к моменту ti (без стоимости услуг таможенного брокера), включая оплату НДС и ввозных таможенных пошлин и сборов, а также услуг СВХ. Издержки Ri определены как «ожидаемые», поскольку они на момент ti могут быть определены с существенно меньшей степенью точности, чем издержки Li. G, b, Dj – эти величины были определены выше. Укажем, что расчет величин Hi, Li, Ri является самостоятельной задачей, требующей определенной автоматизации логистических процедур, и в настоящей работе не рассматривается. В дальнейшем предполагается, что значения Hi, Li и Ri тем или иным способом вычисляются. Покажем теперь, как можно использовать функции F1(ti) и F2(ti) для определения оптимального времени консолидации грузов на консигнационном складе для случаев авиа- и автодоставки, т.е. величин t 1* и t *2 j , j=1,k, соответственно.
14
Для определения этих величин воспользуемся следующей процедурой, которую опишем для случая функции F1(ti) – для определения величины t 1* , т.е. для случая авиадоставки. 1. Вычисляются значения функции F1(ti) последовательно для значений i=1,2,…,i-1,i,i+1,… и, соответственно, продолжается консолидация партии грузов до тех пор, пока выполняются соотношения (15) F(ti-1) > F(ti) или (16) F(ti-1) > F(ti) + d, где d – наперед заданная достаточно малая безразмерная величина. 2. Как только выполняются соотношения (17) F(ti-1) £ F(ti) или (18) F(ti-1) £ F(ti) + d, то выполнение процедуры заканчивается и, соответственно, завершается консолидация партии грузов; при этом полагается, что (19) t 1* = ti. Отметим, что в случае, когда соотношение (17) выполняется как строгое неравенство, т.е. имеет место (20) F(ti-1) < F(ti), точным значением величины t 1* является ti-1. Но с практической точки зрения, поскольку величина F(ti), фигурирующая в (20), как правило, может быть определена не ранее достижения момента ti, в качестве значения t 1* приходится выбирать ti, а не ti-1 – ведь момент ti-1 уже остался в прошлом. Аналогичные рассуждения могут иметь место и при определе* нии величин t 2 j для случая автодоставки. Отметим, что применение автоматизации учета размещенных заказов может быть весьма полезным при реализации алгоритма п.1- п.5 и, в частности, при реализации п. 2.1 в привязке к только что изложенной процедуре. Информация о предстоящих поступлениях товаров на склад может быть использована при решении вопроса: продолжить ли формировании консолидированной партии грузов, ориентированной на автодоставку при достижении момента * времени t 2 j или завершить ее. Продление времени формирования 15
партии целесообразно в том случае, когда до наступления момента * t 2 j +1 ожидается поступление на консигнационный склад партий товаров такого суммарного веса, что выполнится соотношение: * (21) М(t 2 j +1 ) > Pj, т.е. станут целесообразными заказ и оплата фуры грузоподъемностью Pj+1. Укажем также, что в случае отсутствия автоматизации учета размещенных заказов или в случае, когда точное прогнозирование поступления партий товаров на консигнационный склад оказывается, по каким-либо причинам, невозможным для ответа на вопрос о * выполнимости соотношения (21) в момент t 2 j следует проверить выполнимость соотношения * * * (22) s ´ (t 2 j +1 – t 2 j ) > Pj – M(t 2 j ), где s определяется также как для выражений (1) и (2). * Если соотношение (22) выполняется, то в момент t 2 j следует продолжить формирование фуры, рассчитывая в момент t *j +1 иметь на консигнационном складе достаточно груза для заполнения фуры грузоподъемностью Pj+1. Если соотношение (22) не выполняется, то * в момент t 2 j следует прекратить формирование фуры (консолидированной партии) грузоподъемностью Pj с учетом выполнения действий, содержащихся в пункте 4 алгоритма 1-5. Только что высказанные соображения могут быть проиллюстрированы рисунком 3. В заключение рассмотрим, как решается задача определения оптимального способа доставки груза с консигнационного склада для конкретных значений параметров, представленных в таблице 1. Таблица 1 АВИА
Ф1
Ф2
Ф3
P
-
3 500
6 500
20 000
кг
D
-
2 350
2 700
3 100
у.е.
G, Gj
500
1 500
1 700
2 200
у.е.
tn
13
10
10
10
суток
b = 4 у.е./кг
16
h = 0,01
s = 5 000 у.е./сутки
Из таблицы видно, что в данном случае величина G является переменной и зависит от грузоподъемности фуры и ее стоимости. Действительно, она напрямую зависит от оценки стоимости партии типового товара аналогичного данному (например, для технологического оборудования таким аналогом могут служить определенные виды бытовой техники), который может быть доставлен фурой рассматриваемой грузоподъемности, поскольку в реальных условиях объем работы брокера напрямую связан с количеством товарных позиций и их стоимостью (в дальнейшем мы будем учитывать это соображение).
17
18
M, m
Pj+1 s ´ (t *2 j +1 -t *2 j )+M(t *2 j )
~ M (t *2 j +1 ) Pj
M(t
* 2j
~ m r
s ´ (t-t *2 j )+M(t *2 j )
) t *2 j
t *2 j +1
t
~ – вес ожидаемой партии товара m r ~ * M (t j +1 ) – ожидаемый вес накопленной партии товара к моменту t2* j +1
Рис. 3
Величина tn в реальных условиях для случаев авиа- и автодоставки также различна, поскольку при авто-доставке, следует учитывать существование задержек, связанных как с процессом ожидания прибытия фуры определенной грузоподъемности на консигнационной склад и с ее погрузкой, так и с процессом пересечения ею государственных и таможенных границ. Как правило, в рассматриваемом случае эти задержки составляют около трех суток. На эту величину и должно быть, соответственно, уменьшено значение tn для случая автодоставки – tn2 по сравнению со значением этой величины для случая авиадоставки (tn1 = tn). С учетом только что сказанного формулы (1) и (2) принимают вид (23) t 1* = +
tn21 + 2 ´
(24) t *2 = +
tn22 + 2 ´
(D j + G j ) hs (D j + G j ) hs
, .
Подставляем значения параметров для случаев авиа- и автодоставки из таблицы 1 в уравнения (23) и (24) и получаем значения для оптимальных времен консолидации грузов t1* и t2j*, которые представлены в таблице 2. Эта таблица также содержит значения
D + Gj - G Dˆ j = j , аналогичные фигурирующим в соотношениях b Dj
(5) значениям
b
для случая автодоставки, но рассчитанные с
учетом того, что стоимость услуг таможенных брокеров различна для разных способов доставки консолидированной партии и для фур различной грузоподъемности в случае автодоставки. Значения t1* и t2j* в таблице 2 округлены до целых суток, а Dˆ j – до десятков килограмм.
19
Таблица 2 АВИА
Ф1
Ф2
Ф3
Dˆ j
-
840
980
1 200
кг
*
14
16
17
18
суток
t
Полученные результаты могут быть проиллюстрированы рисунком 4. Следует отметить, что близость друг к другу значений Dˆ j – веса консолидированной партии, начиная с которого автодоставка фурой грузоподъемностью Pj становится экономически более выгодной чем авиадоставка, которое мы наблюдаем по оси M на рисунке 4, а также то, что все эти значения существенно меньше значения P1 – грузоподъемности наименьшей из фур, может свидетельствовать о следующем. Автоперевозчик знаком с условиями авиаперевозок и стремится сделать (при прочих равных условиях) автоперевозки более выгодными, по сравнению с авиаперевозками, для любых партий товара, начиная с веса партии приблизительно в 1000 килограмм. На основании полученных результатов для заданных значений параметров могут быть сделаны практические выводы, которые оформлены в виде нижеследующего алгоритма принятия решений 1-3: 1. Если за первые 14 дней (= t 1* ) формирования консолидированной партии товаров ее суммарный вес составит менее 800 кг (800 < 840 =
D1 ) и в ближайшие четыре дня (14+4=18=t *23 ) не b
ожидается поступления груза весом не менее 500 кг (800 + 500 = 1300 > 1200 =
D3 ), то следует завершить формирование консолиb
дированной партии и воспользоваться авиадоставкой для ее перевозки с консигнационного склада на склад временного хранения (СВХ). 2. Если за первые 14 дней формирования консолидированной
20
M P1=3 500
АВТО 1 500
Dˆ 3 =1 200 1 000
Dˆ 2 =980 Dˆ 1 =840
АВИА 800
t 1* =14
15
t *21 =16
21
Рис. 4
t *22 =17
t *23 =18
t
партии товаров ее суммарный вес превысит 1000 (1000 > 980 =
D2 ) и в ближайшие четыре дня ожидается поступление груза b D весом более 300 кг (1000 + 300 = 1300 > 1200 = 3 ), то можно b продолжить формирование консолидированной партии товаров еще в течение 4-х дней. Сформированную на 18-й день партию следует отправлять способом автодоставки, используя при этом фуру наименьшей грузоподъемности из тех, в которую поместится весь груз (P2 или P3). 3. Промежуточные случаи требуют отдельного рассмотрения с привлечением дополнительной информации. Условия реализации пунктов 1 и 2 данного алгоритма могут быть проиллюстрированы рисунком 4 в виде областей “АВИА” и “АВТО”, соответственно.
Литература 1.ЗАЛОЖНЕВ А.Ю., КЛЫКОВ А.Ю., ЯРУСОВА И.Н. О задаче определения оптимального периода времени консолидации грузов на консигнационном складе (в печати).
22
АКТИВНАЯ ЭКСПЕРТИЗА КЛАССА НЕСИММЕТРИЧНОСТИ МАТРИЦЫ СВЕРТКИ Беляков А.Ю. (Филиал Нижегородской академии МВД, г. Пермь), Елохова И.В., Харитонов В.А. (Государственный технический университет, г. Пермь) В настоящей статье в качестве отношения эквивалентности на множестве вариантов заполнения матрицы свертки вводится характеристика их несимметричности, ориентирующая известный механизм активной экспертизы на неманипулируемую идентификацию класса объектов комплексного оценивания. Экспертная чистота заполнения матриц mij свертки непосредственно влияет на объективность результатов комплексного оценивания. Известный механизм неманипулируемой экспертизы [1] определяется выражением *
x = max min(rk ,Wk -1 ) , k
нуждающемся в вычислении последовательности точек W=p(s(k)) для векторов сообщений n экспертов.
ìk первых экспертов сообщают N min ; s( k ) = í î( n - k ) последних экспертов сообщают N max , где k = 0, n , rkÎ[Nmin, Nmax]. mij
Множество V возможных вариантов заполнения матрицы свертки в прямой постановке не является упорядоченным и
не имеет отображения на интервале [Nmin, Nmax], обладающего свойством монотонности. Однако его можно разбить на классы по отношению эквивалентности, в качестве которого предлагается характеристика несимметричности N квадратной матрицы свертки вида
23
imax
N =å i =1
jmax
å
(mij - m ji ) , imax=jmax.
j =1 j
Тогда симметричная матрица всегда будет характеризоваться числом 0. Симметричность матриц свертки свидетельствует о полном равноправии обоих критериев. Для несимметричных относительно главной диагонали матриц свертки характеристика N всегда отлична от нуля. Это означает, что составивший ее эксперт склонен выделить один из двух критериев как доминантный (преобладающий по своей значимости) либо объективно, либо в целях манипуляции. При крайностях (рис. 1, 2) один критерий просто игнорируется, а другой становится монополистом. Х1 1 2 3 4
1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 1 2 3 4 Х2 Рис. 1. Матрица свертки при монополии критерия X1 (N=10) Х1 1 2 3 4
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 Х2 Рис. 2. Матрица свертки при монополии критерия X2 (N=10) Множество V классов (агрегированное множество V) является упорядоченным по характеристике несимметричности и поэтому позволяет построить механизм активной экспертизы по установлению класса объектов комплексного оценивания на основе специальной функции для n экспертов W ( K ) = N max - k ( N max - N min ) / n . В случае рис. 1, 2 характеристика несимметричности матрицы свертки примет крайние значения: N max = 10 , N min = -10 . Если n=5 (рис. 3), то W ( K ) = 10 - 4k . 24
10
·
W (k )
8
·
6
x
4
x
·
2
max Ä
0
min Ä ·
-2 -4
min
° min
Ä ·
-6
°min
-8 -10
1
2
3
4
·5
k
Рис. 3. Иллюстрация механизма активной экспертизы по установлению класса несимметричности объектов комплексного оценивания Благодаря ставшей возможной активной экспертизе класса несимметричности матрицы свертки объективность механизма комплексного оценивания возрастает. Литература 1. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999. – 108 с. 25
УПРАВЛЕНИЕ СБЫТОМ ПРОДУКЦИИ НА ПРИМЕРЕ ОАО «АВТОВАЗ» Богатырев В. Д. (Самарский Государственный Аэрокосмический Университет) Рассмотрим двухэлементную систему, которая описывает взаимодействие покупателей и автозавода. Здесь «покупатели» являются агрегированным участником системы и отражают совокупные доходы, предпочтения, настроения, связанные с покупкой автомобилей, всех потенциальных покупателей [4]. Производитель и покупатели являются независимыми участниками системы. Описываемая модель является простейшей, так как в ее рамках не учитываются многие факторы (несогласованность взаимодействия с поставщиками комплектующих изделий и сырья, качество продукции, гарантийное обслуживание). Но, с другой стороны, на ее примере можно проследить многие закономерности управления подобными системами с тем, чтобы использовать их при переходе к более сложным моделям. В изучаемой системе стратегия автозавода – это выбор объема реализуемых по месяцам автомобилей x = ( x1 ,..., xn ,..., xN ) Î X , обеспечивающих максимум прибыли F ( p, x ) , а для покупателей – объем покупок по месяцам y = ( y1 ,..., yn ,..., y N ) Î Y с целью получения максимальной полезности (удовлетворения). Будем считать, что автозавод и покупатели взаимодействуют в течение года, то есть на протяжении 12 месяцев ( N = 12) , цены на автомобили устанавливаются производителем ежемесячно: p = ( p1 ,..., pn ,..., pN ) Î P . Определим Q ( p ) – множество решений игры как множество точек максимума целевой функции покупателей. Множество решений игры отражает предположения автозавода о поведении покупателей при заданном управлении (ценах на продукцию). Далее, автозавода должен конкретизировать свои предположения о стратегиях, выбираемых покупателями из множества решений игры. Наиболее часто применяются два «предельных» подхода – метод 26
максимального гарантированного результата (МГР), при использовании которого автозавод рассчитывает на наихудший для него выбор покупателей, и гипотеза благожелательности (ГБ), в рамках которой покупатели выбирают из множества решений игры наиболее предпочтительные с точки зрения производителя действия [2]. Далее будем считать выполненной гипотезу максимального гарантированного результата. При этом задача управления системой заключается в поиске допустимого управления (цен на продукцию), максимизирующего целевую функцию производителя: p* Î Arg max min F ( p, y ) , pÎP yÎQ ( p )
то есть управления, имеющего максимальную эффективность K ( p ) = min F ( p, y ) . yÎQ ( p )
В общем случае, когда автозавода выбирает комплексный механизм управления g Î G , задача будет следующей:
K ( g ) = min F ( g , y ) ¾g¾ ¾ ® max . ÎG yÎQ ( g )
Другими словами производитель выбирает экономический механизм управления взаимодействием в системе g Î G , обеспечивающий такие продажи продукции по месяцам y Î Q (g ) , что достигается максимум прибыли F ( g , y ) по итогам года. Задача синтеза механизма управления сбытом представляет собой нестандартную задачу математического программирования, в ней необходимо найти максимум функции по используемому механизму управления при минимуме функции по объему продаж, причем объем продаж определяется выбранным механизмом управления. Решение данной задачи разобьем на два этапа: 1) найдем максимальное значение целевой функции автозавода и объем выпуска x 0 , который обеспечивает максимум, при отсутствии механизма управления сбытом и при условии, что весь объем, предлагаемый производителем, будет куплен: x 0 = Arg max F ( x ) , F max = F ( x 0 ) ; xÎX
27
2) на втором этапе найдем механизм управления сбытом g 0 , который обеспечит производителю согласованный сбыт, когда продажи совпадают с плановым объемом выпуска x 0 : min0 F ( g 0 , y ) = F ( x 0 ) . yÎQ ( g )
Задача первого этапа, связанная с выбором плана производства, является довольно распространенной и относится к разряду стандартных задач математического программирования [3]. Задача второго этапа, представляющая собой поиск механизма управления сбытом, сводится к выбору изменений или к установлению ряда параметров системы, которые приводят к согласованию сбыта, когда потребители покупают такой объем продукции, который совпадает с плановым объемом производителя [1]. Причем изменение параметров системы в n-ом месяце на величины Drn должно приводить к изменению покупок потребителей на величину Dyn ( Drn ) = - Dyn , где Dyn = yn0 - xn0 - дефицит автомобилей, если
Dyn > 0 , или избыток, если наоборот. Следовательно, задача второго этапа сводится к определению параметров, которые необходимо изменять для согласования сбыта, а также к определению области (верхних и нижних границ) выбора этих параметров. Для реализации условия, когда устанавливаемый автозаводом план производства является выгодным для населения и вся продукция будет распродана, возникает необходимость в количественной оценке противоречия между производителем и потребителями. Решение этой подзадачи должно базироваться на том, что эффект, получаемый производителем от согласованных продаж должен превышать его потери, связанные с реализацией механизма управления сбытом. Предположим, что, решая задачу оптимального объема выпуска автомобилей, производитель выбирает следующий план помесячного производства x 0 = ( x10 ,..., xn0 ,..., xN0 ) , обеспечивающий ему максимум прибыли. В тоже время, потребители, решая задачу потребительского выбора, решают приобрести следующее количе28
ство продукции:
y 0 = ( y10 ,..., yn0 ,..., y N0 ) . В том случае, если
x 0 = y 0 , то сбыт продукции является согласованным. Однако на практике такая ситуация встречается редко. Обычно автозавод стремится выпускать равномерно распределенный по месяцам объем продукции при максимальной загрузке мощностей, а потребители предпочитают совершать покупки сезонно в зависимости от располагаемого дохода и ряда других факторов, следовательно, данное равенство не выполняется и сбыт не является согласованным. В случае наличия сезонности при выборе механизма управления сбытом необходимо учесть то, что в одни месяцы может быть дефицит, а в другие – избыток продукции. Поэтому согласование сбыта продукции нужно рассматривать отдельно для каждого месяца. Величину целевой функции производителя в n-ый месяц F n ( pn , xn ) при отсутствии согласованного сбыта можно определить, если объем продукции xn принять равным yn0 . Обозначим значение целевой функции автозавода при объеме выпуска продукции равной yn0 через F n ( pn , yn0 ) . Тогда величина разности:
DF n ( pn , xn0 , yn0 ) = F n ( pn , xn0 ) - F n ( pn , yn0 ) характеризует дополнительный эффект, который может получить автозавод, если сможет наладить сбыт продукции так, чтобы реализовать ее всю в соответствии с месячным плановым графиком. Определим потери потребителей, если они начнут совершать покупки не в соответствии с собственными предпочтениями, а в соответствии с планом производителя. Подставим плановую величину объема реализуемой продукции xn0 , определенную производителем, в целевую функцию покупателей n -го месяца un ( pn , yn ) и получим ее значение un ( pn , xn0 ) . Рассчитаем величину разности в n -ый месяц: Dun ( pn , xn0 , yn0 ) = un ( pn , yn0 ) - un ( pn , xn0 ) . Полученная величина разности характеризует потери полезности потребителей при совершении покупок в соответствии с графи29
ком производителя, определенных им на основе своей целевой функции. Если величина разности больше нуля ( Dun ( pn , xn0 , yn0 ) > 0) , то между автозаводом и потребителями существуют противоречия, и чем больше эта величина, тем глубже между ними противоречия. Для согласования интересов необходимо, чтобы целевая функция потребителей при покупках, реализуемых в соответствии с планом производителя, была не меньше, чем при самостоятельном выборе объема продукции u n ( y n0 ) . Это возможно осуществить путем выбора механизма управления сбытом g = g ( Dr, u, F ) Î G , который реализует изменение ряда параметров системы r Î R на величины Dr Î R , например, это может быть изменение цены, либо изменение комплектности автомобилей, срока гарантии и т.д. Кроме того, предполагается, что целевые функции потребителей и автозавода зависят от этих параметров r Î R , то есть u ( r, p, y ) и F ( r, p, x ) . Изменения параметров в n -ом месяце Drn Î Rn , реализуемые механизмом управления сбытом, должны удовлетворять следующему требованию – они должны обеспечивать прирост функции полезности потребителей Du n ( Drn ) по величине не меньше, чем потери. То есть, если обозначить изменение параметров системы в n -ом месяце, реализуемых механизмом управления g = g ( Dr, u, F ) Î G , как вектор Drn = ( Dr1n ,..., Drmn ,..., DrMn ) , а в течение года – как матрицу Dr = Drrn
n =1,..., N m =1,..., M
, то этот вектор в n -
ом месяце должен удовлетворять неравенству:
Dun ( Drn ) ³ Dun ( pn , xn0 , yn0 ) , æ ¶un ( rn , pn , xn0 ) ö , Drn ÷÷ , M - количество параметров, ¶rn è ø используемое механизмом g . Если механизм управления сбытом g предусматривает, что
где Dun ( Drn ) = çç
изменяться должен только один параметр - цена на продукцию, то 30
матрица изменения параметров системы примет вырожденный вид и станет вектором изменения цен Dr = Dp = (Dp1 ,..., Dpn ,..., Dp N ) , а условие покрытия потерь потребителей в n -ом месяце будет следующим: Dun ( Dpn ) ³ Dun ( pn , xn0 , yn0 ) , где
Dun ( Drn ) = Dun ( Dpn ) =
¶un ( pn , xn0 ) × Dpn . ¶pn
Однако для реализации согласованного сбыта продукции необходимо, чтобы затраты производителя при использовании механизма управления сбытом не превышали величину дополнительного эффекта: DF n ( pn , xn0 , yn0 ) ³ DF n ( Drn ) ,
æ ¶F ( r , p , x 0 ) ö DF n ( Drn ) = çç n n n n , Drn ÷÷ ¶rn è ø или при использовании только ценового механизма DF n ( pn , xn0 , yn0 ) ³ DF n ( Dpn ) ,
DF n ( Dpn ) =
¶F n ( pn , xn0 ) × Dpn . ¶pn
Таким образом, если механизм управления сбытом для n -го месяца одновременно удовлетворяет обоим неравенствам и существует область DRn :
ìï Dun ( Drn ) ³ Dun ( pn , xn0 , yn0 ), üï (1) DRn = íDrn Î Rn ý, DF n ( pn , xn0 , yn0 ) ³ DF n ( Drn ) ïþ ïî то в системе возможна реализация согласованного сбыта продукции, а если эта область существует во всех месяцах, то согласованный сбыт возможен в течение всего календарного года DR = ( DR1 ,..., DRn ,..., DRN ) . Отсутствие области DRn для изменения параметров означает, что в сложившихся условиях невозможно, например, относительно цен продукции, комплектности, сроков гарантии на них и других параметров, осуществить согласованный сбыт в n -ом месяце. 31
Если для моделирования спроса используется не функция полезности, а функция спроса в виде y = f ( r, d , p, p0 ) , то условие реализации согласованного сбыта продукции будет следующим:
ìï ïî
(2) DRn = íDrn Î Rn
üï ý, DF n ( pn , x , y ) ³ DF n ( Drn ) ïþ Dyn ( Drn ) = - Dyn , 0 n
0 n
где Dyn = yn0 - xn0 - несогласованный объем сбыта (дефицит или излишек автомобилей, выпускаемых автозаводом в n -ом месяце);
¶yn ( rn , d n , pn , p0 n ) - чувствительность спроса к изменению пара¶rn æ ¶yn ( rn , d n , pn , p0n ) ö , Drn ÷÷ ¶rn è ø
метров на величину Drn ; Dyn ( Drn ) = çç
изменение спроса при изменении параметров на величину Drn ; d вектор ежемесячных доходов населения; p0 - индекс потребительских цен. Таким образом, задача второго этапа по определению области выбора параметров DR = ( DR1 ,..., DRn ,..., DRN ) решена в виде (1) и (2). Но для получения окончательного решения задачи по выбору механизма управления сбытом необходимо еще подобрать сами параметры, которые будут изменены или установлены. Маркетинговые исследования, проведенные на ОАО «АВТОВАЗ» показывают, что для управления сбытом недостаточно изменять цену на автомобили. Нужен комплексный подход – управление необходимо осуществлять путем выбора целого ряда независимых параметров системы сбыта. Результаты проведенного на ОАО «АВТОВАЗ» анализа показали, что предложенный в статье механизм управления сбытом должен включать в себя следующие процедуры: - формирование ценового диапазона, в котором выбирается цена Pn на автомобиль; - определение базовой цены на автомобиль p n в n -ый месяц; 32
- расчет плана выпуска продукции – объема предложения по месяцам xn , обеспечивающего заводу максимум годовой прибыли; - определения корректирующих коэффициентов для цен по региональным поясам k ni ; - распределения объемов предложения по регионам xnij ; - определение процентов вознаграждения от объема продаж дилерам и дистрибьюторам a и b ; - определение комплектации автомобилей по месяцам I n ; - определение размера процентной ставки при продаже в кредит, которую компенсирует банку автозавод g n . В заключении необходимо отметить, что в статье было предложено двухэтапное решение задачи выбора механизма управления сбытом продукции. Первый этап – формирование производителем плановых объемов выпуска, обеспечивающих ему максимум годовой прибыли. Второй этап - выбор механизма управления сбытом, реализующего согласованный сбыт, то есть совпадение покупок с плановым объемом выпуска путем изменения или установки ряда параметров. Для предложенного механизма управления сбытом в статье был выбран целый ряд соответствующих параметров на примере ОАО «АВТОВАЗ». Разработанный автором подход является легким в понимании и удобным в использовании на практике руководителями, принимающими решения, различных уровней иерархии. Литература 1. Богатырев В.Д. Модели механизмов взаимодействия в активных производственно – экономических системах. Самара: СНЦ РАН, 2003. 2. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. М.: Синтег, 1999. 3. Интрилигатор М. Математические методы оптимизации и экономическая теория / Пер. с англ. Г. И. Жуковой, Ф. Я. Кельмана. М.: Айрис-пресс, 2002. 4. Маркетинг / Под общ. ред. В. И. Видяпина. СПб.: Питер, 2004. 33
СТИМУЛИРОВАНИЕ В ОРГАНИЗАЦИОННОЙ СИСТЕМЕ С НЕДОБРОСОВЕСТНЫМ ПОВЕДЕНИЕМ АГЕНТА Р.А. Выборнов (Институт проблем управления РАН, Москва) Рассмотрим организационную систему, состоящую из одного центра и одного агента. Целевая функция центра: (1) Ф(s , y ) = H ( y ) - s ( y ) . Целевая функция агента: (2) f (s , y ) = s ( y ) - c( y, r ) . Здесь y – действие, выбираемое агентом; y ³ 0 , y Î A , A – множество допустимых действий агента; c( y ) – затраты агента на совершение действия; непрерывная функция, c ¢( y ) ³ 0 , c(0) = 0 ; s ( y ) – стимулирование агента; H ( y ) – доход центра, непрерывная функция, H ( y ) ³ 0 , H (0) = 0 ; r – тип агента, r Î W , W – множество возможных типов агента. Порядок функционирования системы следующий: центр назначает систему стимулирования s ( y ) , после чего агент выбирает действие y в условиях гипотезы рационального поведения, т.е. стремясь максимизировать свою целевую функцию. Если центру не известен тип агента, недобросовестность агента проявляется в том, что он может предоставить центру недостоверную информацию s Î W о своем типе, и, следовательно, о затратах c( y, r ) . Пусть c r' ( y , r ) £ 0 , тогда агент будет сообщать центру s £ r . Содержательно это означает, что агент в сообщении центру будет занижать свой тип, завышая тем самым затраты по совершению действия. Если центр использует принцип максимального гарантированного результата (МГР) или просто верит сообщению агента, то, следуя принципу компенсации затрат (стимулирование в точности должно равняться сумме затрат агента и резервной полезности [1]), стимулирование центра при этом возрастает. 34
Будем также считать, что центр назначает агенту квазикомпенсаторную систему стимулирования, то есть вознаграждение выплачивается агенту только при точном выполнении назначенного центром плана x Î X = A :
ìc( y, s ), y = x , î0, y ¹ x
(3) s ( x, y, s ) = í
где X – множество допустимых планов. Можно отметить, что при использовании системы стимулирования (3) сразу встает вопрос о неманипулируемости, то есть создании такой системы управления, при которой агенту выгодно было бы сообщать центру свой действительный тип. Проблема манипулируемости представляет практический интерес в теории активных систем и является предметом многочисленных исследований [2]. Однако обсуждение этой проблемы выходит за рамки нашего исследования. Естественно, в интересах центра обнаружить искажение информации. Для достижения этой цели центр с некоторой вероятностью p проводит аудит фиксированной стоимости c~ . Будем считать, что, если аудит проводится, то искажение информации агента s < r о своем типе всегда обнаруживается, то есть, в случае аудита центр наблюдает тип агента. В этом случае на агента накладывается штраф c ( r - s ) . Таким образом, ожидаемые значения целевых функций участников: (4) Ф(s , y ) = H ( y ) - c( y , s ) - c~p + pc ( r - s ) , (5) f (s , y ) = c( y, s ) - c( y, r ) - pc (r - s ) . Следует пояснить вид целевой функции агента: поскольку агент занижает свой параметр r , завышая тем самым свои расходы (а центр компенсирует агенту расходы) по отношению к фактическим расходам по совершению действия, то разница c( y, s ) - c( y, r ) представляет собой не что иное, как сумму, на которую агент обманывает центр. Еще раз оговорим порядок функционирования системы и информированность участников: 1) общим знанием является: H (×), c(×), c (×), p, W, A и стоимость аудита c~ ; 35
2) центр определяет вероятность аудита p и сообщает ее агенту; 3) агент сообщает центру свой тип s ; 4) центр назначает агенту план x и стимулирование (3); 5) агент выбирает действие y ; 6) центр выплачивает агенту вознаграждение в соответствие с (3); 7) с вероятностью p проводится аудит. Следует также отметить, что в зависимости от поведения центра в отношении вероятности аудита p можно выделить три задачи. В нашем случае центр объявляет вероятность аудита. Также центр может не объявлять p , выбирая стратегию МГР по этому параметру. Третий вариант – центр может объявить агенту не вероятность p , а функцию p (s ) . Обсуждение указанных вариантов поведения центра приведено ниже. При использовании системы стимулирования (3) агенту выгодно выполнять план: y = x . Для доказательства этого утверждения достаточно заметить, что, в точности выполняя план, агент получает полезность c( y, s ) - c( y, r ) - pc(r - s ) ; отклоняясь же от плана, агент получает полезность - c( y, r ) - pc (r - s ) , что заведомо ему невыгодно, так как "y, "s : c( y, s ) ³ 0 . Центр назначает агенту оптимальный для себя план x * (s ) , решая следующую задачу: min{Ф( x, p, s )} ® max , то есть: r ÎW
xÎ X
(6) min{H ( x) - c( x, s ) - c~p + pc (r - s )} ® max . rÎW
xÎ X
Агент выбирает оптимальное для себя сообщение s * ( p, r ) центру о своем типе, решая следующую задачу: * f ( x ( s ), s, r ) ® max , то есть: sÎW
*
(7) c( x ( s ), s ) - c( x * ( s ), r ) - pc (r - s ) ® max . sÎW
Далее, центр оптимизирует свою целевую функцию по вероятности проведения аудита p , решая следующую задачу:
min{Ф( x* ( s* ( p, r )), r ), p, s * ( p, r ))} ® max , то есть: r ÎW
pÎ[ 0 ,1]
*
(8) min{H ( x ( s ( p, r ))) - c( x ( s ( p, r ))), s * ( p, r )) rÎW
36
*
*
*
– c~p + pc ( r - s* ( p, r ))} ® max . pÎ[ 0 ,1]
Решить такую задачу аналитически в общем виде представляется затруднительным, поэтому положим: H ( y ) = y ;
c (r - s ) = a (r - s ) , тогда: из (6) находим назначаемый агенту план: x * ( s ) = s , из (7) находим оптимальное сообщение агента: s * ( p, r ) = (1 / 2 + ap )r . c ( y , r ) = y 2 / 2r ;
Поскольку, как предполагалось выше, агент предоставляет центру искаженную информацию s £ r о своем типе, то оптимальное сообщение агента в данном случае: * s ( p, r ) = min[(1 / 2 + ap )r ; r ] . Следовательно, справедливо следующее утверждение. Утверждение 1. Для того чтобы агент сообщал центру достоверную информацию, достаточно выполнения неравенства (9) a p ³ 1 / 2 . Содержательно это означает, что, выбирая систему штрафов и вероятность проведения аудита (и сообщая эту информацию агенту), удовлетворяющую (9), центр может добиться неманипулируемости, т.е. сообщения агентом достоверной информации о своем типе. Кроме того, здесь следует заметить, что при выполнении условия (9) агент будет сообщать достоверную информацию о своем типе, поэтому никаких проверок центру проводить не потребуется. Следовательно, далее мы будем рассматривать условия, при которых (9) не выполняется, т.е. p < 1 / 2a . Из (8) находим оптимальную вероятность проведения аудита, решая следующую оптимизационную задачу: (10) min[r (1 / 4 + ap - a 2 p 2 ) - c~p ] ® max . rÎW
pÎ[ 0 ,1]
Пусть множество возможных типов агента W = [ r - , r + ] , то есть центру известны минимальный и максимальный типы агентов. Тогда оптимизационную задачу можно представить в следующем виде:
37
ì[r + (1 / 4 + ap - a 2 p 2 ) - с~p] ® max , (1 / 4 + ap - a 2 p 2 ) £ 0 pÎ[ 0 ;1] ï (11) í 2 2 ~ , (1 / 4 + ap - a 2 p 2 ) ³ 0 ïî[r (1 / 4 + ap - a p ) - c p] ® max pÎ[ 0 ;1] Однако в силу утверждения 1 мы рассматриваем ap < 1 / 2 , и множеством решений первого неравенства системы (11) является пустое множество, поэтому далее мы будем рассматривать только оптимизационную задачу и второе неравенство системы (11). Решая неравенство системы (11) относительно p , получаем следующий вид оптимизационной задачи: (12) [r - (1 / 4 + ap - a 2 p 2 ) - c~p ] ® max , p Î [0;1 / 2a ] . pÎ[ 0;1]
Решая (12), получаем, что оптимальная вероятность проведения аудита имеет вид: (13) p * = (ar - - c~ ) / 2a 2 r - , p Î [0;1 / 2a ] Представим схематически полученное решение (13) на рисунке 1. P
P*
а)
a
б)
а
Рис. 1. Оптимальное решение (13) На рисунке 1а) представлены эскизы графиков функций p = (ar - - c~ ) / 2a 2 r - и p = 1 / 2a . Легко проверить, что друг относительно друга они будут располагаться именно так, поскольку для пересечения необходимо выполнение условия с~ £ 0 , что не имеет содержательной интерпретации. На рисунке 1б) схематически представлен график зависимости оптимальной вероятности проверки агентов от коэффициентов штрафа. *
38
Итак, в рассматриваемой модели центр может выбрать вероятность проведения аудита и коэффициент штрафа таким образом, что агенту будет выгодно сообщать свой истинный тип, т.е. добиться неманипулируемости. Если же по каким-либо причинам центр не имеет возможности объявить такие параметры (например, a превышает законодательно установленный коэффициент штрафов), то центр выбирает вероятность проведения аудита, максимизируя свою целевую функцию так, как показано в модели. В этом случае доход центра может оказаться больше, чем при честном поведении агента. Литература 1. НОВИКОВ Д.А. Стимулирование в организационных системах.
М.: СИНТЕГ, 2003. – 312 с. 2. НОВИКОВ Д.А., ПЕТРАКОВ С.Н. Курс теории активных
систем. М.: СИНТЕГ, 1999. – 108 с.
39
РЕПУТАЦИЯ ФИРМ С ТОЧКИ ЗРЕНИЯ ПОТРЕБИТЕЛЕЙ Н.С. Ермаков, А.А. Иващенко1 (Самарский государственный аэрокосмический университет, Самара; Институт проблем управления РАН, Москва) 1. Введение В настоящей работе строится и исследуется модель неценовой конкуренции между фирмами, в рамках которой при фиксированном суммарном спросе и рыночной цене спрос на продукцию каждой фирмы пропорционален ее репутации в глазах потребителей. Стратегией каждой фирмы является объем инвестиций в создание и поддержание репутации. Результаты теоретикоигрового моделирования свидетельствуют о том, что репутация, наряду с себестоимостью производства, является существенным фактором, определяющим равновесное распределение прибылей между фирмами. 2. Статическая модель Рассмотрим неценовую конкуренцию между фирмами. Если спрос на продукт (или услугу), производимый фирмами, постоянен, а цена фиксирована, то единственным фактором, которым та или иная фирма может привлечь потребителя, является ее репутация [1], под которой понимается агрегированная характеристика деятельности фирмы. В этом случае репутация включает все характеристики продукта, кроме цены – его надежность, качество и т.д., а также условия взаимодействия с потребителем (выполнение взятых обязательств – сроков и других условий). Рассмотрим следующую модель. Путь имеется n фирм, производящих однородный продукт или услугу. Затраты i-ой фирмы (агента) ci(di) представляют собой сумму постоянных издержек ci0 и переменных издержек gi di, где gi – удельные переменные издержки, а di – объем производства, определяемый спросом, i Î N = {1, 2, …, n} – множеству агентов. То есть ci(di) = ci0 + gi di, 1
Статья написана совместно с Д.А. Новиковым.
40
i Î N. Если рыночная цена l фиксирована, то легко определить точки безубыточности dimin = ci0 / (l – gi), i Î N. Пусть ri ³ 0 – репутация i-го агента. Обозначим вектор репутаций r = (r1, r2, …, rn), вектор репутаций оппонентов i-го агента – r-i = (r1, r2, …, ri-1, ri+1, …, rn) Î Ân+ -1 . Предположим, что спрос на продукцию i-ой фирмы определяется ее репутацией, а также репутацией конкурентов и суммарным спросом, то есть di = pi(r, D), i Î N. Наложим на pi(×) следующие требования: - " r Î Ân+ pi(×) возрастает по ri; - " r Î Ân+ pi(×) возрастает по D; - " r Î Ân+ , " j ¹ i pi(×) убывает по rj. В соответствии с введенными предположениями, чем выше репутация фирмы или чем выше суммарный спрос, тем выше спрос на ее продукцию, и чем выше репутация конкурентов, тем этот спрос меньше. То есть в рассматриваемом случае спрос на продукцию фирмы определяется ее репутацией в глазах потребителей. Вектор спроса обозначим d = (d1, d2, …, dn). Фиксируем суммарный спрос D, и предположим, что dimin , (1) D ³
å
iÎN
и существует вектор репутаций rmin, приводящих к dimin = pi(rmin, D), то есть существует такое распределение спроса между фирмами, что деятельность всех фирм безубыточна. Предположим, что репутация агента зависит от его затрат на создание и поддержание репутации. Затраты i-го агента на свою репутацию (инвестиции в репутацию) обозначим si ³ 0, i Î N. Величина si может интерпретироваться как выигрыш агента от невыполнения обязательств перед потребителями, допустимого снижения качества и т.д., или как инвестиции в рекламу. Пусть известна монотонная функция q(s), отражающая зависимость репутации от затрат на нее: ri = q(si), i Î N. Для простоты эта функция будет считаться одинаковой для всех агентов. Тогда целевая функция i-го агента примет вид: (2) fi(s) = (l – gi) pi(r(s), D) – ci0 – si, i Î N. 41
Итак, имеем игру агентов, обладающих целевыми функциями (2), каждый из которых выбирает неотрицательные инвестиции в свою репутацию. Если функция q(×) непрерывна, а функции pi(×) непрерывны по совокупности переменных и вогнуты по ri, то при фиксированном суммарном спросе, удовлетворяющем (1) существует равновесие Нэша игры агентов. Справедливость данного утверждения следует из того, что в рамках введенных в нем предположений целевые функции агентов удовлетворяют известным достаточным условиям существования равновесия Нэша. Пример 1. Пусть q(s) = s и (3) di =
ri
år
D, i Î N. j
jÎN
Обозначим S =
1
ås , b = å b -g
. Подставляя (3) в (2) и
i
iÎN
iÎN
дифференцируя, получим: si = S –
i
S2 , i Î N. D( l - g i )
Суммируя по всем агентам, получим выражения для суммарных инвестиций и равновесных по Нэшу инвестиций агентов в свою репутацию: S = (n – 1) D / b,
si* =
n -1 ( n - 1) D [1 – ], i Î N. b b (l - g i )
Завершив рассмотрение примера, отметим, что выше рассматривалась статическая модель. В то же время, интуитивно понятно, что репутация является существенно динамической характеристикой – она изменяется во времени, причем инерционно, то есть, требуется время, чтобы при приложении соответствующих усилий фирма улучшила свою репутацию, а при отсутствии стремления фирмы к поддержанию своей репутации, последняя начнет также снижаться с некоторой задержкой. Поэтому рассмотрим динамическую модель конкуренции фирм с изменяющейся во времени репутацией.
42
3. Динамическая модель Будем обозначать номер периода времени верхним индексом "t" и считать, что зависимость спроса то репутации имеет вид: (4) d it =
( rit )a D, i Î N, t = 0, 1, 2, … , å ( rjt )a jÎN
где d
t i
– спрос на продукцию i-ой фирмы в периоде t, ri t – ее
репутация в этом периоде, а показатель степени a ³ 1 может интерпретироваться как характеристика конкурентности (степени влияния различий репутации фирм на спрос на их продукцию со стороны потребителей) – при больших a почти все потребители обратятся фирме с максимальной репутацией. Предположим, что в условиях фиксированного суммарного спроса D и заданной рыночной цены l, единственным параметром, который выбирает i-ый агент является объем инвестиций si в свою репутацию. Отметим, что считается, что каждый агент выбирает постоянный (не зависящий от времени) объем инвестиций. Возможные обобщения рассматриваемой модели на случай, когда каждый агент выбирает траекторию инвестиций, качественно обсуждается ниже. Динамику репутации будем описывать логистической кривой с управляемой скоростью роста [3]: (5) ri t = ri t -1 + Q( si0 , si) ri t -1 (1 – ri t -1 ), i Î N, t = 1, 2, …, . Пусть начальные значения репутации ri 0 Î [0; 1] агентов известны, а Q(×) – одинаковая для всех агентов монотонно возрастающая функция, принимающая значения из интервала [-1; 1]. Величина si0 , которая такова, что Q( si0 , si0 ), может интерпретироваться как значение инвестиций, необходимое для поддержания репутации i-го агента на постоянном уровне. В рамках введенных предположений ri t Î [0; 1], i Î N, t = 1, 2, …, . Эскиз графика зависимости скорости динамики репутации от времени для (6) Q( si0 , si) = th (Y(si – si0 )), 43
где th(×) – гиперболический тангенс, Y ³ 0 – размерная константа, приведен на рисунке 1 при s0 = 1, Y = 1. 1 0.8 0.6 0.4 0.2
Q(s)
s
0 -0.2 -0.4 -0.6 -0.8 -1
0.5
1
1.5
2
2.5
3
Рис. 1. Зависимость скорости динамики репутации от времени Примеры динамики репутации агента для случая Y = 10, s0 = 0,1 приведены на рисунке 2. Непрерывная линия соответствует r0 = 0,2, s = 0,11 (то есть агент вкладывает в свою репутацию больше минимально необходимой величины и она растет со временем), пунктирная – r0 = 0,95, s = 0,09 (то есть агент вкладывает в свою репутацию меньше минимально необходимой величины и она убывает со временем). r(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
5
9
13 17 21 25 29 33 37 41 45 49 53 57 61 65 69
Рис. 2. Примеры динамики репутации 44
В качестве обоснования введенных предположений можно привести следующие рассуждения. Возможность наличия отрицательных значений функции Q(×) – см. рисунок 1 – обусловлена тем, что поддержание репутации на постоянном уровне, отличном от нуля или единицы, как правило, требует определенных затрат. Если эти затраты недостаточны, то репутация снижается. Вогнутость (и асимптотичность) функции Q(×) объясняется тем, что предельный эффект от увеличения инвестиций снижается с ростом размера этих инвестиций (см. закон убывающей предельной полезности в экономике [6]). Логистический вид кривой динамики репутации – см. рисунок 2 – может интерпретироваться следующим образом. Сначала изменение репутации происходит медленно (изменить сложившиеся стереотипы потребителей тяжело). Далее скорость увеличивается, но по мере приближения к максимально (или минимально) возможному значению опять уменьшается – всегда имеется часть потребителей, заставить которых изменить своим привычкам (отказаться от потребления некоторого товара, заменив его другим, и т.д.) достаточно трудно. Конечно, выбранные выше зависимости (5) и (6) не являются единственно возможными, и в каждом конкретном случае необходимо решать задачу идентификации – поиска тех зависимостей, которые наилучшим образом приближают или объясняют наблюдаемые эффекты. Однако они позволяют промоделировать многие эффекты и вполне соответствуют здравому смыслу и практическому опыту. Запишем прибыль i-го агента в периоде t: (7) f i t (s) = (l – gi) pi(r(st), D) – ci0 – si, i Î N, t = 1, 2, …, , где s = (s1, s2, .., sn) – вектор инвестиций агентов. Будем считать, что, если прибыль агента стала равна нулю или отрицательному числу, то он выбывает с рынка и, начиная с этого момента, не несет затрат на поддержание своей репутации. В качестве целевой функции выберем среднюю за T периодов прибыль: (8) Fi(s) =
1 T
T
åf
t i
( s ) , i Î N.
t =1
45
Подставляя (4)-(7) в (8), получим игру в нормальной форме, в которой каждый агент выбирает объем своих инвестиций. Для данной игры можно искать равновесие Нэша, исследовать его свойства, анализировать выигрыши агентов в зависимости от их стратегий. Приведем пример. Пример 2. Рассмотрим взаимодействие двух агентов (все расчеты настоящего примера выполнялись в Excel). Пусть a = 1, Y = 10, d = 1, s10 = 0,1, s20 = 0,2, l – g1 = 1, l – g2 = 1,3, ci1 = ci2 = 0. Рассмотрим несколько типичных вариантов. 1. Пусть r10 = r20 » 1, s1 = s2 = 0, то есть оба агента первоначально имеют одинаковую очень высокую репутацию и делят рынок пополам. Но они не инвестируют свою репутацию. Так как в силу выбранного соотношения параметров репутация второго агента падает быстрее, чем у первого, в результате первый агент с нулевой репутацией оказывается монополистом на рынке. Графики динамики репутации, доли рынка и прибыли для рассматриваемого случая приведены на рисунках 3а), 3б) и 3в) соответственно (здесь и далее в рассматриваемом примере пунктирная линия соответствует первому агенту, а непрерывная линия – второму). r 1(t), r 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 3а) Динамика репутации при r10 = r20 » 1, s1 = s2 = 0 46
d1(t), d 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 3б) Динамика доли рынка при r10 = r20 » 1, s1 = s2 = 0
f1(t), f 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 3в) Динамика прибылей при r10 = r20 » 1, s1 = s2 = 0 Аналогичная ситуация (первый агент становится монополистом) имеет место в случае любых одинаковых первоначальных репутаций агентов и отсутствии инвестиции. Объясняется это тем, что первый агент априори находится в более выгодном положении, так как он теряет репутацию медленнее второго. 47
Чтобы исправить ситуацию (стать в итоге монополистом) второму агенту достаточно выбрать размер инвестиций s2 таким, чтобы s20 – s2 > s10 – s1 = 0,1, то есть, ему следует выбирать s2 > 0,1. Приведем пример. 2. Пусть r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,11. В результате второй агент с нулевой репутацией оказывается монополистом на рынке. Соответствующие графики приведены на рисунках 4а), 4б) и 4в). r 1(t), r 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 4а) Динамика репутации при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,11 1 2 1 d (t), d (t)
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 4б) Динамика доли рынка при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,11 48
f1(t), f2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 4в) Динамика прибылей при r10 = 0,5, r20 = 0,3, s1 = 0, s2 = 0,11 3. В рамках рассматриваемой модели возможно решение задач оптимизации. Например, наилучшим ответом первого агента на рассмотренное выше поведение второго агента ( r10 = 0,5, r20 = 0,3, s2 = 0,11) является выбор s1 » 0,019, что приводит к тому, что монополистом в итоге оказывается первый агент. Соответствующие графики приведены на рисунках 5а), 5б) и 5в). r 1(t), r 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 5а) Динамика репутации при r = 0,5, r20 = 0,3, s1 » 0,019, s2 = 0,11 0 1
49
1 2 1 d (t), d (t)
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 5б) Динамика доли рынка при r = 0,5, r20 = 0,3, s1 » 0,019, s2 = 0,11 0 1
f1(t), f 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 5в) Динамика прибылей при r = 0,5, r20 = 0,3, s1 » 0,019, s2 = 0,11 0 1
Отметим, что с точки зрения максимизации суммы целевых функций обоих агентов оптимален вектор инвестиций s1 = 0, s2 » 0,117, то есть в итоге монополистом выгодно сделать второго агента (объясняется это тем, что у него выше рентабельность). 50
4. В рамках рассматриваемой модели возможен поиск равновесия игры агентов. Например, при начальных условиях r10 = 0,5,
r20 = 0,3 равновесием Нэша является вектор s1 » 0,1143; s2 » 0,2226, при котором оба агента в итоге делят
рынок поровну. Соответствующие графики приведены на рисунках 6а), 6б) и 6в). r 1(t), r 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 6а) Динамика репутации при r = 0,5, r20 = 0,3, s1 » 0,1143; s2 » 0,2226 0 1
1
d1(t), d 2(t)
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 6б) Динамика доли рынка при r10 = 0,5, r20 = 0,3, s1 » 0,1143; s2 » 0,2226 51
f1(t), f 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 6в) Динамика прибылей при r = 0,5, r20 = 0,3, s1 » 0,1143; s2 » 0,2226 0 1
Для того чтобы проиллюстрировать роль параметра a (до сих пор он равнялся единице) выберем в условиях предыдущего случая a = 4. В силу более высокой начальной репутации первого агента он в итоге становится монополистом (см. рисунок 7 в сравнении с рисунком 6а)). r1(t), r 2(t)
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
t 1
7
13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Рис. 7. Динамика репутации в условиях рисунка 6а) при a = 4
52
Аналитическое нахождение векторов равновесных инвестиций агентов представляет собой достаточно сложную задачу, так равновесий может быть несколько. Заключение В заключение настоящего раздела отметим, что выше рассматривалась модель динамики репутации при постоянном во времени уровне инвестиций каждого агента в свою репутацию. Возможно обобщение полученной модели на случай, когда каждый агент выбирает траекторию si1 , si2 , …, sit , … инвестиций. Тогда задача принятия решений каждым агентом заключается в выборе оптимальной (например, максимизирующей его дисконтированную полезность) траектории. С учетом взаимосвязи агентов, получаем повторяющуюся игру [4]. Аналитический поиск решения такой игры может оказаться достаточно сложной задачей. Тем не менее, имитационное моделирование вполне возможно. При этом, однако, следует принимать во внимание, что моделирование динамических систем при помощи систем нелинейных итерированных отображений следует осуществлять с учетом неустойчивости решений по начальным данным [2, 5]. Можно надеяться, что сложные динамические модели репутации позволят имитировать такие распространенные на практике эффекты, как создание ложной репутации, использование инерционности репутации (прекратив инвестиции в свою репутацию, агент может пользоваться тем, что ее снижение происходит не сразу) и др. Кроме того, выше мы не учитывали, что, наверное, у потребителей существуют определенные пороги различения изменений репутации. Разработка подобных теоретико-игровых моделей представляется перспективной задачей будущих исследований. Литература 1. Ермаков Н.С., Иващенко А.А., Новиков Д.А. Модели репутации и норм деятельности. М.: ИПУ РАН, 2005. 2. Малинецкий Г.Г. Хаос. Структуры. Вычислительный эксперимент: введение в нелинейную динамику. М.: Наука, 1997. 3. Новиков Д.А. Закономерности итеративного научения. М.: ИПУ РАН, 1998. 53
4. Новиков Д.А. Механизмы стимулирования в динамических и многоэлементных социально-экономических системах // Автоматика и Телемеханика. 1997. № 6. С. 3 – 26. 5. Сергеева Л.Н. Моделирование поведения экономических систем методами нелинейной динамики (теории хаоса). Запорожье: ЗГУ, 2002. 6. Mas-Collel A., Whinston M.D., Green J.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995.
54
ВЛИЯНИЕ ВЗАИМНОЙ ИНФОРМИРОВАННОСТИ АГЕНТОВ НА ОПТИМАЛЬНУЮ СТРУКТУРУ ОРГАНИЗАЦИИ (БАЗОВАЯ МОДЕЛЬ) Залесов А.И. (Московский физико-технический институт)
[email protected] Введение Рассматривается базовая модель построения оптимальной структуры организации при различной информированности центра и подчиненных ему агентов. Предполагается, что центр не имеет никакой информации о параметрах агентов, а последние, в свою очередь, обладают неполной (либо, как частный случай, полной) информацией о параметрах друг друга. Центр, используя свое право модифицировать структуру организации, с помощью конкурсного механизма побуждает агентов сообщать свои истинные оценки параметров друг друга. 1. Постановка задачи Рассмотрим активную систему (АС), состоящую из центра (Ц) и двух подчиненных ему активных элементов (АЭ). Центр получает прибыль от выполнения активными элементами своих действий, и в качестве стимулирования выплачивает им вознаграждение. Каждый АЭ несет определенные затраты по выполнению действия. Затраты АЭ зависят от его типа – некоторой персональной характеристики АЭ. Пусть прибыль центра равна сумме действий активных элементов (1) H = y1 + y2 , а затраты i-го АЭ (i = 1, 2) на выполнение действия yi Î Â+ равны (2) ci (yi, ri) = yi2 / 2 ri ,
55
где ri Î Â+ – тип i-го элемента. При этом большему значению типа соответствует меньшее значение затрат на выполнение одного и того же действия. Центр может произвольно менять структуру (иерархию) АС. В случае двух элементов возможны три варианта: 1. веерная структура (когда оба АЭ подчинены непосредственно центру); 2. иерархическая структура, в которой первый АЭ подчинен центру, а второй АЭ подчинен первому (в этом случае первый АЭ называется промежуточным центром); 3. иерархическая структура, в которой второй АЭ подчинен центру, а первый АЭ подчинен второму. Активный элемент, выполняющий роль промежуточного центра, вправе назначать план и вознаграждение подчиненному элементу, распределяя полученные от главного центра план и вознаграждение между собой и другим АЭ. Каждому АЭ известен его собственный тип, также каждый АЭ имеет некоторое представление о типе другого элемента. Пусть r12 – представление первого АЭ о типе второго, r21 – представление второго АЭ о типе первого. Считается, что переменные r12 и r21 являются общим знанием, то есть: 1) каждому АЭ известны r12 и r21; 2) каждому АЭ известно 1; 3) каждому АЭ известно 2; 4) и т.д. Будем считать, что r1 ≥ r21 и r2 ≥ r12, то есть ни один из АЭ не «переоценивает» своего оппонента. В данной работе мы будем также считать, что r1 ≥ r12 и r2 ≥ r21. Это означает, что каждый АЭ полагает тип своего оппонента не большим своего собственного типа. Центр не имеет никакой информации о типах АЭ, то есть является абсолютно неинформированным. Задачей центра является назначение такого механизма функционирования АС, который позволил бы центру получить максимально возможную прибыль в условиях абсолютной неинформированности. 56
Механизм управления структурой АС В известных работах предложено несколько способов решения сформулированной в предыдущем разделе задачи центра. Самый простой способ заключается в том, что АЭ независимо друг от друга сообщают центру свои заявки – оценки собственных типов, а центр на основании этих заявок независимо назначает им планы и стимулирование. Эффективность функционирования (прибыль центра) для рассматриваемой АС не превышает при этом
r1 + r2 [4, 5]. 4 Более сложный способ основан на возможности центра изменять структуру АС. Устраивая между АЭ конкурс за право быть промежуточным центром, центр добивается увеличения эффективности функционирования АС. Например, для случая полной взаимной информированности АЭ, описанный в [3] механизм позволяет получить для рассматриваемой АС эффективность, равную эффективности функционирования при полной информированности центра –
r1 + r2 . 2
В случае неполной информированности центра о параметрах АЭ, каждый АЭ получает некоторый дополнительный выигрыш – так называемую «информационную ренту». Применяя конкурсный механизм с изменением структуры АС, мы заставляем АЭ в борьбе за право быть промежуточным центром жертвовать частью своей информационной ренты, и таким образом увеличиваем эффективность функционирования АС. Пусть центр назначает следующий механизм функционирования. Каждый АЭ сообщает свою заявку – пару величин, соответствующих типу АЭ в веерной структуре и агрегированному (суммарному в случае квадратичных функций затрат АЭ [5]) типу двух АЭ в случае назначения его промежуточным центром. Обозначим заявку первого АЭ (s1, s12), второго – (s2, s21). Исходя из сообщенных заявок, центр выбирает структуру АС и назначает планы: 57
а) если s1 + s2 ³ s12 и s1 + s2 ³ s21, то выбирается веерная структура и каждому АЭ назначается план si; б) если s12 > s1 + s2 и s12 ³ s21, то первый АЭ назначается промежуточным центром и ему назначается план s12; в) если s21 > s1 + s2 и s21 > s12, то второй АЭ назначается промежуточным центром и ему назначается план s21; Во всех случаях центр назначает агентам квазикомпенсаторное стимулирование, при котором сообщенные типы принимаются за истинные [5]. Промежуточный центр также назначает подчиненному элементу план и квазикомпенсаторное стимулирование, принимая свою оценку типа подчиненного элемента за истинную. В качестве концепции решения игры агентов при фиксированном таким образом механизме стимулирования примем информационное равновесие [8]. В рассматриваемой модели каждый АЭ знает собственный тип и считает, что знает тип своего оппонента. Таким образом, пытаясь стать промежуточным центром, любой АЭ рассчитывает лишить своего оппонента информационной ренты. Например, с точки зрения первого АЭ выигрыши элементов при реализации различных иерархий равны: 1. Веерная структура: f1 =
s1 æ s1 ö s æ s çç1 - ÷÷ , f2 = 2 çç1 - 2 2 è r1 ø 2è r2
2. Первый АЭ – промежуточный центр: f1 =
s12 2
æ s çç1 - 12 è r1 + r12
ö ÷÷ , f2 = 0. ø
3. Второй АЭ – промежуточный центр: f1=
2 s 21 r21
2(r12 + r21 )
2
æ r21 ö s æ s 21 ö çç1 - ÷÷ , f2= 21 çç1 ÷. r1 ø 2 è r12 + r21 ÷ø è
В приложении доказываются следующие теоремы:
58
ö ÷÷ ; ø
Теорема 1. Если
выполнено
r1 + r12 £ r12 + r21 2
и
r2 + r21 £ r12 + r21 , то описанный выше механизм функционирова2 ния реализует в качестве информационного равновесия иерархическую структуру со вторым АЭ в роли промежуточного центра и эффективностью (прибылью центра) (r12 + r21 + d) / 2. Теорема 2. Информационное равновесие, найденное в теореме 1, единственно в том смысле, что нет других равновесий, приводящих к другой структуре или другой эффективности функционирования. Теорема 3. Если выполнено
r1 + r12 > r12 + r21 , то заявка s1 = 0 2
r1 + r12 является субъективной доминантной стратегией 2 r + r21 £ r12 + r21 , то заявка для первого АЭ. При этом, если 2 2 второго АЭ будет s2 = 0 и s 21 = r12 + r21 + d . r + r21 Теорема 4. Если выполнено 2 > r12 + r21 , то заявка s2 = 0 2 r + r21 и s 21 = 2 является субъективной доминантной стратегией 2 r +r для второго АЭ. При этом, если 1 12 £ r12 + r21 , то заявка пер2 вого АЭ будет s1 = 0 и s12 = r12 + r21 . и s12 =
Из приведенных теорем следует, что предложенный механизм обладает следующей зависимостью эффективности от параметров зависимости от соотношений типов АЭ и их взаимных представлений: - если
r1 + r12 r +r £ r12 + r21 и 2 21 £ r12 + r21 , то эффектив2 2
ность равна (r12 + r21 + d) / 2;
59
r1 + r12 r +r > r12 + r21 и 2 21 £ r12 + r21 , то эффектив2 2 r +r ность равна 1 12 (первый АЭ выберет свою субъективную 4 - если
доминантную стратегию и станет промежуточным центром);
r1 + r12 r +r £ r12 + r21 и 2 21 > r12 + r21 , то эффектив2 2 r2 + r21 ность равна (второй АЭ выберет свою субъективную 4 - если
доминантную стратегию и станет промежуточным центром);
r1 + r12 r +r > r12 + r21 и 2 21 > r12 + r21 , то эффектив2 2 ì r + r r + r21 ü ность равна max í 1 12 , 2 ý (в этом случае оба АЭ выбе4 þ î 4 - если
рут свои субъективные доминантные стратегии, а промежуточным центром станет тот АЭ, чья заявка больше). Таким образом, элементы сообщают центру либо свои истинные представления друг о друге, либо уменьшенную в два раза сумму своего собственного типа и своей оценки типа оппонента. В последнем случае, когда фактически взаимные оценки АЭ сильно занижены, за счет сообщения искаженной информации эффективность функционирования АС выше, чем в первом. Заключение В работе предложена базовая модель построения организационной структуры при различных уровнях информированности центра и подчиненных ему агентов. Для предложенного конкурсного механизма с изменением организационной структуры найдено информационное равновесие, при котором агенты либо сообщают центру свои истинные представления друг о друге, либо, при определенных соотношениях параметрах модели, искажают их, тем не менее увеличивая эффективность функционирования организационной системы. 60
Литература 1. ГУБКО М.В., НОВИКОВ Д.А. Теория игр в управлении организационными системами. М.: СИНТЕГ, 2002. 2. ЗАЛЕСОВ А.И. Оптимальное стимулирование в активных системах с агрегированием информации. // Системы управления и информационные технологии. 2004. 1(13). С. 47 – 49. 3. ЗАЛЕСОВ А.И., КОРГИН Н.А. Неманипулируемые механизмы стимулирования в организационных системах с агрегированием информации. / Сборник докладов международной конференции «Современные сложные системы управления ». Тверь: ТГТУ, 2004. С. 286 – 290. 4. КОРГИН Н.А. Неманипулируемые механизмы обмена в активных системах. М.: ИПУ РАН, 2003 5. НОВИКОВ Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. 6. НОВИКОВ Д.А., ПЕТРАКОВ С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999. 7. НОВИКОВ Д.А., ЦВЕТКОВ А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: Апостроф, 2000. 8. НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. М.: СИНТЕГ, 2003. 9. ПЕТРАКОВ С.Н. Механизмы планирования в активных системах: неманипулируемость и множества диктаторства. М.: ИПУ РАН, 2002. Приложение (доказательства теорем) Доказательство теоремы 1. Поскольку информированности активных элементов различны, то между ними возникает рефлексивная игра [8]. Рассмотрим игровую ситуацию с точки зрения первого АЭ. В зависимости от реализованной структуры каждый АЭ получает следующие выигрыши: 61
s1 æ s1 ö s æ s ö çç1 - ÷÷ , f2 = 2 çç1 - 2 ÷÷ (веерная структура); 2è r1 ø 2è r2 ø s æ s12 ö ÷ , f2 = 0 (первый АЭ – промежуточный (5,6) f1 = 12 çç1 2 è r1 + r12 ÷ø (3, 4) f1 =
центр); (7,8) f1=
2 s 21 r21
2(r12 + r21 )
2
æ r21 ö s æ s 21 ö çç1 - ÷÷ , f2= 21 çç1 ÷ (второй АЭ – r1 ø 2 è r12 + r21 ÷ø è
промежуточный центр). Покажем теперь, что вектор (0, r12 + r21; 0, r12 + r21) является субъективным равновесием Нэша для первого АЭ. При выборе элементами указанного вектора стратегий реализуется структура с первым АЭ в роли промежуточного центра, при этом (с точки зрения первого АЭ) выигрыши элементов равны: (9,10) f1 =
r12 + r21 æ r12 + r21 ö ç1 ÷ , f2 = 0. 2 çè r1 + r12 ÷ø
Если от равновесия отклоняется первый АЭ, то возможны три варианта: а) реализуется веерная структура; б) реализуется структура с первым АЭ в качестве промежуточного центра; в) реализуется структура со вторым АЭ в качестве промежуточного центра. Случай (а) может наступить, когда первая компонента заявки первого АЭ не менее r12 + r21 , но при этом его выигрыш становится отрицательным, следовательно, случай (а) при рациональном поведении элемента невозможен. Случай (б) может наступить, если АЭ либо не изменяет второй компоненты заявки, либо увеличивает ее. При этом первая компонента заявки не превышает вторую, иначе мы бы пришли к случаю (а). Однако увеличение второй компоненты заявки уменьшает выигрыш первого АЭ, следовательно, такое отклонение невозможно. 62
Случай (в) может наступить, если первый АЭ уменьшит вторую компоненту своей заявки. При этом первая компонента меньше, чем r12 + r21, иначе мы бы пришли к случаю (а). При назначении второго АЭ промежуточным центром первый АЭ получает выигрыш (одинаковый при любой заявке, приводящей к структуре со вторым АЭ в роли промежуточного центра) (11) f1=
r21 æ r21 ö ç1 - ÷÷ . 2 çè r1 ø
Рассмотрим неравенство (12)
r12 + r21 æ r12 + r21 ö r21 æ r21 ö ç1 ÷³ ç1 - ÷÷ , 2 çè r1 + r12 ÷ø 2 çè r1 ø
которое означает, что, являясь промежуточным центром, первый АЭ получает не меньший выигрыш, чем будучи подчиненным. Раскрывая скобки и избавляясь от знаменателей, получим:
r1 (r12 + r21 )(r1 - r21 ) ³ r21 (r1 + r12 )(r1 - r21 ) Û r1 (r12 + r21 ) ³ r21 (r1 + r21 ) Û r1 r12 + r1 r21 ³ r1 r21 + r21 r12 Û r1 ³ r21 . Поскольку последнее неравенство является одним из наших исходных предположений, то неравенство (12) выполнено, а значит отклонение (в) невозможно. Итак, для первого АЭ любое отклонение от равновесия (0, r12 + r21; 0, r12 + r21) не приводит к увеличению выигрыша. Несложно показать, что для второго АЭ (с точки зрения первого АЭ) любое отклонение от этого равновесия также не приводит к увеличению выигрыша. Следовательно, вектор (0, r12 + r21; 0, r12 + r21) является субъективным равновесием для первого АЭ. Аналогично доказывается, что вектор (0, r12 + r21; 0, r12 + r21 + δ) является субъективным равновесием второго АЭ. Таким образом, равновесие (0, r12 + r21; 0, r12 + r21 + δ) является информационным равновесием в рефлексивной игре двух АЭ, что и требовалось доказать. Эффективность функционирования системы равна 63
(13) F = r12 + r21 + d -
(r12 + r21 + d ) 2 r12 + r21 + d = . 2(r12 + r21 + d ) 2
Доказательство теоремы 2. Рассмотрим возможные субъективные равновесия для первого АЭ. Возможны три варианта реализуемой структуры: (а) веерная структура, (б) структура с первым АЭ в роли промежуточного центра и (в) структура со вторым АЭ в роли промежуточного центра. Если реализуется структура (а), то есть s1 + s2 ≥ s12, s1 + s2 ≥ s21, первый АЭ может, выбрав заявку s1* = 0 и s12* = s1 + r12 + δ, стать промежуточным центром и при этом получить полезность (14) f1 =
s1 + r12 + d æ s1 + r12 + d çç1 2 r1 + r12 è
ö ÷÷ , ø
которая больше исходной (3). Действительно, опуская бесконечно малую величину δ, получаем
s1 æ s1 ö s1 + r12 æ s1 + r12 ö ç1 ÷ Û s1 (r1 + r12 ) £ ( s1 + r12 )r1 Û ç1 - ÷÷ £ 2 çè r1 ø 2 çè r1 + r12 ÷ø Û s1 r12 £ r1 r12 Û s1 £ r1 . Последнее неравенство является истинным, поскольку в равновесии АЭ не может выбирать отрицательный выигрыш. Следовательно, исходное неравенство верно, а значит структура (а) не может быть реализована. Если реализуется структура (б), но при этом s12 ≤ r12 + r21, то второй АЭ может, выбрав заявку s2* = 0 и s21* = s12 + δ стать промежуточным центром и увеличить свою полезность (которая в случае реализации структуры (б) равна нулю). Следовательно, в любом равновесии, приводящем к структуре (б), вторая компонента заявки первого АЭ равна r12 + r21. Наконец, если реализуется структура (в), то первый АЭ может выбрать заявку s1* = 0 и s12* = r12 + r21, стать промежуточным центром и получить больший выигрыш. Действительно, 2 s 21 r21 2(r12 + r21 ) 2
64
æ r21 ö (r12 + r21 ) 2 r21 æ r21 ö çç1 - ÷÷ £ ç1 - ÷÷ , r1 ø 2(r12 + r21 ) 2 çè r1 ø è
что, согласно (12), не больше выигрыша, получаемого первым АЭ в случае, если он является промежуточным центром и выбирает заявку s1* = 0 и s12* = r12 + r21. Следовательно, структура (в) не может быть реализована. Рассматривая аналогичным образом субъективные равновесия второго АЭ, приходим к выводу, что единственно возможные информационные равновесия приводят к структуре со вторым АЭ в качестве промежуточного центра и эффективности (13). Доказательство теоремы 3. Рассмотрим с точки зрения первого АЭ множество наилучших ответов второго АЭ на заявку s1 = 0 и s12 =
r1 + r12 . 2
Стать промежуточным центром второй АЭ не может, так как для этого ему пришлось бы заявить s 21 >
r1 + r12 > r12 + r21 , что 2
привело бы его к отрицательному выигрышу. Добиться реализации веерной структуры второй АЭ может, выбрав заявку s 2 ³
r1 + r12 . Выбрать такую заявку и при этом 2
получить положительный выигрыш, второй АЭ может, если выполнено r12 >
r1 + r12 , что противоречит введенному нами пред2
положению r1 ≥ r12. Таким образом, с точки зрения первого АЭ он станет промежуточным центром. Его выигрыш в этом случае равен
r1 + r12 . 4
Максимальный выигрыш в случае веерной структуры для первого АЭ равен
r1 r +r , то есть строго меньше 1 12 . 4 4
Максимальный выигрыш первого АЭ в случае, если он является подчиненным второму АЭ, равен
r21 r (1 - 21 ) и достигается 8 r1 65
при заявке второго
s 21 =
r12 + r21 . Несложно показать, что 2
r21 r r +r (1 - 21 ) < 1 12 . Таким образом, выигрыш первого АЭ в 8 r1 4 случае, когда он является промежуточным центром и заявляет s1 = 0 и s12 =
r1 + r12 , максимален. 2
Итак, мы доказали, что s1 = 0 и s12 =
r1 + r12 является субъек2
тивной доминантной стратегией для первого АЭ. Заявка второго АЭ (как равновесие в его субъективной игре) не измениться по сравнению с заявкой, полученной в теореме 1, поскольку второй АЭ считает типом первого r21, и не имеет никакой информации о соотношении
r1 + r12 < r12 + r21 . 2
Доказательство теоремы 4 аналогично доказательству теоремы 3.
66
ОРГАНИЗАЦИЯ БУХГАЛТЕРСКОГО УЧЕТА И МЕТОДЫ ВНУТРИФИРМЕННОГО УПРАВЛЕНИЯ Заложнев А.Ю., Москвитина М.А., Ярусова И.Н. (Институт проблем управления РАН, Москва)
[email protected] Введение Практическая реализация структурных и функциональных схем (организация) работы бухгалтерии и сопряженных с ней подразделений коммерческой фирмы является областью применения методов внутрифирменного управления. В настоящей работе приводится пример описаний организационной и функциональной структуры бухгалтерии и организации документооборота для коммерческой фирмы, основным предметом деятельности которой является торговля импортируемыми потребительскими товарами длительного пользования. Следует отметить, что построение описаний подобного типа является неотъемлемой частью применения оптимизационных методов внутрифирменного управления ([1], стр. 49-59), а именно методов обследования и проектирования организационной структуры, методов построения систем стимулирования и финансового управления организацией, методов бухгалтерского учета и финансового анализа и, наконец, методов построения автоматизированных систем управления и рационализации процедур функционирования, в том числе методов автоматизации систем бухгалтерского учета, финансового анализа и аудита. Основные положения, регламентирующие бухгалтерский учет и отчетность в коммерческой фирме (далее – Фирма), содержатся в следующих документах: 1. Положение о бухгалтерском учете и отчетности в Российской Федерации.*
*
Утверждено приказом Министерства финансов Российской Федерации от 29 июля 1998г. N34н. 67
2. План счетов бухгалтерского учета финансово-хозяйственной деятельности предприятий.* 3. Инструкция по применению плана счетов бухгалтерского учета финансово-хозяйственной деятельности предприятий.* 4. Письма Федеральной налоговой службы и Министерства финансов РФ, регламентирующие порядок накопления и систематизации информации в учетных регистрах. Вместе с тем, как это было указано в работе [2], в условиях конкретной фирмы требуется доопределение некоторых положений организации бухгалтерского учета. В настоящей работе для коммерческой фирмы, основным предметом деятельности которой является торговля потребительскими товарами длительного пользования, будут доопределены следующие положения: 1. Функциональная структура бухгалтерии. 2. Документопотоки (документооборот). 3. Текущие и перспективные виды аналитического учета. 4. Система взаиморасчетов Фирмы. 5. Учетная политика Фирмы. 1. Функциональная структура бухгалтерии. Документопотоки (документооборот) в бухгалтерии фирмы В силу того, что бухгалтерия рассматриваемой фирмы достаточно малочисленна, но в то же время реализует всю полноту бухгалтерского учета при построении ее функциональной структуры и определении основных документопотоков целесообразно рассматривать отдельные персонально незакрепленные функциональные участки и взаимосвязи между ними. Такими функциональными участками являются участки учета в разрезе отдельных счетов или групп счетов. А методика разбиения бухгалтерского учета на участки такого типа базируются на применении так называемых журналов-ордеров. Функциональная структура бухгалтерии представлена в приложении 1 («Основные функционально-выделенные участки (регистры) бухгалтерского учета на Фирме») и приложении 2 («Корреспонденции и информационные потоки между основными *
Утверждено приказом Министерства финансов Российской Федерации от 31 октября 2000г.
68
функционально-выделенными участками (регистрами) бухгалтерского учета на Фирме»). При рассмотрении схем следует отметить, что для упрощения бухгалтерского учета реально по некоторым счетам журналы-ордера не ведутся, а просто производится накопление первичных документов, результаты операций по которым регистрируются сразу в главной книге – основном накопительном регистре бухгалтерского учета. В схемах эти особенности опущены и базовые счета (41, 45(90), 50, 51, 52, 60, 70, 71, 76) – счета наиболее существенные с точки зрения специфики хозяйственной деятельности Фирмы представлены так, как будто по всем ним ведутся журналы-ордера или другие накопительные регистры (группировочные, расчетноплатежные ведомости и т.д. и т.п.). К функционально-выделенным участкам следует также отнести формирование главной книги и формирование сводной отчетности для налоговой инспекции и фондов. 2. Текущие и перспективные виды аналитического учета Весьма важным с точки зрения повышения управляемости Фирмы и совершенствования системы контроля, а также в целях сопряжения системы бухгалтерского учета с системой учета текущих расходов «cash-flow», является введение аналитического учета на основе двух кодификаторов: 1. Кодификатора объектов учета и управления. 2. Кодификатора статей затрат. Система кодификаторов объектов учета и управления должна включать в себя все субъекты хозяйственной деятельности Фирмы, а именно: 1) внутренние – структурные подразделения (центры прибыли, центры затрат, венчуры), сотрудников; 2) внешние – дочерние и прочие организации, физических лиц (не сотрудников), т.е. все хозяйствующие субъекты, которые являются контрагентами Фирмы в процессе ее функционирования. Примерная структура кодификатора объектов учета и управления Фирмы приведена в таблице 1.
69
Таблица 1. Список объектов учета Объект учета Код Фирма
1
Центры прибыли и затрат Центр прибыли и затрат 1
11 1101
Центр прибыли и затрат 2
1102
Венчуры
12
Венчур 1
1201
Венчур 2
1202
Дочерние организации Дочерняя организация 1
2 2001
Дочерняя организация 2
2002
Другие организации
3
Физические лица
4
Введение кодификатора объектов учета и управления позволит внести большую упорядоченность в систему взаиморасчетов Фирмы и в систему контроля за исполнением договоров. Введение достаточно подробного кодификатора статей затрат позволит получать объективное представление о структуре затрат, производимых Фирмой, а в комбинации с кодификатором объектов учета и управления позволит структурировать затраты между центрами прибыли, затрат и венчурами Фирмы. Кодификатор статей затрат может быть введен в виде упорядоченной системы субсчетов счета 20 «Основное производство» и/или счета 26 «Общехозяйственные расходы», на котором осуществляется калькуляция издержек Фирмы, относимых на затраты, дополненной информацией с других счетов, на которых также могут аккумулироваться внутрифирменные издержки (например, с дебета счета 01 «Основные средства»).
70
3. Система взаиморасчетов фирмы Система взаиморасчетов фирмы, охватывающая такие важнейшие субъекты хозяйственной деятельности Фирмы, как поставщики, покупатели, Таможня, Государство приведена в Приложении 3 «Принципиальная схема системы взаиморасчетов Фирмы». 4. Основные положения учетной политики фирмы Центральными моментами учетной политики Фирмы являются следующие: 1. Методика списания на затраты малоценных и быстроизнашивающихся предметов. 2. Методика учета материальных ценностей (товаров). 3. Методика учета реализации продукции (товаров). 4. Методика учета амортизации активной части основных фондов. В таблице 3 приведен возможный вариант реализации учетной политики Фирмы. Таблица 3. Основные положения учетной политики Фирмы 1. Списание малоценных и быст100% списание при передаче в роизнашивающихся предметов производство 2. Учет материальных ценностей По таможенной стоимости на день оформления таможенной декларации З. Учет реализации продукции По факту оплаты товаров 4. Амортизация активной части Линейный способ основных фондов Литература 1. ЗАЛОЖНЕВ А.Ю. Модели и методы внутрифирменного управления. М.: Сторм Медиа, 2004. – 320 с. 2. ЗАЛОЖНЕВ А.Ю. Формирование положения о бухгалтерском учете и отчетности как область применения оптимизационных методов внутрифирменного управления. В печати. 71
Приложение 1. Основные функционально-выделенные участки (регистры) бухгалтерского учета на Фирме. Таможенные декларации растаможивающей фирмы Счета, выставленные растаможивающей фирмой Накладные на товар Калькуляции
Счет 41. Товары
Счета, выставленные покупателям товара, другим контрагентам Накладные на товар реализованный
Счет 45(90). Товары отгруженные. Продажи
Приходные кассовые ордера Расходные кассовые ордера, доверенности Банковские квитанции
Счет 50. Касса
Платежные поручения Мемориальные ордера Копии препроводительной ведомости к сумме денежной выручки
Счет 51. Расчетные счета
Заявление на перевод валютных средств Заявка на покупку валюты Заявка на продажу валюты Банковские авизо
Счет 52. Валютные счета
Счета, выставленные поставщиками и подрядчиками Копии договоров к счетам Таможенные декларации Накладные растаможивающей организации
Счет 60. Расчеты с поставщиками и подрядчиками
72
Директивная информация
Счет 70. Расчеты с персоналом по оплате труда
Приходные кассовые ордера Расходные кассовые ордера Авансовые отчеты
Счет 71. Расчеты с подотчетными лицами
Счета, выставленные поставщиками и подрядчиками Копии договоров к счетам
Счет 76. Расчеты с разными дебиторами и кредиторами
73
74
Приложение 2 Корреспонденции и информационные потоки между основными функционально-выделенными участками (регистрами) бухгалтерского учета на Фирме.
75
Принципиальная схема системы взаиморасчетов Фирмы
Приложение 3
ЭФФЕКТ ЗАВЫШЕНИЯ МАЛЫХ ВЕРОЯТНОСТЕЙ Искаков М.Б. (Институт проблем управления РАН, Москва) Парадокс страхования и лотереи. Один и тот же человек одновременно может проявлять и положительную и отрицательную склонность к риску. Парадокс одновременной осторожности и азартности проявляется в (почти) одновременном заключении человеком сделок, говорящих о его как отрицательном (страховой договор), так и положительном (покупка лотерейного билета) отношении к риску. Такие ситуации часто случаются в жизни. Приведем несколько возможных объяснений такого поведения. Объяснение 1. Один и тот же человек может иметь в различных ситуациях различную функцию полезности. Но, если это верно в такой степени, что меняет характеристики отношения к риску на противоположные, то вообще может ли идти речь об устойчивых качествах индивида, которые мы изучаем? Объяснение 2. При лотерее выигрыш велик, но маловероятен, проигрыш (цена невыигрышного билета) мал, но вероятность его близка к 1, поведение – азартное (смотри рис. 1, случай А). При страховании проигрыш велик, но маловероятен, выигрыш (не наступление страхового случая) мал, но вероятен, поведение осторожное (случай В). U(x)
U(x)
Случай А
Случай В x
Х1 Х
x
Х2
Х1
Х Х2
Рис. 1.
Объединяя эти два случая, мы получаем, что функция полезности должна быть выпукла справа от точки текущего благосос76
тояния данного индивида, и вогнута слева от нее. Это противоречит всем представлениям о функциях полезности. Очевидно, что при возрастании богатства, полезность прибавляемых к нему фиксированных сумм должна убывать, значит, должна убывать производная функции полезности. Объяснение 3. И при страховании, и при лотерее ситуация не симметрична, причем, если мы имеем дело с большим маловероятным проигрышем, то имеет место осторожность поведения, в противоположном случае – поведение азартно. Предположим, что мы имеем дело не столько с функциями полезности, но и с субъективными оценками вероятности. Тогда, если человек инстинктивно склонен переоценивать, завышать малые вероятности наступления очень значимых событий, то при, например, линейной функции полезности (безразличии к риску) должен получаться наблюдаемый эффект. Причем завышение малых вероятностей происходит даже тогда, когда они явно заданы и известны, например, участнику лотереи. Из предлагаемого объяснения парадокса одновременной осторожности и азарта следует, что теория отвращения к риску должна быть дополнена рассмотрением субъективных оценок вероятностей. Задача измерения функций полезности денег неотделима от изучения субъективных оценок вероятности. В частности встает задача разделения этих двух факторов при исследовании поведения людей. Рассмотрим ситуацию лотереи. Случай страхования менее интересен, так как, при предположении вогнутости функции полезности и субъективном завышении малой вероятности, оба эффекта будут действовать в одну сторону повышения осторожности. Введем обозначения: x – сумма денег, которой владеет участник лотереи до покупки билета, Δ1 – цена лотерейного билета, Δ2 – сумма выигрыша минус цена билета, x1 = x – Δ1, x2 = x + Δ2 – суммы денег, получающиеся по итогам лотереи в случаях без или с выигрышем, u(x) – функция полезности участника лотереи, P – вероятность выигрыша, P* – субъективная оценка вероятности выигрыша. Предполагается, что лотерея беспроигрышная: P / (1 – P) = Δ1 / Δ2, и субъективная вероятность больше реальной P* > P. Участник соглашается на операцию, если ожидаемая им полезность лотерейной операции положительна: 77
(1) (1 – P*) u(x1) + P* u(x2) > u(x). Обозначим выражение в левой части неравенства через UP*, реальная полезность лотерейной операции UP = (1 - P) u(x1) + P u(x2). Предполагаем, что цена билета Δ1 мала, Δ1 u′(x) (x2 – x1) / (u(x2) – u(x1))
u(·)
UP*
u(·)
u(x) u(x1) x1 x1 ˜ x
x2
x
Рис. 2
P*x1+(1-P*)/x2 x=Px1+(1-P)/x2 x
Согласно [1, 2] функции полезности равноосторожных субъектов могут иметь один из следующих случаев: (А) u(x)=xα, α>1; (Б) u(x)=x; (В) u(x)=xα, 0 P α (x2 – 1) / (x2α – 1), (α < 0). 78
Допустим теперь, что лотерея не является беспроигрышной: P / (1 – P) < Δ1 / Δ2. Тогда из (1) следует, что u(x) ≈ u(x1) + u′(x) Δ1, и (1) эквивалентно (6) P* > u′(x) Δ1 / (u(x2) – u(x1)). Рассмотрим возможности экспериментальных опросовизмерений P*, вытекающих из построенной модели. Сначала сделаем несколько естественных предположений о виде u(x) и P*(P) (степени завышения малых вероятностей). Пусть лотерея беспроигрышна. Функция полезности является вогнутой. Для достаточно малых вероятностей Р < Ркр наступления события – они игнорируются, P*(P) = 0. Для Ркр < Р < ½, степень завышения вероятности P*(P) / Р > 1, убывает от максимального значения до 1, то есть меньшие вероятности завышаются сильнее. При эксперименте мы можем зафиксировать одну из трех величин: величину выигрыша Δ2, цену лотерейного билета Δ1, или вероятность выигрыша P, а два других предоставить на выбор опрашиваемому субъекту. Исследуем поведение целевой функции субъекта UP* = (1–P*) u(x1) + P* u(x2) во всех трех случаях. Зафиксируем величину выигрыша Δ2, предоставим на выбор P, Δ1 = Δ2 P / (1 - P). Тогда максимум целевой функции будет достигаться при Р = Ркр, так как при росте Р оба эффекта, и отрицательное отношение к риску, и завышение малых вероятностей будут уменьшать целевую функцию. Зафиксируем цену лотерейного билета Δ1 (она мала настолько, что функция полезности линейна), предоставим на выбор P, Δ2 = Δ1 (1 - P) / P. Тогда опрос может выявить асимптотическое поведение целевой функции при росте, и, следовательно, определить у опрашиваемых соотношение между силой эффектов отрицательного отношения к риску для больших выигрышей (на правой ветви функции полезности) и завышения малых вероятностей. Аналогичный тест можно сформулировать и для не беспроигрышных лотерей (при сохранении внутри теста одинаковой степени «выигрышности»). Зафиксируем вероятность выигрыша и предоставим на выбор цену лотереи k Δ1, k Δ2. Тогда, если эффект завышения малых вероятностей превосходит действие отрицательного отношения к риску на правой ветви функции полезности, можно определить ту величину k, при которой начинает существенно нарушаться предполо79
жение о линейности u(x) на интервале k Δ1. Действительно, при малых k Δ1, функцию полезности можно считать почти линейной, и целевая функция будет возрастать. Когда же k Δ1 станет достаточно большим, скажется, что левая ветвь функции полезности начинает быстро убывать (стремится к -∞) при x → 0. Очевидно, что этот фактор будет действовать намного сильнее, чем субъективное завышение вероятности. То есть в данном тесте целевая функция будет с ростом цены лотереи сначала возрастать, при сохранении условия квазилинейности слева, потом достигнет максимума, с нарушением этого условия, и начнет быстро убывать. Опираясь на последние рассуждения можно разработать конкретный опрос по сравнению силы эффекта завышения вероятности со степенью осторожности субъекта, аналогичный опросу по определению осторожности, описанному [2]. Литература 1. PRATT J.W. Risk aversion in the small and in the large. // Econometrica. 1964. Vol. 32 N 1-2 P.122-136 2. ИСКАКОВ М.Б., ЩЕПКИН А.В. Моделирование отношения к риску и измерение финансовой осторожности вкладчика / Труды ИПУ. Том XV. М.: ИПУ РАН, 2002. Стр. 104-116.
80
ПРИМЕНЕНИЕ ДИНАМИЧЕСКИХ ПРОГНОЗОВ В ЗАДАЧЕ ОПЕРАТИВНОГО УПРАВЛЕНИЯ ПАРКОМ ПОРОЖНИХ ВАГОНОВ Корюхина Т.Н., Положишников В.Б., Соболев А.В. (ГУП Российский научно-исследовательский и проектноконструкторский институт информатизации, автоматизации и связи, Москва)
[email protected] Введение В настоящее время регулирование парка порожних вагонов базируется на месячном плане передислокации, который, по сути, является результатом решения транспортной задачи в статической постановке. Такой подход, несомненно, сокращает порожний пробег вагонов и, при этом, позволяет удовлетворять потребности грузоотправителей, но не способен адекватно учитывать динамику образования порожних вагонов в пунктах выгрузки, а также колебания плана погрузки. Применение динамических оптимизационных моделей в оперативном регулировании парка порожних вагонов позволит наиболее полно учесть эту динамику и повысит эффективность управления порожняком. Одна из таких оптимизационных моделей базируется на динамической транспортной задаче с задержками, описанной в [1]. В данной работе рассмотрены аспекты применения динамических прогнозов в оптимизационной модели оперативного управления парком порожних вагонов. Предлагается методика вычисления функции образования порожняка методом прогнозирования по текущей дислокации груженых и порожних вагонов. Данные о текущей дислокации вагонов извлекаются из автоматизированной системы пономерного учета, контроля дислокации и регулирования вагонного парка на железных дорогах России – сокращенно ДИСПАРК. 81
1. Прогнозирование зарождения порожняка на отделениях железных дорог По каждому вагону с уникальным номером k имеется информация о состоянии, станции дислокации g k , станции назначения
gˆk и момента времени t k последней операции с этим вагоном. Функция образования порожних вагонов ai (t ) может быть вычислена как (1) ai (t ) = W i (g , gˆ,t ), i = 1, K , n , где n – число отделений на рассматриваемой сети железных дорог. Образование порожних вагонов на такте t складывается из: · образовавшихся в течение такта t порожних вагонов aiгр (t ) , которые на момент запроса информации о дислокации находились в груженом состоянии; · порожних вагонов в движении a iрег (t ) , которые поступят в течение t на станции назначения; · для пограничных отделений - из возвращенных порожних ino
вагонов a i (t ) из-за границы. Таким образом, (2) ai (t ) = aiгр (t ) + aiрег (t ) + aiino (t ) . Время подготовки вагона к регулировке – это время, которое проводит на грузовой станции вагон после прибытия на станцию назначения и до момента, когда этот вагон перейдет в порожнее состояние и будет готов к регулировке. При этом вагон может поступить на станцию либо в груженом состоянии и выгрузиться на путях общего пользования/подъездных путях предприятия, либо поступить уже в порожнем состоянии. Прогнозирование образования порожних вагонов из груженых a iгр (t ) проводится с учетом максимальных выгрузочных способностей отделений Qimax , которые также могут быть определены по данным информационного хранилища. При прогнозировании поступления на отделения погрузки порожних вагонов a iрег (t ) , находящихся в движении, прогнозируется также прохождение ими дорожных стыковых пунктов. Прогнозирование образования порожних вагонов ведется отдельно 82
по каждому роду подвижного состава. Вагоны, двигающиеся в кольцевых маршрутах, исключаются из рассмотрения. Прогноз образования порожняка a i (t ) вычисляется на глубину 10 суток, что соответствует максимальному количеству тактов Td хода груженого вагона по сети с последующей подготовкой к регулировке (Табл. 1). Таблица 1 Форма результатов прогноза освобождения порожних вагонов
Временной такт
отделения отправл назнач ения ения
номера вагоно в
количество вагонов груженых
порожних
0 1 … … t
i
j
{N } ijt
…
Gijtk
… …
Pijtm
…
… …
Td
Расшифровка обозначений в таблице следующая: i - отделение дислокации, j - отделение назначения; N ijt - массив соответст-
{ }
вующих учетных номеров вагонов, Gijtk - количество груженых вагонов, находящихся на такте t на отделении i и двигающихся на отделение j вариантом маршрута k , Pijtm - количество порожних вагонов находящихся на такте t на отделении i и двигающихся на отделение j вариантом маршрута m . В данной работе время освобождения вагонов вычисляется с некоторыми допущениями. Считается, во-первых, что порожние вагоны, прибывшие на станцию назначения готовы к регулировке сразу после расформирования поезда. Во-вторых, порожние ваго83
ны, образовавшиеся в результате выгрузки и возвращения с грузовых фронтов на станцию, считаются готовыми к регулировке с момента возвращения на станцию. 2. Основные результаты Времена хода и подготовки порожних полувагонов к регулировке были вычислены по данным информационных хранилищ за февраль 2004 г. Данные по фактическому освобождению были взяты за следующий месяц. Ниже, на рисунках 1-4 представлена проверка прогноза освобождения вагонов из груженых. 3. Заключение Решение многих задач оперативного управления перевозочным процессом на железнодорожном транспорте всецело зависит от точности прогнозных моделей. В статье рассматриваются проблемы применения динамических прогнозов в задаче оперативного управления парком порожних вагонов. Новизна разработки состоит в привлечении ретроспективных детальных данных, описывающих движение вагонов, для исследования потоков грузовых вагонов и вычисления параметров разрабатываемой модели. 2500
Количество вагонов
2000
1500
1000
500
28.03.2004
27.03.2004
26.03.2004
25.03.2004
24.03.2004
23.03.2004
22.03.2004
21.03.2004
20.03.2004
19.03.2004
18.03.2004
17.03.2004
16.03.2004
15.03.2004
14.03.2004
13.03.2004
12.03.2004
11.03.2004
10.03.2004
09.03.2004
08.03.2004
07.03.2004
06.03.2004
05.03.2004
0
Дата образования порожних вагонов
Фактическое освобождение
Прогнозное освобождение
Рис. 1. Проверка прогноза. Дорога освобождения Московская, глубина прогноза 2 суток 84
Фактическое освобождение
28.03.2004
27.03.2004
26.03.2004
25.03.2004
24.03.2004
23.03.2004
22.03.2004
21.03.2004
20.03.2004
19.03.2004
Фактическое освобождение
18.03.2004
17.03.2004
16.03.2004
15.03.2004
14.03.2004
13.03.2004
12.03.2004
11.03.2004
10.03.2004
09.03.2004
08.03.2004
07.03.2004
06.03.2004
05.03.2004
Количество вагонов
28.03.2004
27.03.2004
26.03.2004
25.03.2004
24.03.2004
23.03.2004
22.03.2004
21.03.2004
20.03.2004
19.03.2004
18.03.2004
17.03.2004
16.03.2004
15.03.2004
14.03.2004
13.03.2004
12.03.2004
11.03.2004
10.03.2004
09.03.2004
08.03.2004
07.03.2004
06.03.2004
05.03.2004
Количество вагонов 2500
2000
1500
1000
500
0
Дата образования порожних вагонов
Прогнозное освобождение
Рис. 2. Проверка прогноза. Дорога освобождения Московская, глубина прогноза 3 суток 1600
1400
1200
1000
800
600
400
200
0
Дата образования порожних вагонов
Прогнозное освобождение
Рис. 3. Проверка прогноза. Дорога освобождения СевероКавказская, глубина прогноза 4 суток
85
1600
1400
Количество вагонов
1200
1000
800
600
400
200
28.03.2004
27.03.2004
26.03.2004
25.03.2004
24.03.2004
23.03.2004
22.03.2004
21.03.2004
20.03.2004
19.03.2004
18.03.2004
17.03.2004
16.03.2004
15.03.2004
14.03.2004
13.03.2004
12.03.2004
11.03.2004
10.03.2004
09.03.2004
08.03.2004
07.03.2004
06.03.2004
0
Дата образования порожних вагонов
Фактическое освобождение
Прогнозное освобождение
Рис. 4. Проверка прогноза. Дорога освобождения СевероКавказская, глубина прогноза 5 суток Количественное сравнение прогнозных освобождений полувагонов инвентарного парка МПС с фактическими показывает неплохую работу прогноза на реальных данных. Проверка также показала отслеживание моделью прогноза динамики освобождений вагонов. Поэтому данная модель прогноза может применяться в составе динамической оптимизационной модели оперативного управления парком порожних вагонов.
Литература 1. КОЗЛОВ П.А., МИЛОВИДОВ С.П. Оптимизация структуры транспортных потоков в динамике при приоритете потребителей // Экономика и математические методы. 1982. Т. 18. Вып. 3. С. 521 – 531. 2. ТИШКИН Е.М. Автоматизация управления вагонным парком. – М.: Интекст, 2000. – 224 с.
86
ЗАДАЧА СТИМУЛИРОВАНИЯ СОТРУДНИКОВ ОТДЕЛА СНАБЖЕНИЯ Куропаткин М.А. (Институт проблем управления РАН, Москва)
[email protected] Введение В данной работе рассматриваются возможные способы мотивации служб (подразделений фирмы, корпорации и т.д.), занимающихся снабжением. Для начала определим те цели и критерии, по которым компания (или ее руководство) оценивает работу служб снабжения. Первая цель, которая ставится перед отделом снабжения – минимизация закупочных цен для сырья и материалов при соблюдении некоторого фиксированного уровня качества сырья. Как правило, на практике это является единственным зафиксированным критерием, по которому оценивается эффективность работы служб и определяются их премии. Рассмотрим другие аспекты работы служб снабжения. Любая компания для организации своей работы осуществляет планирование будущей деятельности. В процессе планирования оценивается множество параметров, в частности – будущие цены и объемы необходимых закупок. Службы снабжения принимают в этом планировании непосредственное участие, однако они, как правило, никаким образом не мотивированы на получение как можно более точного прогноза. Давайте разберемся, чем оборачивается неточность планирования. Рассмотрим простейший случай, когда служба, занимающаяся снабжением, планирует только цены, по которым будет проводиться закупка сырья. Если прогнозная цена в дальнейшем оказывается выше "средней", существующей на рынке, то это значит, что компания будет нести потенциальные потери из-за того, что деньги, запланированные на закупку сырья, будут лежать «мертвым грузом» и не участвовать в обороте. Если же прогнозная цена окажется ниже существующей, то для покрытия возникающего дефицита бюджета компании придется взять кредит и понести уже реальные финансовые потери на выплату процентов. Таким образом, сформировался второй 87
критерий, по которому нужно оценивать эффективность работы служб снабжения – точность планирования. Существует еще ряд критериев работы служб снабжения, которые во многом определяются спецификой деятельности компаний и ее внешним окружением. В одних случаях это наличие ограничения на минимальную партию закупки. В других случаях это наличие монополиста на определенное сырье, который диктует определенные правила поведения. В данном разделе не будет уделяться внимания таким критериям, так как строить систему стимулирования, учитывающую все параметры, необходимо в каждом конкретном случае отдельно. Итак, выше были сформулированы два основных критерия оптимальности с точки зрения компании: минимизация цены закупки сырья и получение максимально точного плана цены сырья в будущих периодах. Теория активных систем не делает существенного отличия между стимулированием, штрафами или премиями [1]. Однако существует общее правило стимулирования, возникшее из практических работ: если необходимо остановить какой-либо процесс (расхищения, опоздания и т.д.), то надо применять штрафные санкции (штрафы могут заключаться в снижении заработной платы или премий), если же надо получить что-то, чего не было раньше (повысить аккуратность, добиться увеличения продаж), то надо использовать механизм премий. Цель данного раздела - пользуясь этим правилом, построить систему стимулирования, в которой службам снабжения было бы выгодно минимизировать цену закупки сырья (добиться этого можно, пользуясь премиями за результат) и в то же время было бы выгодно как можно точнее предсказывать цену сырья при планировании (добиться этого можно, пользуясь штрафами за отклонения факта от прогноза). 1. Описание модели Модель включает два периода времени. В первый период производится планирование. В этом периоде служба снабжения (иногда будет называться АЭ) предсказывает цену сырья, за которую АЭ во втором периоде сможет приобрести сырье ( pпр прогнозная цена). Считается, что служба снабжения имеет 0
некоторое представление о прогнозной цене ( pпр ). Таким образом, 88
в первом периоде служба снабжения должна выбрать прогнозную цену ( pпр ). Во втором периоде сложившийся рынок позволяет службе снабжения понять, по какой цене можно приобрести сырье (то есть рынок указывает границы для цены приобретения сырья: диапазон [ p$min ; ¥) ). После этого АЭ принимает решение о том, по какой цене реально он будет приобретать сырье ( p$ ). Компания (далее Ц) стремится к получению истинного представления о прогнозной цене и к минимизации цены закупки во втором периоде:
p$ ® min p пр ® p пр
(1)
0
Будем считать, что потери центра при неточности предсказания или завышении цены закупки существенно больше затрат на стимулирование. Общая цель – построить механизм стимулирования, который бы позволял центру получать на первом этапе истинное представление АЭ о будущей ситуации на рынке, а на втором этапе делал выгодным для АЭ покупать сырье по наименьшей цене. 2. Механизм стимулирования «от прогнозной цены» Рассмотрим механизм стимулирования «от прогнозной цены», состоящий из двух частей и задающийся следующей формулой: (2) s = b(p - p ) -a p - p пр
$
$
пр
премия за уменьшение цены закупки сырья
штраф за отклонение прогнозной цены от цены закупки
Прем
Прем p пр
b
pпр
a
p
p a
b Штр
Штр
Этот механизм стимулирования – самый простой, который удовлетворяет всем требованиям, сформулированным в постановке 89
задачи. Однако давайте детально проанализируем, как будут вести себя активные элементы (на предмет манипулируемости), и какие результаты при этом будет получать центр. На рисунке 1 показан графический вид механизма стимулирования (2) для различных соотношений параметров a и b . а)b > a
б )b < a
Прем
Прем b -a
pпр
pпр
p a -b
b +a
Штр
p b +a
Штр
Прем
в )b = a
pпр
p b +a
Штр
Рис. 1. Графическое представление механизма стимулирования «от прогнозной цены» Для того чтобы корректно определить, какие действия будет выбирать АЭ, нужно воспользоваться методикой поиска лучших ответов [2]. В рамках этой методики сначала ищется лучший ответ на последнем этапе модели как функция от действий АЭ на предыдущих этапах. Затем ищется аналогичное решение на предпоследнем этапе как функция предыдущих решений и т.д. В рамках решаемых задач это означает, что сначала необходимо найти зависимость выбора АЭ оптимального p$ при каждом 90
конкретном
pпр . Затем мы должны найти для АЭ наиболее
оптимальное pпр . Вариант 1. b > a (см. рисунок 1а) В данном случае видно, что чем ниже цена p$ , тем выгоднее АЭ, так как идет возрастание его премии. Однако АЭ может добиться возрастания премии еще и завышением прогнозной цены. Таким образом, при использовании подобного механизма стимулирования АЭ выгодно завышать прогнозную цену, хотя при этом и выгодно минимизировать цену закупки. Вариант 2. b < a (см. рисунок 1б) При таком механизме стимулирования АЭ при осуществлении закупок (выборе p$ ) не выгодно отклоняться от прогнозной цены, так как при любом отклонении на него накладываются штрафные санкции. Побуждение АЭ к более точному предсказанию осуществляется только благодаря использованию гипотезы благожелательности (если АЭ знает точный прогноз, и ему безразлично, что сообщить, то он скажет правду). Вариант 3. b = a (см. рисунок 1в) При использовании такого механизма стимулирования манипулирование АЭ будет выражаться только в завышении прогнозной цены, чтобы ненароком не получить штраф. Получение достоверных данных обеспечивается только гипотезой благожелательности. Механизм стимулирования (2) вообще не защищен от манипулирования со стороны АЭ. Достоверность данных при использовании указанного механизма обеспечивается только гипотезой благожелательности. А это равносильно полному отсутствию механизма стимулирования (в таком случае гипотеза благожелательности обеспечивает полную достоверность данных). Таким образом, использование указанного механизма оказывается нецелесообразным. 3. Механизм стимулирования «от средней цены на рынке» Причины неудачности предыдущего механизма заключаются в том, что стимулирование за результат привязано к прогнозной 91
цене, которую выбирает АЭ. Давайте попробуем создать другой механизм, привязав стимулирование к некоторой независимой от действий АЭ величине. В качестве такой величины может выступать, например, средняя цена сырья на рынке ( p ср ). Тогда механизм образом:
стимулирования
будет
записываться
следующим (3)
s = b ( pср - p$ ) - a pпр - p$ премия за уменьшение цены закупки сырья
штраф за отклонение прогнозной цены от цены закупки
Прем
Прем pпр
b
pср
a
p
p a
b
Штр
Штр
Прежде чем изобразить графически данный механизм стимулирования, обратим внимание, что важно расположение pср и pпр . Поэтому рассмотрим два возможных случая. СЛУЧАЙ 1. pср ³ p пр Графическое изображение механизма стимулирования для этого случая представлено на рисунке 2. Вариант 1. b > a (см. рисунок 2а) Так как pср не зависит от действий АЭ, то для него наиболее выгодно добиться как можно меньшего p$ (даже если предсказание цены оказалось не точным). Давайте проанализируем, какое p пр наиболее выгодно для АЭ при фиксированном pср и p$ получаемому по правилу минимизации. Как мы видим из рисунка, в промежутке от 0 до pпр скорость возрастания премии с уменьшением p$ составляет b - a , а в промежутке от pпр до pср эта же величина составляет b . Таким образом, АЭ наиболее
92
выгодно, чтобы pпр совпадало с pпр
0
(АЭ выгодно делать как
можно более точные предсказания). Таким образом, данный механизм полностью защищен от манипулирования АЭ. а)b > a
Прем
б)b < a
Прем
b -a
a -b
pпр a
b
pср
pпр
p
p ср
b
p
a
b +a
b +a
Штр
Штр
в) b = a
Прем
pпр
b
p ср
p
a
b +a
Штр
Рис. 2. Графическое представление механизма стимулирования «от средней цены на рынке» (случай 1: средняя цена больше прогнозной) Вариант 2. b < a (см. рисунок 2б) При таком механизме стимулирования АЭ выгодно работать по прогнозной цене pпр (то есть наиболее выгодное положение:
p$ = pпр ). При этом выгодно сделать так, чтобы
pпр , а
следовательно и p$ были как можно меньше (обоснование такое же, как и в предыдущем случае). Это приводит к тому, что АЭ 93
выгодно совершать как можно более точные предсказания. Однако при этом АЭ не выгодно отклоняться в закупочной цене ( p$ ) от прогнозной цены ( pпр ), даже если он это может. Таким образом, данный механизм обеспечивает как можно более точное предсказание, но при этом не защищен от манипулирования ценой закупки ( p$ ). АЭ будет пытаться добиться цены закупки равной
pпр . Вариант 3. b = a (см. рисунок 2в) Для данного механизма стимулирования, как и в вариантах 1 и 2, остается верным вывод о том, что АЭ стремится как можно более точно предсказать цену реализации. А выгодность минимизации закупочной цены обуславливается в данном механизме только гипотезой благожелательности. Таким образом, можно рассматривать данный вариант как небольшое ослабление варианта 1. СЛУЧАЙ 2. pср < p пр Теперь рассмотрим случай, когда средняя цена оказывается меньше прогнозной. Надо сразу отметить, что это – экзотический случай (тем не менее, он имеет право на существование), так как на практике наиболее частое распределение цен следующее: p$ £ pпр £ pср . Посмотрим, как при этом преобразуются наш механизм стимулирования. Графическое изображение механизма стимулирования для этого случая представлено на рисунке 3. Вариант 1. b > a (см. рисунок 3а) Очевидно, что при таком механизме АЭ выгодно минимизировать закупочную цену ( p$ ) не зависимо от значения
pпр и pср . При таком механизме стимулирования АЭ выгодно прогноз ( pпр ) делать как можно меньше (или что то же самое как можно ближе к pср , хотя АЭ не знает этого значения), но не переходить грань
pпр
0
(иначе АЭ в любом случае будет
оштрафован). Это обусловлено тем, что при приближении pпр к 94
pср величина штрафа уменьшается с максимальной скоростью. Таким образом, данный механизм, во-первых, обеспечивает максимальную точность предсказания и, во-вторых, полноценную защиту от манипулирования АЭ. а)b > a
б )b < a
Прем
Прем pср
b
pпр
pср
p
b
pпр
p
b -a a-b
b +a
Штр
b +a
Штр в) b = a Прем pср
b
pпр
p
b +a
Штр
Рис. 3. Графическое представление механизма стимулирования «от средней цены на рынке» (случай 2: средняя цена меньше прогнозной) Вариант 2. b < a (см. рисунок 3б) При данном механизме стимулирования остается стремление АЭ к максимально точному предсказанию (объяснение такое же, как и для варианта 1). Помимо этого, при использовании данного механизма стимулирования для АЭ не выгодно отклонение 95
закупочной цены ( p$ ) от прогнозной ( pпр ). Таким образом, хотя данный механизм и обеспечивает стремление АЭ к более точному предсказанию, но он не защищает от манипулирования ценой закупки. Вариант 3. b = a (см. рисунок 3в) Для данного механизма стимулирования, как и в вариантах 1 и 2, остается верным вывод о том, что АЭ стремится, как можно более точно предсказать цену реализации. А выгодность минимизации закупочной цены обуславливается в данном механизме только гипотезой благожелательности. Таким образом, можно рассматривать данный вариант как ослабление варианта 1. 4. Сводный результат Представим в виде таблицы результаты, полученные для вышеописанных механизмов стимулирования. Соотношение a иb
b >a b a оказывается неманипулируемым с точки зрения АЭ и позволяет добиться выполнения обоих целей стимулирования в поставленной задаче (в том числе и при нарушении гипотезы благожелательности).
96
Литература 1. НОВИКОВ Д.А. Стимулирование в организационных системах. М.: СИНТЕГ, 2003. – 305 с. 2. ГУБКО М.В., НОВИКОВ Д.А. Теория игр. М.: СИНТЕГ, 2002. – 139 с.
97
МОДЕЛИ И МЕТОДЫ РАСПРЕДЕЛЕНИЯ РЕСУРСА ПРИ УПРАВЛЕНИИ ПОРФТЕЛЯМИ ПРОЕКТОВ А.А. Матвеев1 (Институт проблем управления РАН, Москва) В настоящей работе в рамках теоретико-игрового подхода формулируется и решается задача распределения ресурсов между проектами, входящими в портфель проектов, реализуемых организацией. Основным результатом является формулирование условий на распределение ресурса, обеспечивающих согласование интересов всех участников организационной системы. 1. Введение Теоретико-игровые модели анализа и синтеза механизмов управления являются предметом исследований в теории управления организационными системами [2]. Специфика управления проектами заключается, в том числе, в том, что они реализуются в рамках матричных структур, в которых исполнитель оказывается подчинен одновременно нескольким "равноправным" управляющим органам – например, руководителю проекта и своему функциональному руководителю (в отличие от линейных структур, в которых существует древовидная иерархия подчинения [10]). Такие структуры получили название систем с распределенным контролем. Систематически впервые их модели исследованы в [16]. Полная характеризация решений задачи управления в системе с несколькими управляющими органами (центрами) и одним управляемым субъектом – агентом – получена в [7, 9]. В дальнейшем модели с распределенным контролем развивались в нескольких направлениях: в [5] получено решение задачи управления для двухуровневой системы с несколькими центрами и несколькими агентами, характеризуемыми векторными предпочтениями; в [2, 5, 7] изучалась роль высшего руководства в согласовании интересов центров; в [6] рассматривались модели так называемых Хструктур, в которых руководство исполнителями осуществляла 1
Статья написана совместно с Д.А. Новиковым.
98
управляющая компания; в [1] приведены модели матричных структур, в которых руководитель проекта обладает приоритетом принятия решений перед функциональным руководителем; в [14] изучена модель согласованного взаимодействия в четырехуровневой структуре с приоритетом функциональных руководителей над руководителями проектов. Помимо кратко рассмотренных выше систем с распределенным контролем, существуют еще несколько подходов к построению механизмов распределения ресурса. Во-первых, это подход, основывающийся на решении задач распределения ресурсов на сетях – решении задач дискретной оптимизации, позволяющих минимизировать время выполнения проекта или упущенную выгоду в ситуации, когда продолжительности работ проекта зависят от используемых на них количествах ресурса [2, 3]. Во-вторых, это – модели с сообщением информации, в которых количество ресурса, выделяемое агентам, зависит от их заявок. При этом возникает проблема манипулирования информацией, результаты исследования которой приведены в [4, 11]. Портфели проектов характеризуются, в частности, тем, что для них существенной оказывается возможность несовпадения интересов управляющих органов, отвечающих за реализацию (или заинтересованных в реализации) тех или иных проектов (будем дальше называть их руководителями проектов – РП) и владельцев ресурсов, необходимых для реализации проектов (условно будем называть последних функциональными руководителями – ФР). Поэтому возникает задача построения модели такого распределения ресурсов между проектами, входящими в портфель, которое позволяло бы согласовать интересы всех заинтересованных участников. Эта задача и решается ниже в настоящей работе. Для этого сначала дается общее описание модели (раздел 2), формулируется задача оптимального распределения ресурсов в рамках централизованной схему (раздел 3). Далее решение этой задачи (эффективность распределения ресурса) сравнивается с эффективностью использования схемы, учитывающей интересы ФР и РП (раздел 4) и с эффективностью введения трансфертных (внутрифирменных) цен на ресурс (раздел 5). Приведенный в заключительном разделе модельный пример, иллюстрирует полученные результаты. 99
2. Описание модели Пусть имеется множество N = {1, 2, …, n} проектов – претендентов на включение в портфель, и множество M = {1, 2, …, m} ресурсов различных видов. Обозначим yij ³ 0 – количество ресурса j-го вида, используемое при реализации i-го проекта, yi = (yi1, yi2, …, yim) – вектор ресурсов, используемых при реализации i-го проекта, jy = (jy1, jy2, …, jyn) – вектор распределения ресурса j-го вида, y = ||yij|| – матрица распределения ресурса, i Î N, j Î M. Обозначим Hi(yi) – доход, получаемый от реализации i-го проекта, в зависимости от количества ресурсов на нем, cj(jy) – затраты на использование ресурса j-го вида, i Î N, j Î M. 3. Централизованная схема Задача распределения ресурса в общем виде заключается в том, чтобы распределить ресурс, максимизируя "прибыль" – разность между доходом от реализации проектов и затратами на использование ресурса: c j ( j y ) ]. (1) x = arg max [ H i ( yi ) – { y ij ³ 0}
å
iÎN
å jÎM
Распределение ресурса в соответствии с (1) назовем централизованной схемой, так как она не учитывает интересов исполнителей работ по проектам и "владельцев" ресурсов и может быть реализована централизованно высшим руководством. Отметим, что, так как выше не оговаривались свойства функций дохода и затрат, то задача (1) имеет максимально общий вид и включает в себя как частные случаи, наверное, все мыслимые постановки задач распределения ресурсов между проектами, включая задачи формирования портфеля проектов (проекты, на которые в оптимальном решении не выделяются ресурсы, включать в портфель не следует). Действительно, например, ограниченность ресурсов может учитываться в функции затрат (так называемый метод штрафных функций), наряду с возможностью закупки ресурсов (привлечения кредитов) вне рассматриваемой организации; дискретность задачи (получения отличного от нуля дохода от реализации проекта только в случае, если на него выделено не менее заданного суммарного 100
количества ресурса или ресурсов в заданной комплектности) может учитываться в функции дохода и т.д. Итак, выражение (1) дает оптимальное распределение ресурсов между проектами портфеля, но не учитывает интересов участников организационной системы. Поэтому рассмотрим модель согласования интересов последних при распределении ресурсов. 4. Распределенный контроль: согласование интересов Пусть РП i выплачивает ФР j сумму lij за использование ресурса zij ³ 0, i Î N, j Î M. Условие компенсации затрат ФР (то есть условие согласованности выборов ФР [12, 16]) имеет вид: (2) сj(jz) = lij , j Î M.
å
iÎN
Вычислим максимальные выигрыши РП (при реализации наиболее выгодных для них по отдельности распределений ресурса): c j ( j y ) ], i Î N. Wi = max [Hi(yi) – { y ij ³ 0}
å
jÎM
Запишем условие того, что существует система платежей от РП к ФР, такая, что выигрыш каждого из РП не меньше, чем при независимой деятельности каждого из них: lij ³ Wi, i Î N. (3) Hi(zi) –
å jÎM
Из [16] известно, что условие согласованности интересов РП (между собой и с ФР) имеет вид: $ z: L(z) ¹ Æ, где (4) L(z) = {lij ³ 0, i Î N, j Î K | (2) и (3) }. Из [16] известно, что интересы РП могут быть согласованы тогда и только тогда, когда max [ H i ( yi ) – c j ( j y ) ] ³ Wi . { y ij ³ 0}
å
iÎN
å jÎM
å
iÎN
Получаем, что справедливо следующее утверждение: Утверждение 1. Если $ z: L(z) ¹ Æ, то L(x) ¹ Æ. Содержательно утверждение 1 означает, что, если согласование интересов РП возможно, то распределение ресурса, предлагае101
мое в рамках централизованной схемы, также является согласованным. Отметим, что это отнюдь не означает согласованность любого централизованного решения по распределению ресурса между проектами портфеля. 5. Трансфертные цены Частным, но достаточно распространенным на практике, случаем взаимодействия участников организационной системы при реализации портфеля проектов является использование так называемых трансфертных (внутрифирменных – различий между этими понятиями мы делать не будем) цен, определяющих стоимость использования РП единицы того или иного ресурса. Обозначим затраты РП на использование ресурса (5) cij(yij) = gj + bj yij, i Î N, j Î N. Отметим, что ставки gj и bj зависят только от вида ресурса и не зависят от того, в каких проектах ресурс используется (система цен является унифицированной). Тогда целевая функция j-го ФР имеет вид: (6) fj(jy) = n gj + bj yij – cj(jy), j Î M.
å
iÎN
Обозначим Yj =
åy
ij
и предположим, что cj(jy) = Cj(Yj),
iÎN
j Î M. Предположим, что функции затрат являются дифференцируемыми, выпуклыми (использование ниже условий первого порядка при поиске оптимального распределения ресурса неявно подразумевает, что реализованы будут все проекты из множества N) и равными в нуле нулю. Тогда оптимальное с точки зрения j-го ФР количество используемого ресурса имеет вид: (7) Y*j(bj) = Cj'-1(bj), j Î M. Условие того, что при использовании трансфертных цен каждый из ФР получит тот же выигрыш, что и при централизованной схеме, имеет вид: (8) n gj + bj Cj'-1(bj) = Сj( xij ), j Î M.
å
iÎN
Условие совпадения количеств ресурсов, выделяемых на каждый проект при централизованной схеме и при использовании трансфертных цен, запишем в виде 102
(9)
åx
ij
= Cj'-1(bj), j Î M.
iÎN
Таким образом, справедливо следующее утверждение. Утверждение 2. Использование централизованной схемы (1) при распределении ресурсов между проектами портфеля эквивалентно использованию системы трансфертных цен, удовлетворяющих (8) и (9). Подчеркнем, что при заданном оптимальном распределении ресурса (1) может не существовать эквивалентной системы трансфертных цен, то есть множество решений системы (8)-(9) может оказаться пустым. Аналогичным утверждению 2 образом можно записать условия эквивалентности механизма согласования интересов и механизма трансфертных цен (см. пример ниже). 6. Пример Рассмотрим пример (обобщающий соответствующие результаты, приведенные в [11]), иллюстрирующий применение описанного выше подхода для случая организационной системы с двумя проектами (и, соответственно, двумя РП) и одним видом ресурса (и, соответственно, одним ФР). Пусть у ФР имеется единичное количество ресурса (отметим, что количество ресурса фиксировано). Стратегией ФР является выбор действия y Î [0; 1], содержательно интерпретируемого как количество ресурса, выделяемого на первый проект. Соответственно, (1 – y) характеризует количество ресурса, выделяемого на первый проект. РП получают доходы, зависящие от того количества ресурса, которое было выделено на соответствующий проект: H1(y) = y, H2(y) = 1 – y. ФР несет затраты c(y) = a y2 / 2 + (1 – y)2 / 2, где a ³ 0. Минимум функции затрат ФР достигается при действии 1 / (1 + a). Определим наиболее выгодное для первого РП количество ресурса (максимизирующее разность между H1(y) и c(y)):
a £1 ì1, ï y1* = í 2 . ,a ³1 ïî1 + a 103
Выигрыш первого РП при этом равен
ì 1 - a / 2, a £ 1 ï
. W1 = í 3 - a ,a ³1
ïî 2(1 + a )
Определим наиболее выгодное для второго РП количество ресурса (максимизирующее разность между H2(y) и c(y)): y2* = 0. Выигрыш второго РП при этом равен W2 = 1 / 2. Определим действие y0, доставляющее максимум выражению [H1(y) + H2(y) – c(y)]: y0 = 1 / (1 + a), и вычислим следующую величину: W0 = [H1(y0) + H2(y0) – c(y0)] =
a +2 . 2(a + 1)
Условие согласованности имеет вид: W1 + W2 £ W0. Так как величины W1 и W0 зависят от параметра a, то можно найти множество значений этого параметра, при которых условие W1 + W2 £ W0 выполнено. Возможны следующие варианты: 1. a £ 1, при этом W1 + W2 ³ W0 и W1 ³ W2, следовательно, в данном диапазоне значений параметра a целесообразно весь ресурс выделить на первый проект; 2. a Î [1; 2], при этом W1 + W2 ³ W0 и W2 ³ W1, следовательно, в данном диапазоне значений параметра a целесообразно весь ресурс выделить на второй проект; 3. a ³ 2, при этом W1 + W2 £ W0, следовательно, в данном диапазоне значений параметра a целесообразно выделение ресурса и на первый, и на второй проект. Рассмотрим последний случай более подробно. Из условий согласования получаем, что должно иметь место
a a -1 a -1 , l2 £ , l1 + l2 = . 2(1 + a ) 2(1 + a ) 1+a a Положив l1 = l2 = l, получим: l = , что всегда удов2(1 + a ) a -1 летворяет условию l £ . 2(1 + a )
(10) l1 £
104
Таким образом, условия утверждения 1 выполнены при a ³ 2. При этом рассмотрение механизмов с внутрифирменной ценой за ресурс бессмысленно, так как суммарное количество ресурса фиксировано. В заключение рассмотрения примера найдем условия эквивалентности механизма согласования интересов и механизма трансфертных цен. Рассмотрим случай a £ 1. При этом весь ресурс расходуется на первый проект (имеет место режим конкуренции РП, характеризуемый аукционным решением их игры [16]) и ФР получает от первого РП вознаграждение, равное c( y1* ) + W2 + e, где e – сколь угодно малая строго положительная константа. Пусть теперь первый РП использует пропорциональную систему стимулирования ФР со ставкой b: sL(y) = g + b y. Целевая функция ФР имеет вид sL(y) – c(y). Выбираемое им действие максимизирует его целевую функцию, то есть: y*(b) =
1+ b . 1+a
Для того, чтобы побудить ФР отдать весь ресурс на первый проект руководителю первого проекта следует положить b = a, тогда y*(a) = 1. Для того, чтобы вознаграждение ФР при использовании линейной системы стимулирования совпадало с вознаграждением, получаемом в механизме согласования интересов, должно выполняться g = e + (1 – a) / 2. Заключение Таким образом, в настоящей работе рассмотрены три схемы распределения ресурса между проектами портфеля: централизованная; учитывающая интересы руководителей проектов и функциональных руководителей; и основанная на унифицированных трансфертных ценах за используемые ресурсы. Получены условия эквивалентности этих схем распределения ресурса. Литература 1 Балашов В.Г., Заложнев А.Ю., Иващенко А.А., Новиков Д.А. Механизмы управления организационными проектами. М.: ИПУ РАН, 2003. – 84 с. 105
2 Баркалов С.А., Бурков В.Н. Минимизация упущенной выгоды в задачах управления проектами. М.: ИПУ РАН, 2001. – 56 с. 3 Баркалов П.С., Буркова И.В., Глаголев А.В., Колпачев В.Н. Задачи распределения ресурсов в управлении проектами. М.: ИПУ РАН, 2002. – 65 с. 4 Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2004. – 400 с. 5 Гилев С.Е., Леонтьев С.В., Новиков Д.А. Распределенные системы принятия решений в управлении региональным развитием. М.: ИПУ РАН, 2002. – 54 с. 6 Гламаздин Е.С., Новиков Д.А., Цветков А.В. Механизмы управления корпоративными программами: информационные системы и математические модели. М.: Спутник, 2003. – 159 с. 7 Губко М.В. Механизмы управления организационными системами с коалиционным взаимодействием участников. М.: ИПУ РАН, 2003. – 118 с. 8 Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. М.: Синтег, 2002. – 148 с. 9 Караваев А.П. Модели и методы управления составом активных систем. М.: ИПУ РАН, 2003. – 151 c. 10 Новиков Д.А. Механизмы функционирования многоуровневых организационных систем. М.: Фонд «Проблемы управления», 1999. – 150 с. 11 Новиков Д.А. Теория управления организационными системами. М.: ИПУ РАН, 2005. – 472 с. 12 Новиков Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. – 312 с. 13 Новиков Д.А. Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. – 102 с. 14 Новиков Д.А., Суханов А.Л. Модели и методы управления научными проектами. М.: ИУО РАО, 2005. 15 Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: Апостроф, 2000 – 184 с. 16 Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. М.: ИПУ РАН, 2001. – 118 с. 106
СОГЛАСОВАННОЕ УПРАВЛЕНИЕ НАУЧНЫМИ ПРОЕКТАМИ А.Л. Суханов1 В настоящей работе формулируется и решается задача согласованного управления научными проектами в рамках четырехуровневой иерархической организационной структуры. Основным результатом является формулировка условий согласованности интересов руководства организации, функциональных руководителей, руководителей научных проектов и исполнителей. 1. Введение Теоретико-игровые модели анализа и синтеза механизмов управления являются предметом исследований в теории управления организационными системами [2]. Специфика управления проектами заключается, в том числе, в том, что они реализуются в рамках матричных структур, в которых исполнитель оказывается подчинен одновременно нескольким "равноправным" управляющим органам – например, руководителю проекта и своему функциональному руководителю (в отличие от линейных структур, в которых существует древовидная иерархия подчинения [11]). Такие структуры получили название систем с распределенным контролем. Систематически впервые их модели исследованы в [15]. Полная характеризация решений задачи управления в системе с несколькими управляющими органами (центрами) и одним управляемым субъектом – агентом – получена в [7, 9]. В дальнейшем модели с распределенным контролем развивались в нескольких направлениях: в [5] получено решение задачи управления для двухуровневой системы с несколькими центрами и несколькими агентами, характеризуемыми векторными предпочтениями; в [2, 5, 7] изучалась роль высшего руководства в согласовании интересов центров; в [6] рассматривались модели так называемых Хструктур, в которых руководство исполнителями осуществляла управляющая компания; в [1] приведены модели матричных структур, в которых руководитель проекта обладает приоритетом при1
Статья написана совместно с Д.А. Новиковым.
107
нятия решений перед функциональным руководителем. В упомянутых работах рассматривались теоретико-игровые модели, то есть модели, учитывающие активность поведения участников организационной системы. Кроме них существуют оптимизационные модели [3, 10], в рамках которых решается задача поиска иерархии управления, реализующей требуемые функции управления с минимальными затратами. В оптимизационных моделях целенаправленности поведения участников системы уделяется меньшее внимание, и их исследование выходит за рамки настоящей работы. Научные проекты, в частности, характеризуются тем, что в них нарушается "равноправность" руководителей проектов и функциональных руководителей – исполнители подчинены, в первую очередь, функциональным руководителям, и руководители научных проектов вынуждены согласовывать с последними условия привлечения исполнителей для участия в тех или иных проектах. Более того, иногда руководители проектов оказываются непосредственно подчинены тем или иным функциональным руководителям. Поэтому возникает задача построения модели системы управления научными проектами, и исследования в рамках этой модели условий согласования интересов всех участников системы. Эта задача и решается ниже в настоящей работе. 2. Описание модели Рассмотрим типичную для управления научными проектами структуру системы управления, включающую четыре уровня: высшее руководство (ВР), функциональных руководителей (ФР) – например, заведующих отделами, лабораториями или кафедрами, руководителей научных проектов (РП) и исполнителей – см. рисунок 1. Высшее руководство осуществляет планирование, обеспечение, координацию и контроль деятельности функциональных руководителей и руководителей проектов (всех или некоторых); функциональные руководители – руководителей проектов и исполнителей; руководители проектов – исполнителей. Так, на рисунке 1 представлена ситуация, когда все ФР подчинены ВР (в рамках линейной оргструктуры), часть РП (1-ый, j-ый и k-ый) также подчинены ВР (остальные РП – 2-ой и k–1-ый контролиру108
ются ВР через ФР). Некоторые РП подчинены ВР напрямую и ни контролируются ни одним из ФР (например первый РП). Исполнители подчинены и ФР и РП. Например, 1-ый исполнитель подчинен первому РП и второму ФР. Некоторые исполнители подчинены только руководителям проектов (например, второй и n-ый). Такие исполнители могут соответствовать внешним соисполнителям или сотрудникам временных трудовых коллективов, подчиненных РП. 0
ВР
2
1
ФР
1
РП
Исполнители
1
2
2
3
…
…
…
j
i
…
l
…
…
k-1
n-2
n-1
m
k
n
Рис. 1. Организационная структура системы управления научными проектами Введем следующие обозначения: N = {1, 2, …, n} – множество агентов (исполнителей); K = {1, 2, …, k} – множество руководителей проектов; M = {1, 2, …, m} – множество функциональных руководителей; yi Î Ai Í Âni , 0 Î Ai – действие i-го исполнителя, i Î N; 109
å ni
y = (y1, y2, …, yn) Î A' Í ÂiÎN
– вектор действий исполните-
лей;
ci(y) – функция затрат i-го исполнителя, i Î N; hj(y) – функция дохода j-го руководителя проекта, j Î K; Hl(y) – функция дохода l-го функционального руководителя, l Î M; H0(y) – функция дохода высшего руководства; sij(y) – функция стимулирования i-го агента со стороны j-го руководителя проекта, i Î N, j Î K; vil(y) – функция стимулирования i-го агента со стороны l-го функционального руководителя, i Î N, l Î M; ujl(y) – функция стимулирования j-го руководителя проекта со стороны l-го функционального руководителя, j Î K, l Î M; sj(y) – функция стимулирования j-го руководителя проекта со стороны высшего руководства, j Î K; ql(y) – функция стимулирования l-го функционального руководителя со стороны высшего руководства, l Î M. Структуру выплат между участниками системы поясняет рисунок 2.
ВР
0
sj(×)
H0(×) ql(×)
ФР
РП
Исполнитель
l Hl(×)
ujl(×)
vil(×) j
sij(×)
hj(×)
-ci(×)
i
Рис. 2. Структура выплат между участниками организационной системы 110
Относительно функции затрат i-го агента предположим, что функция ci(y) возрастает по действию i-го агента и равна нулю при выборе i-ым агентом нулевого действия. Все вознаграждения будем считать неотрицательными в ходе всего последующего изложения. Запишем целевые функции участников организационной системы. Целевая функция агента представляет собой сумму вознаграждений, полученных от всех руководителей проектов, в которых он участвует, плюс сумма вознаграждений, полученных от всех функциональных руководителей, которым он подчинен, минус собственные затраты агента1: s ij ( y) + vil ( y ) – ci(y), i Î N. (1) fi(si, vi, y) =
å
å
jÎK
l ÎM
Целевая функция руководителя проекта складывается из его дохода плюс сумма вознаграждений со стороны функциональных руководителей и высшего руководства за вычетом выплат исполнителям: u jl ( y ) + sj(y) – s ij ( y) , j Î K. (2) Fj(sj, uj, sj, y) = hj(y) +
å
å
l ÎM
iÎN
Целевая функция функционального руководителя складывается из его дохода полюс вознаграждение со стороны высшего руководства за вычетом вознаграждений, выплачиваемых руководителям проектов и исполнителей: (3) Fl(ql, ul, vl, y) = Hl(y) + ql(y) – u jl ( y ) – vil ( y ) , l Î M.
å jÎK
å
iÎN
Целевая функция высшего руководства складывается из его дохода за вычетом выплат функциональным руководителям и руководителям проектов: ql ( y ) – s j ( y) . (4) F0(y, s, q) = H0(y) –
å
l ÎM
å jÎK
Последовательность функционирования следующая. Сначала высшее руководство выбирает свою стратегию и сообщает ФР и
1 Условимся обозначать вектор стимулирований той же буквой, что и его компоненты, опуская соответствующий индекс.
111
РП вектор-функции стимулирования1 s(y) и q(y), затем ФР выбирают свои вектор-функции стимулирования u(y) и v(y), после чего свои вектор-функции s(y) выбирают РП, и, наконец, исполнители выбирают свои действия. В соответствии с общим подходом [13], обобщающим двухуровневые иерархические игры [4, 8] на случай иерархий произвольной глубины, равновесие игры участников системы определяется следующим образом. Сначала ищется равновесие Нэша игры агентов, зависящее от стратегий всех игроков всех более высоких уровней иерархии (то есть, РП, ФР и ВР). При известной этой зависимости ищется равновесие игры на следующем уровне иерархии (игры РП) в зависимости от стратегий всех игроков всех более высоких уровней иерархии (то есть, ФР и ВР). И так далее, до самого верхнего уровня иерархии, на котором решается задача максимизации выигрыша ВР. Понятно, что сформулированная задача чрезвычайно громоздка, так как в ней требуется искать зависимость равновесия (в игре, в которой стратегией игрока является выбор вектор-функции) от вектор-функций, выбранных участниками, находящимися на более высоких уровнях иерархии. Так, требуется, как минимум, найти:
å ni ÂiÎN -мерный вектор действий агентов, k × n равновесных функ-
ций стимулирования, выбираемых РП, m × n + m × k равновесных функций стимулирования, выбираемых ФР, и m + k оптимальных функций стимулирования, выбираемых ВР. Решить данную задачу "в лоб" для сколь-либо общего случая представляется невозможным. Поэтому воспользуемся известными результатами исследования подзадач исходной задачи. 3. Квазикомпенсаторное стимулирование и децентрализация игры агентов Одним из основных результатов исследования задачи стимулирования является принцип компенсации затрат [12]: при решении задачи синтеза оптимальной функции стимулирования доста1
Как и в любой иерархической игре, предполагается, что на момент принятия решений игрок знает стратегии, выбранные игроками, находящимися на всех более высоких уровнях иерархии.
112
точно ограничиться классом квазикомпенсаторных систем стимулирования, при использовании которых вознаграждение агента отлично от нуля и равно затратам агента только в случае выполнения последним плана, то есть выбора того действия, которое ему рекомендует центр. Поэтому фиксируем вектор действий исполнителей x Î A' и рассмотрим класс квазикомпенсаторных систем стимулирования:
ìs ij , yi = xi , i Î N, j Î K, î0, yi ¹ xi
(5) sij(x, y) = í
ìu jl , y = x , j Î K, l Î M, î0, y ¹ x
(6) ujl(x, y) = í
ì vil , yi = xi , i Î N, l Î M, î0, yi ¹ xi
(7) vil(x, y) = í
ìs j , y = x , j Î K, î0, y ¹ x ì ql , y = x (9) ql(x, y) = í , l Î M. î0, y ¹ x
(8) sj(x, y) = í
В соответствии с (5)-(9) ненулевые выплаты имеют место только в том случае, когда все участники стимулируют друг друга за выполнение одних и тех же планов, причем агенты выполняют планы. Отметим, что из (5) и (7) следует, что i-ый агент получает ненулевое вознаграждение (компенсацию затрат при любой обстановке игры) только в случае выполнения им соответствующей компоненты плана, независимо от того, выполнили ли планы остальные агенты. Соответствующий принцип управления был предложен в [14] и получил название принципа децентрализации игры агентов. Для сравнения отметим, что из (6), (8) и (9) следует, что вознаграждения ФР и РП отличны от нуля только в том случае, если все агенты выполнили планы. Исследуем теперь вопрос о том, в каких случаях агентам будет выгодно выполнять планы и какие при этом должны быть равновесные системы стимулирования (5)-(9). Соответствующее управление назовем согласованным. 113
4. Согласованное управление Задача поиска множества согласованных управлений заключается в формулировке условий того, что выбор соответствующих стратегий будет равновесием игры участников организационной системы на каждом из уровней иерархии. Другими словами, для каких планов найдется совокупность вознаграждений за выполнение этих планов (см. (5)-(9)), таких, чтобы агенты выполняли планы как равновесие Нэша своей игры, а выбор именно данных функций стимулирования был бы равновесием Нэша игры РП на своем уровне иерархии и ФР – на своем уровне. Имея решение этой задачи, в следующем разделе мы сформулируем и решим задачу синтеза оптимальных (с точки зрения ВР) согласованных управлений. Исследуем сначала игру агентов. Лемма 1. Если при использовании системы стимулирования агентов (5), (7) выполнено (10) s ij + vil ³ ci(x), i Î N,
å jÎK
å
l ÎM
то выбор действия yi = xi является доминантной стратегией i-го агента, i Î N. Справедливость утверждения леммы 1 следует из подстановки (5), (7) и (10) в определение доминантной стратегии [8]. Вычислим следующие величины: ci ( y ) ], j Î N, wj = max [hj(y) –
å W = max [H (y) – å c ( y ) ], l Î M. W = max [H (y) – å c ( y ) ]. yÎ A'
l
iÎN
l
yÎ A'
0
i
iÎN
yÎ A'
0
i
iÎN
Утверждение 1. При плане x Î A' множества Паретоэффективных равновесий Нэша игры руководителей проектов и Парето-эффективных равновесий Нэша игры функциональных руководителей не пусты тогда и только тогда, когда выполнено (10) и (11) hj(x) + u jl + sj – s ij ³ wj, j Î K.
å
l ÎM
114
å
iÎN
(12) Hl(x) + ql –
åu jÎK
(13) H0(x) –
åq
l
l ÎM
–
jl
–
ås
åv
il
³ Wl, l Î M.
iÎN j
³ W0.
jÎK
Утверждение 1 доказывается по аналогии с соответствующими утверждениями в [9, 15]. Назовем план x Î A' согласованным, если существует такой набор систем стимулирования, которые являются Паретоэффективными равновесиями игр ФР и РП, и при которых агенты выполняют план как равновесие своей игры. Также предположим, что в случае, когда множества равновесий игр ФР или РП состоят более чем из одной точки, ВР может выбирать любое конкретное равновесие из соответствующих множеств. Лемма 1 и утверждение 1 обосновывают справедливость следующего утверждения. Утверждение 2. Для того чтобы план x Î A' был согласованным достаточно выполнения условий (10)-(13). Утверждение 2 гласит, что заданный план будет согласованным, если для него найдется набор из [(n + 1) (k + m) + k m] вознаграждений: (14) {sij}i Î N, j Î K, {vil}i Î N, l Î M, {ujl}j Î K, l Î M, {ql}l Î M, {sj}j Î K, такой, что константы (14) удовлетворяют системе неравенств (10)(13). 5. Оптимальное согласованное управление Рассмотрим следующую задачу. Фиксируем план x Î A' и найдем (15) C(x) = min [ sj + ql ]. {( s , q ) | (10 ) - (13)}
å jÎK
å
l ÎM
Величина (15) характеризует минимальные затраты высшего руководства по реализации согласованного плана x Î A'. Для тех планов, для которых система неравенств (10)-(15) не имеет решения, положим затраты (15) равными плюс бесконечности. С учетом (15) целевая функция (4) ВР примет вид: (16) F0(x) = H0(x) – C(x). Оптимальным согласованным планом будет 115
(17) x* = arg max [H0(x) – C(x)]. xÎ A '
По аналогии с результатами, приведенными в [5, 12], можно показать, что условием существования согласованного плана является следующее неравенство: max [H0(x) + H l ( x) + h j ( x) – ci ( x ) ] ³
å
xÎ A '
å
l ÎM
jÎK
å
iÎN
³ W0 +
åW
l
l ÎM
+
åw
j
.
jÎK
Таким образом, решение задачи согласованного управления научными проектами в рамках рассматриваемой модели состоит из двух этапов: на первом этапе для каждого плана x Î A' проверить возможность его согласования (существования величин (13), удовлетворяющих (10)-(12)) и найти затраты (14) ВР; на втором этапе найти оптимальный согласованный план (16). Задача, решаемая на первом этапе, хотя и является задачей линейного программирования, выглядит достаточно громоздко, тем более что решать такие задачи нужно для каждого плана x Î A'. Поэтому особенно привлекательно выглядит демонстрируемая ниже возможность нахождения аналитических решений. Из (10)-(13) получаем, что для значения (15) справедлива следующая оценка: " x Î A' (18) C(x) ³ Wl + wj – H l ( x) – h j ( x) + ci ( x ) .
å
å
l ÎM
jÎK
å
l ÎM
å jÎK
å
iÎN
Таким образом, обоснована справедливость следующего утверждения: Утверждение 3. Для максимального выигрыша ВР справедлива следующая оценка: (19) F *0 £ H0(x**) – C(x**) где (20) x** = arg max [H0(x) + H l ( x) + h j ( x) – ci ( x ) ]. xÎ A '
å
l ÎM
å jÎK
å
iÎN
Интересно отметить, что согласованный план (20) максимизирует сумму целевых функций всех участников системы – ВР, ФР, РП и исполнителей, то есть является Парето-оптимальным с точки зрения системы в целом. 116
6. Заключение Таким образом, в настоящей работе найдены простые содержательно интерпретируемые условия согласования интересов в четырехуровневой системе распределенного управления научными проектами. Перспективным направлением дальнейших исследований представляется обобщение полученных результатов на случай систем с неполной информированностью управляющих органов. Литература1 * 1 Балашов В.Г., Заложнев А.Ю., Иващенко А.А., Новиков Д.А. Механизмы управления организационными проектами. М.: ИПУ РАН, 2003. – 84 с. 2 Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2004. – 400 с. * 3 Воронин А.А., Мишин С.П. Оптимальные иерархические структуры. М.: ИПУ РАН, 2003. – 210 с. 4 Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976. – 327 с. * 5 Гилев С.Е., Леонтьев С.В., Новиков Д.А. Распределенные системы принятия решений в управлении региональным развитием. М.: ИПУ РАН, 2002. – 54 с. * 6 Гламаздин Е.С., Новиков Д.А., Цветков А.В. Механизмы управления корпоративными программами: информационные системы и математические модели. М.: Спутник, 2003. – 159 с. * 7 Губко М.В. Механизмы управления организационными системами с коалиционным взаимодействием участников. М.: ИПУ РАН, 2003. – 118 с. * 8 Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. М.: Синтег, 2002. – 148 с. * 9 Караваев А.П. Модели и методы управления составом активных систем. М.: ИПУ РАН, 2003. – 151 c. * 10 Мишин С.П. Оптимальные организационные иерархии в социально-экономических системах. М.: ПМСОФТ, 2004. – 207 с.
1
Работы, отмеченные звездочкой, можно найти на сайте теории управления организационными системами www.mtas.ru.
117
*
11 Новиков Д.А. Механизмы функционирования многоуровневых
организационных систем. М.: Фонд «Проблемы управления», 1999. – 150 с. 12 Новиков Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. – 312 с. * 13 Новиков Д.А. Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. – 102 с. * 14 Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: Апостроф, 2000 – 184 с. * 15 Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. М.: ИПУ РАН, 2001. – 118 с.
118
СЕТЕВЫЕ МОДЕЛИ РЕАЛИЗАЦИИ ПОРТФЕЛЯ ЗАКАЗОВ К.А. Сухачев, А.В. Цветков1 (Институт проблем управления РАН, Москва) Введение. Настоящая работа посвящена рассмотрению моделей возникновения сетевых организационных структур – совокупности связей между равноправными агентами, совместно выполняющими портфель заказов. Структура изложения следующая – сначала проводится краткий обзор основных подходов к моделированию сетевых структур, затем рассматривается модель образования связей между агентами, и, наконец, модель возникновения веерной структуры. Сетевые структуры. В качестве типовых структур организационных систем (ОС) в [11] выделены следующие. Во-первых, это – вырожденная структура (ВС), в которой отсутствуют какие-либо связи между участниками. Во вторых, это – линейная структура (ЛС), при которой подчиненность участников ОС имеет вид дерева, то есть каждый участник подчинен одному и только одному участнику следующего (более высокого) уровня иерархии (следует отметить, что в подавляющем большинстве работ, содержащих формальные модели управления организационными системами, рассматривались модели ОС, характеризуемые именно древовидными структурами). И, наконец, в третьих, это – матричная структура (МС), в которой некоторые участники ОС могут быть подчинены одновременно нескольким участникам, находящимся либо на одном и том же (более высоком), либо на различных, уровнях иерархии (соответственно, так называемое двойное подчинение, межуровневое взаимодействие и распределенный контроль [13]). Если типовые структуры отражают статические характеристики ОС, то для описания их изменений во времени целесообразно введение понятия сетевой структуры (СС), в которой потенциально существуют связи между всеми участниками, некоторые из которых актуализируются, порождая из ВС линейную или матричную, на время решения стоящей перед системой задачи, а затем разрушаются (возвращаясь к ВС) до момента появления новых задач. То 1
Статья написана совместно с Д.А. Новиковым. 119
есть, сетевые структуры – это такие структуры ОС, в которых могут возникать и двойное подчинение, и межуровневое взаимодействие, причем одни и те же субъекты могут выступать как в роли управляющих органов, так и в роли управляемых агентов, то есть вступать в сетевое взаимодействие [11]. Образно говоря, сетевая структура – набор априори равноправных агентов, в котором могут возникать временные иерархические и другие структуры, определяемые решаемыми системой задачами. Упорядоченность взаимодействия и механизм управления (иерархия) возникает в сетевой структуре в результате необходимости специализации, позволяющей эффективно решать частные задачи. Например, в процессе многократного решения схожих задач ЛС возникает в СС как механизм снижения трансакционных издержек. Другими словами, разнообразие решаемых задач порождает в вырожденной структуре организационные системы как временные иерархии. Следовательно, тип структуры ОС, обнаруживаемый исследователем, зависит от времени наблюдения – на больших (по сравнению с характерным временем изменения внешних условий) временных промежутках ОС может рассматриваться как сеть, на малых – как имеющая одну из типовых структур – ВС, ЛС или МС. В большинстве моделей теории активных систем [3], теории иерархических игр [4] и других разделов теории управления социально-экономическими системами подчиненность участников ОС считается заданной. В работах по экономике и менеджменту обсуждаются преимущества и недостатки различных организационных структур, в том числе – сетевых, но формальные задачи синтеза оптимальных структур даже не упоминаются. В многочисленных работах, посвященных задачам оптимизации иерархических структур (см. обзор в [8]), практически не учитывается характерная для участников ОС целенаправленность поведения, либо исследуется взаимодействие агентов с фиксированными ролями, находящихся на различных уровнях иерархии. Первое замечание справедливо и для чрезвычайно популярных на сегодняшний день программных многоагентных систем – см. обзор [6]. Опишем различие между «ролями» участников ОС. Целенаправленное (активное) поведение в теории управления обычно описывается в рамках теоретико-игровых моделей [9]. Качественное отличие иерархических игр [4, 9] от «обычных» неантагони120
стических игр заключается в наличии упорядочения участников ОС по последовательности выбора стратегий (напомним, что стратегией агента называется правило выбора им действий в зависимости от информации, имеющейся на момент осуществления выбора). Традиционно считается, что управляющий орган – центр – обладает правом первого хода, то есть, выбирает свою стратегию первым и сообщает ее другим участникам системы – управляемым субъектам – агентам. В зависимости от того, может ли центр рассчитывать на то, что ему станет известно действие агента, он может выбирать свою стратегию либо как в «обычной» игре (то есть в виде отображения имеющейся у него информации во множество действий), либо в виде «функции» от выбора второго агента [4] (то есть в виде отображения имеющейся у него информации во множество функций, отображающих множество действий второго агента во множество действий первого), либо в более сложной форме – см. метаигры в [9]. Тем самым первый агент превращается в метаагента, устанавливающего «правила игры» для остальных агентов (проявление отношения власти [10]). Таким образом, критерием отнесения конкретного участника, например, двухуровневой ОС к множеству управляющих органов или к множеству управляемых субъектов является его приоритет в последовательности выбора стратегий и возможность выбирать в качестве своей стратегии «функцию» от действий (или в более общем случае – стратегий) агентов, имеющих более низкий приоритет [11]. Например, если в некоторой ОС участники принимают решения последовательно, и имеются три «момента» принятия решений, то можно условно рассматривать данную ОС как трехуровневую иерархическую систему. Участники, делающие первый ход, при этом интерпретируются как центры верхнего уровня иерархии (метацентры), участники, делающие второй ход, интерпретируются как центры промежуточного уровня (центры), а участники, выбирающие свои действия последними – как управляемые субъекты (активные элементы [3]). Стратегии метацентров могут быть функциями от стратегий центров промежуточного уровня и управляемых субъектов и т.д. Следовательно, в рамках теоретико-игровой модели иерархическая структура ОС порождается фиксацией последовательности 121
выбора стратегий, свойств множеств допустимых действий и информированности участников. Таким образом, в процессе сетевого взаимодействия каждый из его участников в общем случае может выступать в роли центра того или иного уровня иерархии. Фактическая роль участника определяется двумя факторами. Первый фактор заключается во влиянии имеющегося отношения власти, то есть институциональной возможности определенного участника выступать в той или иной роли. Второй фактор заключается в целесообразности (эффективности, в том числе и экономической) этой роли, как с точки зрения самого участника, так и с точки зрения других участников (причем в моделях горизонтальной «интеграции» должны рассматриваться все рациональные комбинации потенциальных участников ОС). Фиксируем экзогенно заданное отношение власти и рассмотрим эффективность различных распределений ролей между участниками ОС. Другими словами, предположим, что имеются несколько агентов (участников ОС), каждый из которых может выбирать свои стратегии в определенные моменты времени и в зависимости от принятой последовательности выбора стратегий делать свое действие зависящим от стратегий участников, осуществляющих выбор позже него. Получаем метаигру с переменным составом агентов (который в свою очередь подлежит определению) – игру, в которой определяются роли участников (будем считать, что их выигрыши при каждом фиксированном распределении ролей могут быть вычислены). Подробное исследование теоретико-игровых моделей структурного синтеза проведено в работе [11]. Полученные в ней результаты можно разделить на несколько классов. Основным качественным результатом является осознание соответствия между структурой организационной системы и типом игры, которой описывается взаимодействие участников системы, а также вытекающая из этого соответствия формулировка задачи структурного синтеза как задачи поиска оптимальной (в смысле критерия эффективности, определенного на множестве состояний агентов, являющихся равновесиями их игры при данной структуре) структуры, или, что тоже самое – поиска оптимального распределения ролей 122
между агентами. «Количественные», то есть формальные, результаты относятся к: - характеризации решений задач структурного синтеза (для веерных структур, линейных ОС, структур с побочными платежами, а также для ОС, агенты которых характеризуются ограниченной рациональностью и для задач последовательного синтеза); - получению условий, при которых равновесное состояние агентов в той или иной степени не зависит от структуры; - собственно решению задач структурного синтеза (для однородных ОС, для двухуровневых ОС, для ОС с побочными платежами, а также для ОС, агенты которых характеризуются ограниченной рациональностью); - исследованию задач формирования сетевых структур для ряда прикладных моделей (модель внутренних цен, модель размещения производственного заказа и модель управления проектом). Модель реализации портфеля заказов. Рассмотрим множество N = {1, 2, …, n} агентов, каждый из которых может реализовывать множество M = {1, 2, …, m} операций (работ). Обозначим: Lik – ограничение сверху на объем k-ой работы, который может выполнить i-ый агент; cijk – затраты на выполнение единичного объема k-ой работы j-ым агентом для i-го агента (сколько i-ый агент должен заплатить j-му агенту, j ¹ i); qi = (qi1, qi2, …, qin) – внешний заказ i-му агенту, где qik – объем k-ой работы; Hi – стоимость i-го заказа, i, j Î N, k Î M; q = (q1, q2, …, qn) – портфель заказов. Введем следующие предположения: (1) ciik £ min cijk, i Î N, k Î M, jÎN
то есть выполнять любую работу "из своего заказа" любому агенту дешевле самому, нежели чем заказывать ее у другого агента; (2) ciik qik £ Hi, i Î N,
å
k ÎM
то есть без учета ограничений на максимальные объемы работ самостоятельное выполнение заказа выгодно всем агентам; (3) Lik ³ qik , k Î M,
å
iÎN
å
iÎN
123
то есть с точки зрения технологических ограничений портфель заказов реализуем данным набором агентов. Введем n2×m переменных xijk – объем k-ой работы, выполняемой j-ым агентом для i-го агента (величину xiik можно считать собственным объемом k-ой работы i-го агента), i, j Î N, k Î M. Тогда условие выполнения портфеля заказов можно записать в виде: (4) xijk ³ qik, i Î N, k Î M,
å jÎN
где (5)
åx
ijk
Î [0; Ljk], j Î N, k Î M.
iÎN
Целевую функцию i-го агента можно определить как разность между его доходом (стоимостью его заказа) и затратами на собственные работы, плюс платежи со стороны других агентов за выполненные для них работы: (6) fi(x) = Hi – [ сijk xijk - (c jik - ciik ) x jik ] , i Î N,
åå
k ÎM jÎN
å jÎN
где x = ||xijk||. Если считать, что каждый агент может отказаться участвовать в выполнении заказов и получить нулевой выигрыш (доход и затраты агента в случае его отказа от участия в выполнении заказов будем считать равными нулю), то условие участия примет вид: (7) fi(x) ³ 0, i Î N. Так как агенты активны, то рассмотрим задачу максимизации суммы целевых функций всех агентов при условии, что весь портфель заказов выполняется, причем выполняется всем коллективом агентов. Задача максимизации суммы целевых функций (6) после несложных преобразований (с учетом того, что при выполнении портфеля заказов сумма доходов агентов постоянна) примет вид: (8) сiik x jik ® min .
åå
i , j ÎN k ÎM
{ x | ( 4 ), ( 5 ), ( 7 )}
Можно также сформулировать n задач поиска наиболее выгодного с точки зрения каждого из агентов распределения объемов работ: 124
(9)
å[ å с
x - å (c jik - ciik ) x jik ] ®
ijk ijk
k ÎM jÎN
jÎN
min
{ x | ( 4 ), ( 5 ), ( 7 )}
, j Î N.
Задачи (8) и (9) являются задачами линейного программирования2. Если m = 1, то без учета условий участия получим аналог транспортной задачи [1]. Если на выполняемые агентами или заказываемые работы наложены ограничения снизу или ограничения комплектности, то получим более сложную задачу – задачу дискретной оптимизации [1]). Особенно просто решается без учета условия участия задача (8). Ее оптимальное решение таково: для каждой работы упорядочиваем агентов в порядке возрастания "собственных" затрат, а затем загружаем их по-максимуму, начиная с первого, до тех пор, пока не будет выполнен суммарный заказ по рассматриваемой работе. Обозначим X0 – множество решений задачи (8), Xj – множество решений j-ой задачи в системе задач (9). Если рассмотреть кооперативную игру с нетрансферабельной полезностью [9], в которой j-ый агент выбирает ||xijk||i Î N, k Î M, то достаточное условие непустоты С-ядра этой игры дается следующим утверждением: Утверждение 1. Для возможности полного согласования интересов агентов достаточно выполнения следующего условия: (10) X j Ç X0 ¹ Æ.
I
jÎN
Отметим, что имеет место следующая система соотношений: " i Î N, " xi Î Xi, " x0 Î X0 f j ( x0 ) . f j ( xi ) £
å jÎN
å jÎN
Если допустить возможность передачи полезности между агентами, то получим игру с трансферабельной полезностью [9], кроме того, рассматриваемую задачу можно интерпретировать и как задачу формирования торговой сети [7]. Трансфертная цена. Рассмотрим в рамках описанной выше модели задачу определения системы трансфертных цен (lk)k Î M, по
2
Отметим, что по аналогии с (8) и (9) можно рассматривать задачу поиска минимальных ограничений на объемы работ, при которых портфель заказов реализуем, и другие задачи.
125
которым агенты могут обмениваться соответствующими ресурсами. Ограничения (4) и (5) не изменятся, а целевая функция i-го агента примет вид: [( lk - ciik ) x jik - lk xijk ] , i Î N. (11) fli(x) = Hi +
å
å
k ÎM
å
j ÎN
j ÎN
Условие участия примет вид: (12) fli(x) ³ 0, i Î N. Задача максимизации суммы целевых функций (11) примет вид: (13) сiik x jik ® min ,
åå
{ x | ( 4 ), ( 5 ), (12 )}
i , j ÎN k ÎM
а также n задач поиска наиболее выгодного с точки зрения каждого из агентов распределения объемов работ: min , j Î N. [( lk - ciik ) x jik - lk xijk ] ®
å
k ÎM
å
å
j ÎN
{ x | ( 4 ), ( 5 ), (12 )}
j ÎN
Отметим, что целевые функции в задачах (8) и (13) совпадают. Ограничения (4) и (5) в этих задачах одинаковы, отличие состоит лишь в ограничениях (7) и (12). Обозначим L = {l = (l1, l2, …, lm) | $ x Î (4) Ç (5) Ç (12)}. Из (13) следует, что, если L ¹ Æ, то существует система трансфертных цен, максимизирующая сумму целевых функций всех агентов. 0 Пусть || xijk (l)|| – решение задачи (13) при системе трансфертных цен l Î L. Тогда из (11) следует, что для i-го агента наиболее выгодны цены из множества 0 Li = Arg max lk ( x 0jik ( l ) - xijk ( l )) , i Î N. l ÎL
å å
k ÎM
j ÎN
Получаем, что справедливо следующее утверждение. Утверждение 2. Для существования системы трансфертных цен, полностью согласованной с интересами агентов, достаточно выполнения следующего условия: L j ¹ Æ.
I
jÎN
Итак, выше описана задача распределения работ между агентами при реализации одного портфеля заказов. Если перейти к 126
анализу потока портфелей заказов, то исследование выгодности установления долговременных связей между агентами можно производить по аналогии с тем, как это делалось в [5]. Синтез веерной структуры. Выше при рассмотрении модели реализации портфеля заказов предполагалось, что все агенты равноправны. Предположим теперь, что рассматриваются варианты назначения одного из агентов центром, то есть перехода от вырожденной структуры к веерной. Содержательная интерпретация подобной модели такова: заказчик, которому необходимо реализовать портфель заказов, может обратиться к любому из n агентов, каждый из которых (став центром) назначит систему цен, наиболее выгодную для него среди тех цен, которые максимизируют сумму целевых функций всех агентов и обеспечивают выполнение условия участия для каждого из них. Очевидно, что заказчику следует обратиться к тому из агентов, кто, став центром, выберет такую систему цен, которая обеспечит заказчику минимум суммарных затрат на выполнение портфеля заказов. В условиях благожелательности агентов к заказчику (из всех систем цен, обеспечивающих ему одинаковую полезность, агент выберет такую систему цен, которая наиболее выгодна для заказчика) получаем, что с точки зрения заказчика наиболее эффективно обратиться к агенту из следующего множества: lik q jk . Arg min min iÎN
lik ÎL i
åå jÎN k ÎM
Заключение. Рассмотренные в настоящей работе сетевые модели реализации портфеля заказов характеризуются достаточно высокой сложностью (особенно проверка условий согласования в утверждении 2 и поиск оптимального назначения центра в веерной структуре). Поэтому перспективным направлением будущих исследований представляется рассмотрение упрощений аналогичных моделей, которые допускали бы анализ зависимости свойств оптимального решения от параметров модели. ЛИТЕРАТУРА 1. Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. М.: Синтег, 2001. 127
2. Бурков В.Н., Кузнецов Н.А., Новиков Д.А. Механизмы управления в сетевых структурах // Автоматика и Телемеханика. 2002. № 12. С. 96 – 115. 3. Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2003. 4. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976. 5. Гламаздин Е.С., Новиков Д.А., Цветков А.В. Механизмы управления корпоративными программами: информационные системы и математические модели. М.: Спутник, 2001. 6. Городецкий В.И., Грушинский М.С., Хабалов А.В. Многоагентные системы // Новости искусственного интеллекта. 1998. № 2. С. 64 – 116. 7. Губко М.В. Теоретико-игровая модель формирования торговой сети / Управление большими системами. М.: ИПУ РАН, 2003. Выпуск 6. С. 56 – 83. 8. Губко М.В., Коргин Н.А., Новиков Д.А. Классификация моделей анализа и синтеза организационных структур / Сборник трудов "Управление большими системами". Выпуск 6. М.: ИПУ РАН, 2004. С. 5 – 21. 9. Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. М.: Синтег, 2002. 10. Новиков Д.А. Механизмы функционирования многоуровневых организационных систем. М.: Фонд "Проблемы управления", 1999. 11. Новиков Д.А. Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. 12. Новиков Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. 13. Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. М.: ИПУ РАН, 2001. 14. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: Синтег, 2003.
128
СВЕДЕНИЯ ОБ АВТОРАХ Богатырев Владимир Дмитриевич – к.т.н., доцент факультета экономики и управления Самарского аэрокосмического университета,
[email protected]. Выборнов Роман Анатольевич – аспирант Института проблем управления РАН, Москва,
[email protected]. Залесов Александр Иванович – студент Московского физикотехнического института, Москва,
[email protected]. Заложнев Алексей Юрьевич – д.т.н., ведущий научный сотрудник Института проблем управления РАН, Москва,
[email protected]. Ермаков Николай Сергеевич – аспирант Самарского государственного аэрокосмического университета, Самара,
[email protected] Иващенко Андрей Александрович – к.т.н., докторант Института проблем управления РАН, Москва,
[email protected]. Искаков Михаил Борисович – – аспирант Института проблем управления РАН, Москва,
[email protected]. Куропаткин Михаил Алексеевич – аспирант Института проблем управления РАН, Москва,
[email protected]. Матвеев Алексей Александрович – аспирант Института проблем управления РАН, Москва,
[email protected]. Москвитина Марина Анатольевна – ведущий инженер Института проблем управления РАН, Москва,
[email protected].
129
Новиков Дмитрий Александрович – д.т.н., ведущий научный сотрудник Института проблем управления РАН, Москва,
[email protected]. Соболев Александр Владимирович – аспирант Российского научно-исследовательского и проектно-конструкторского института информатизации, автоматизации и связи, Москва,
[email protected]. Суханов Аркадий Леонидович – соискатель Института проблем управления РАН, Москва,
[email protected]. Сухачев Кирилл Александрович – аспирант Института проблем управления РАН, Москва,
[email protected]. Харитонов Валерий Алексеевич – профессор Пермского государственного технического университета, Пермь,
[email protected]. Цветков Александр Васильевич – д.т.н., ведущий научный сотрудник Института проблем управления РАН, Москва,
[email protected]. Ярусова Ирина Николаевна – ведущий инженер Института проблем управления РАН, Москва,
[email protected].
130