ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Федеральное государственное образовательное учреждение высшего профессионального образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Угольницкий Г.А. МЕТОДИЧЕСКИЕ УКАЗАНИЯ по специальному курсу «Дискретные модели системного анализа» для студентов факультета математики, механики и компьютерных наук
Ч.3 МОДЕЛИ ГРУППОВОГО ВЫБОРА
Ростов-на-Дону 2008 1
Методические указания разработаны доктором физико-математических наук, профессором кафедры прикладной математики и программирования Г.А.Угольницким
Ответственный редактор
канд. физ.-мат. наук А.Б.Усов
Компьютерный набор и верстка
ст. лаборанта И.В.Евдокимовой
Печатается в соответствии с решением кафедры прикладной математики и программирования факультета математики, механики и компьютерных наук ЮФУ, протокол №1 от 4 сентября 2008 г. 2
СОДЕРЖАНИЕ Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1 Правила и парадоксы группового выбора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Совместное ранжирование субъектов и альтернатив . . . . . . . . . . . . . . . . . . . . . . 20 3 Коллективные решения на основе расстояний между ранжировками . . . . . . . . 28 4 Марковские модели группового принятия решений . . . . . . . . . . . . . . . . . . . . . . 39 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .48
3
ВВЕДЕНИЕ Методические указания «Модели группового выбора» предназначены для поддержки специального курса «Дискретные модели системного анализа» магистерской программы «Математическое и информационное обеспечение управления организационными и эколого-экономическими системами» по направлению подготовки «Прикладная математика и информатика». Объем раздела соответствует 16 лекциям. Содержание раздела «Модели группового выбора» указанного спецкурса включает следующие темы: – постановка задачи и понятие функции группового выбора; – сравнительный анализ распространенных правил группового выбора; – основные «парадоксальные» результаты теории группового выбора (теоремы Эрроу, Сена, Гиббарда-Саттертуэйта); – построение группового профиля по количественной или качественной совмещенной
шкале
субъектов
и
альтернатив
с
выбором
медианного
предпочтения в качестве группового (подход Кумбса); –
определение
группового
выбора
на
основе
расстояния
ранжировками (подход Кемени-Снелла); – определение группового решения с помощью цепей Маркова. Изложение сопровождается упражнениями по каждой теме.
4
между
1 ПРАВИЛА И ПАРАДОКСЫ ГРУППОВОГО ВЫБОРА Пусть имеется множество (группа) субъектов N={1,2,…,n}, которым нужно сделать
выбор
из
конечного
множества
альтернатив
A={a,b,…,m}.
Предполагается, что каждый субъект имеет свои предпочтения на множестве альтернатив, а именно для любого i ∈N и любой пары альтернатив a,b ∈ A либо а лучше b (aPib), либо b лучше а (bPia), либо а и b эквивалентны (aEib) . Отношение предпочтения на множестве альтернатив Pi считается строгим слабым порядком, т.е. удовлетворяет свойствам: а) асимметричности: aPib и bPia не выполняются одновременно; б) транзитивности: если аPib и bPic, то аPic. Обозначим через Р(А) множество всех возможных ранжировок альтернатив из А, порождаемых отношениями предпочтения. Например, если A={a,b,c}, то множество возможных ранжировок Р(А) есть a a b b c c
a
b
c
b c a c a b b-c a-c a-b
a-b
a-c
b-c
c
b
a
a-b-c
c b c a b a В каждой ранжировке альтернативы упорядочены по предпочтению сверху вниз,
черточка
означает
эквивалентность
соответствующих
альтернатив.
Очевидно, Pi ∈ P(А). После того, как все субъекты из N упорядочили (ранжировали) альтернативы из А в соответствии со своими предпочтениями, возникает групповой профиль предпочтений GP(A) , например: P1
P2
P3
P4
a
b
a
b
b
a
b-c
a
c
c
c
5
Тогда GPS(A) = P(A) x P(A) x … x P(A) (n раз) есть множество возможных групповых профилей на А для группы N, GP(A) ∈ GPS(A). Задача группового выбора заключается в следующем: по данному групповому профилю определить группировку альтернатив, отражающую общее мнение группы. Иначе говоря, речь идет о построении функции (правила) группового выбора F : GPS(A) → P(А). Примером может служить правило простого большинства: в групповой ранжировке а выше b тогда и только тогда, когда более половины субъектов считают, что а выше b. Пусть, например, групповой профиль имеет вид P1
P2
P3
a
a
c
b
c
a
c
b
b
Здесь для трех субъектов а лучше b, для двух а лучше с и для двух с лучше b. Таким образом, групповая ранжировка имеет вид a c b Рассмотрим теперь групповой профиль P1
P2
P3
a
b
c
b
c
a
c
a
b 6
Здесь для двух субъектов а лучше b, для двух b лучше с и для двух с лучше а. Но строгого слабого порядка с такими свойствами не существует, поскольку нарушается условие транзитивности. Данный профиль иллюстрирует так называемый
парадокс
Кондорсе,
показывающий,
что
правило
простого
большинства не всегда позволяет решить задачу группового выбора. Строго говоря, правило простого большинства определяет функцию группового выбора не для всех возможных групповых профилей. Другим примером правила группового выбора служит так называемое правило Борда1. Обозначим через Bi(a) – число альтернатив ниже а в ранжировке Pi , B(a) = B1(a) + … + Bn(a) – число Борда для альтернативы а. Тогда в групповой ранжировке а выше b тогда и только тогда, когда B(a)>B(b). Например, пусть групповой профиль имеет вид P1
P2
P3
P4
a
b
a-b
c
b
c
c
a-b
c
a
d
d
d
d Здесь B(a)=7, B(b)=8, B(c)=7, D(d)=0. Поэтому групповая ранжировка по
Борда имеет вид b a-с d Правило Борда всегда позволяет получить групповую ранжировку, но иногда результат его применения может оказаться парадоксальным. Рассмотрим профиль 1
Ж.М. де Кондорсе, Ж-Ш.де Борда – французские математики XVIII века, основоположники теории группового выбора.
7
P1
P2
P3
P4
P5
a
a
a
a
b
b
b
b
b
c
c
c
c
c
d
d
d
d
d
e
e
e
e
e
f
f
f
f
f
a
Здесь В(а)=20, B(b)=21, поэтому в групповой ранжировке по Борда должно быть а выше b, хотя четыре из пяти субъектов в группе думают иначе. Классическим подходом к построению функции группового выбора является аксиоматический подход. Американский математик К.Эрроу предложил ряд аксиом для функции группового выбора и получил парадоксальный результат, принесший ему впоследствии Нобелевскую премию по экономике. Аксиома 1 (монотонность). Если функция группового выбора определяет по данному профилю, что а лучше b, то это предпочтение сохранится, если изменить профиль следующим образом: а) индивидуальные предпочтения для пар альтернатив, не содержащих а, не меняются; б) индивидуальное предпочтение для а и любой другой альтернативы может измениться только в пользу а. Пусть N = {1,2,3,4}, A={«Тойота», «Ниссан», «Мазда»} = {Т,Н,М}. Пусть выбор субъектов определяет групповой профиль P1
P2
P3
P4
Т
Н
Н
М
Н
Т
Т
Т-Н
М
М
М 8
Пусть функция группового выбора определяет ранжировку Т Н М Рассмотрим теперь профиль P’1
P’2
P’3
P’4
Т
Т
Н
М
Н
Н
Т
Т
М
М
М
Н
Тогда, если в качестве альтернативы а из аксиомы 1 взять Т, то в групповой ранжировке должно быть по-прежнему Т лучше Н, поскольку P’1 = P1 , P’3= P3 , в P’2 Т по-прежнему лучше М и стала (в отличие от P2 ) лучше Н, в P’4 Т по-прежнему лучше Н. Аксиома 2 (локальность). Пусть А1 – подмножество А. Если при изменении профиля индивидуальные предпочтения для альтернатив из А1 сохранятся, то групповые предпочтения для исходного и измененного профилей на А1 также должны совпадать. Пусть N = {1,2,3}, A= {Т,Н,М,С,Х}, где С – «Субару», Х –«Хонда». Рассмотрим профили P1
P2
P3
Т
С
Т-Н-М-С
С
М-Х
Х
Н
Н-М
Т
Х
9
P’1
P’2
P’3
Х
М
Т-Н-М
Т
Н
С-Х
Н-М
С
С
Х Т Возьмем в качестве А1 множество {Т,Н,М}. В P1 и P’1 имеем Т
М
Н-М , в P2 и P’2 Н , в P3 и P’3
Т-Н-М.
Т Поэтому в силу аксиомы 2 любые групповые ранжировки для обоих профилей должны совпадать на А1, добавление С и Х не учитывается. Аксиома 3 (суверенность). Для каждой пары альтернатив а и b существует профиль, для которого в групповой ранжировке а лучше b. В частности, аксиома 3 удовлетворяется при выполнении следующего естественного условия: если для каждого субъекта а лучше b, то и для группы в целом а лучше b. Понятно, что нарушение аксиомы 3 означает навязанность предпочтений, не учитывающую мнение членов группы. Аксиома 4 (отсутствие диктатора). В группе нет такого субъекта, что если для него а лучше b, то и для всей группы а лучше b независимо от предпочтений остальных субъектов. Исследуем аксиомы Эрроу для различных n=|N| , m=|A|. При n=1 проблема группового выбора отсутствует в силу отсутствия группы, а при m=1 – в силу отсутствия выбора. Если m=2, то при всех n>=2 правило простого большинства определяет функцию группового выбора, удовлетворяющую всем аксиомам Эрроу (отметим, что парадокс Кондорсе при m=2 не возникает). Для проверки 10
аксиомы 1 достаточно заметить, что если для большинства субъектов а лучше b, то это предпочтение сохранится при перемещении b на более низкое место в некоторых ранжировках. Аксиома 2 представляет интерес только при А1, отличном от А; в нашем случае А1 может состоять лишь из одного элемента. Поскольку на одноэлементном множестве существует единственная ранжировка, аксиома 2 тривиально выполняется. Аксиома 3 выполняется, так как для следующего профиля по правилу простого большинства а лучше b: P1
P2
…
Pn
a
a
…
a
b
b
b
Для проверки аксиомы 4 сначала рассмотрим случай n>2. Тогда для следующего профиля по правилу простого большинства а лучше b, хотя для j-го субъекта b лучше а. P1
P2
…
Pj-1
Pj
Pj+1
…
Pn
a
a
…
a
b
a
…
a
b
b
b
a
b
Если n=2,
то для следующего профиля группа считает а и b
эквивалентными, хотя субъект j считает иначе. Pi
Pj
a
b
b
a
b
В общем случае n>=3, m>=2 справедлива знаменитая
11
Теорема Эрроу. Пусть n>=3 , m>=2 и GPS(A) – множество всех профилей на А для группы из n субъектов. Тогда функция группового выбора, определенная на GPS(A) и удовлетворяющая аксиомам 1-4, не существует. Этот парадоксальный результат в определенном смысле представляет собой «угрозу демократии»: ведь получается, что любое правило группового выбора не может удовлетворить вполне разумным требованиям. Можно переформулировать теорему Эрроу так: локальная, монотонная и суверенная функция группового выбора является диктаторской. Что же делать? Один из возможных ответов заключается в критическом анализе аксиом Эрроу: так ли они разумны и необходимы, как кажется на первый взгляд? Действительно,
более
тщательный
анализ
позволяет
усомниться
в
универсальности аксиомы 2. Пусть два субъекта выбирают между покупкой автомобиля одной из двух марок или получением определенной денежной суммы (величины условные). Рассмотрим следующий профиль предпочтений: P1
P2
10000
«Ниссан»
12000
10000
15000
12000
«Тойота» 15000 «Ниссан» «Тойота» По-видимому, здесь в групповом предпочтении «Ниссан» должен быть лучше «Тойоты», поскольку для первого субъекта они мало различимы, в то время как второй явно предпочитает «Ниссан» «Тойоте». Однако тогда в силу аксиомы
2
для
подмножества
альтернатив
предпочтение должно сохраниться и для профиля 12
{«Ниссан»,
«Тойота»}
это
P1
P2
«Тойота» 10000 10000
12000
12000
15000
15000
«Ниссан»
«Ниссан» «Тойота» Очевидно, этот парадокс возникает потому, что аксиома 2 Эрроу не учитывает интенсивность предпочтения одной альтернативы по сравнению с другой. Имеются и другие аргументы против аксиомы 2. Конечно, можно исходить из набора аксиом для функции группового выбора, отличного от набора Эрроу, и такие попытки действительно предпринимались. Однако пока не удалось найти набор аксиом, использование которого не приводило бы к противоречиям и парадоксам.
Видимо,
парадоксальной
является
сама
природа
проблемы
группового выбора, состоящей в попытке синтеза одного согласованного группового предпочтения из многих противоречивых индивидуальных. В основу следующей модели, построенной и исследованной другим Нобелевским лауреатом, индийским ученым А.Сеном, положена гипотеза о том, что для анализа предпочтений между парами альтернатив следует учитывать мнение только тех субъектов, которых эти альтернативы непосредственно касаются. Рассмотрим семью, состоящую из матери (М) и сына-подростка (С). Пусть множество альтернатив имеет вид {x,y,z},
где х – просмотр фильма
сомнительного содержания только матерью; y – просмотр этого фильма только сыном; z – отказ от просмотра обоими членами семьи. Тогда естественный групповой профиль имеет вид 13
М
С
z
х
х
у
y
z Какой должна быть транзитивная групповая ранжировка? Поскольку М
касаются только альтернативы х и z, то имеем zРМх; поскольку С касаются только у и z, то уРСz. Таким образом, в силу транзитивности гипотеза Сена дает групповую ранжировку у z х С другой стороны, учет условия единогласия (если для всех субъектов аPib, то и для группы аPb) дает хРу, что приводит к противоречию. Таким образом, требования единогласия и транзитивности несовместимы с гипотезой Сена (которую можно трактовать как «либерализм» – уважение частных предпочтений субъектов). Этот факт можно назвать «парадоксом Сена». Сформулируем предположения и результат исследования Сена более точно. Пусть имеется конечное множество субъектов N={1,…n}, n>1, и конечное множество альтернатив A={a,b,…,m}, m>2. Индивидуальные и групповые предпочтения являются линейными порядками на множестве альтернатив, т.е. удовлетворяют условиям: – связности: для любых а,b либо аPib, либо bPiа; – транзитивности: если аPib и bPic, то аPic; – ацикличности: не может быть аPib, bPic, …, кPis, sPia для любого s. Обозначим С(a,b) = {i ∈ N: аPib} – множество субъектов, для которых а лучше b. Тогда субъект i называется решающим относительно а и b, если из С(a,b) = {i} следует, что аPb. 14
Теорема о паретовском либерале (парадокс Сена) [Алескеров и др., 2006]. Пусть выполняются следующие условия: – индивидуальные и групповое предпочтения являются линейными порядками; – правило группового выбора удовлетворяет условию единогласия; – существуют альтернативы a,b,c,d и субъекты i,j такие, что i является решающим для пар (a,b) и (b,а), а j – для пар (c,d) и (d,с). Тогда функция группового выбора, удовлетворяющая перечисленным условиям, не существует. Рассмотрим задачу группового выбора в упрощенной постановке. Пусть попрежнему А – множество альтернатив, Pi - предпочтения участников, описываемые линейными порядками, но функция группового выбора имеет вид f : GPS(A) → А , т.е. группа выбирает только самую предпочтительную альтернативу (победителя). Правило
группового
выбора
f
называется
защищенным
от
манипулирования, если ни один из субъектов ни в одном профиле не может изменить свои предпочтения так, чтобы в результате оказалась выбранной наилучшая с его точки зрения альтернатива. Предположим, что f является «отображением на», т.е. для любой a∈A существует профиль GP∈GPS(A) такой, что f(GP) = a. Это условие не слишком ограничительно, в частности, оно слабее условия единогласия. Тем не менее, справедлив еще один замечательный парадоксальный результат: любое недиктаторское правило группового выбора не защищено от манипулирования. Теорема Гиббарда-Саттертуэйта [Мулен, 1991]. Пусть число альтернатив не меньше трех, а функция группового выбора является «отображением на». Правило группового выбора защищено от манипулирования тогда и только тогда, когда оно является диктаторским. 15
Рассмотрим следующий профиль: Группа А (три субъекта) Группа В (два субъекта)
Группа С (два субъекта)
х
z
у
у
х
z
z
y
х
По критерию Кондорсе будет избрана альтернатива х. Субъекты из группы С, не желая избрания наихудшей для них альтернативы, могут исказить свои предпочтения, поставив на первое место альтернативу z. Тогда возникает следующий профиль, в котором победителем становится z. Группа А (три субъекта) Группа В (два субъекта)
Группа С (два субъекта)
х
z
z
у
х
у
z
y
х
Заметим, что и для группы В такое искажение предпочтений субъектов из С (манипулирование) оказывается выгодным. Интересные исторические примеры манипулирования приведены в [Алескеров и др., 2006]. Упражнения 1.1 Выписать все возможные ранжировки множества А={a,b,c,d}, т.е. построить множество Р(А). Сколько элементов содержится в GPS(A)? 1.2. Транзитивно ли предпочтение субъекта относительно марок автомобилей, если он предпочитает «Тойоту» - «Мазде», «Мазду»- «Ниссану» и «Ниссан» «Тойоте»? 1.3 Пусть по групповому профилю надо определить не полную групповую ранжировку, а только наиболее предпочтительную для группы альтернативу 16
(«победителя»). Двумя распространенными правилами выбора победителя являются: – правило большинства голосов (не путать с правилом простого большинства): альтернатива объявляется победителем, если занимает первое место чаще других альтернатив; – правило Кондорсе: альтернатива объявляется победителем, если большинство субъектов отводит ей более высокое место, чем любой другой альтернативе. Рассмотрим следующий групповой профиль: Р1
Р2
Р3
Р4
Р5
Р6
a
a
b
b
c
c
b
c
a
c
a
b
c
b
c
a
b
a
а) Какая альтернатива будет победителем по правилу большинства, если 15 субъектов голосуют за Р1, 25 за Р2, 35 за Р3, 45 за Р4, 10 за Р5, а Р6 не получает ни одного голоса? б) Определяет ли победителя правило Кондорсе? в) Какие проблемы могут возникнуть при использовании правил большинства и Кондорсе (пояснить на примерах групповых профилей)? 1.4 Предположим, что все ранжировки в профиле строгие. а) Показать на примере, что победители по Борда и по правилу большинства могут не совпадать. б) Показать на примере, что победители по Борда и по Кондорсе могут не совпадать. в) Показать, что если правило простого большинства определяет ранжировку, то она может не совпадать с ранжировкой по Борда. 1.5 Функция группового выбора, называемая лексикографическим групповым предпочтением, определяется следующим образом: для группы aPb тогда и только тогда, когда: aP1b , или a эквивалентна b для Р1 и aP2b , или a эквивалентна b для 17
Р1, a эквивалентна b для Р2 и aP3b , или a эквивалентна b для Р1, … , a эквивалентна b для Рn-1 и aPnb. Если для всех субъектов a эквивалентна b, то и для всей группы a эквивалентна b. а) Привести пример, показывающий, что если даже по правилу простого большинства строится ранжировка, то она может не совпадать с ранжировкой по правилу лексикографического группового предпочтения. б) В чем состоят недостатки этой функции группового выбора? 1.6 Еще одна функция группового выбора называется мажоритарной системой: группа считает, что а лучше b, тогда и только тогда, когда а получает больше первых мест, чем b. Показать, что правило Борда и мажоритарная система могут приводить к различным ранжировкам для одного группового профиля. 1.7 В первом разделе курса рассматривалась задача ранжирования игроков в турнире.
Используя
ранжировки.
полный
Исследовать
простой
путь,
возможность
можно
применения
получать
различные
различных
правил
группового выбора. 1.8 Пусть три субъекта ранжируют три альтернативы и групповой профиль включает только строгие ранжировки (как в упражнении 1.3). Вычислить вероятность возникновения парадокса Кондорсе. 1.9 Три приятеля выбирают место для отдыха из четырех возможных вариантов: Анталия (А), Сочи (С), Хургада (Х), Ялта (Я). Пусть первый профиль отражает их предпочтения, а второй предложен их женами. Р1
Р2
Р3
А
А
А
С
С
С
Х
Х
Х
Я
Я
Я 18
Р’1
Р’2
Р’3
А
С
А
С
А
С-Х.Я
Х
Х-Я
Я Предположим, что в групповом выборе по первому профилю А лучше Я. а) Следует ли из первой аксиомы Эрроу, что это предпочтение сохранится и для второго профиля? б) Выполнена ли вторая аксиома Эрроу? в) Ответить на вопросы, поменяв профили местами. г) Пусть выполнено следующее условие: если для первого приятеля А лучше С, то это предпочтение сохраняется для всей группы. Является ли первый приятель диктатором? 1.10 Показать, что правило Борда, лексикографическое отношение предпочтения и мажоритарная система нарушают хотя бы одну из аксиом Эрроу. 1.11 Пусть руководитель организации при принятии решений учитывает мнение лишь части своих заместителей (назовем их лояльными). Более точно, число голосов за некоторую альтернативу считается равным разности числа лояльных и нелояльных заместителей, поставивших эту альтернативу на первое место. Какие аксиомы Эрроу нарушает эта процедура? 1.12 Воспользоваться следующим профилем для получения аргумента против второй аксиомы Эрроу. Р1
Р2
Рыба
Пиво
Мясо
Рыба
Птица Мясо Водка
Птица
Пиво
Водка 19
1.13 Проанализировать аксиомы Эрроу на примере ранжирования заявок, поданных на конкурс. 1.14 Проанализировать аксиомы Эрроу на примере ранжирования игроков турнира. 1.15 Предложить несколько аксиом для функции группового выбора по своему усмотрению. 2 СОВМЕСТНОЕ РАНЖИРОВАНИЕ СУБЪЕКТОВ И АЛЬТЕРНАТИВ Чтобы
обойти
парадокс
Эрроу,
американский
математик
К.Кумбс
предложил ограничить множество допустимых групповых профилей. Если групповой профиль получается в результате некоторой специальной процедуры, то правило простого большинства не приводит к парадоксу Кондорсе и поэтому всегда может использоваться для построения групповой ранжировки. Более того, эта функция группового выбора будет удовлетворять всем аксиомам Эрроу, если относить их только к профилям из выделенного ограниченного множества. Определим предварительно понятие медианы. Если множество чисел С (возможно, с повторениями) содержит нечетное число элементов, упорядоченных по возрастанию, то медианой называется число, находящееся в середине этой упорядоченной последовательности. Таким образом, если С содержит 2k+1 элементов, то медианой будет (k+1)-й элемент. Например, для множества С = {1,3,3,5,5,7,8,2,4} упорядоченная последовательность имеет вид 1,2,3,3,4,5,5,7,8 и медианой служит число 4. Сделаем два предположения, определяющие ограниченное множество групповых профилей. Во-первых, будем считать, что каждой альтернативе может быть приписана количественная оценка на некоторой шкале (например, от 0 до 100 баллов). Во-вторых, предположим, что каждый субъект имеет свою идеальную оценку, отражающую его предпочтения на этой же шкале (рис. 2.1). 20
Субъект 2 25 a=0 b=5
Субъект 1
Субъект 3 50
90
c=30
d=80
e=100
Рис.2.1 Совмещенная количественная шкала субъектов и альтернатив Тогда субъект считает, что а лучше b, в том и только том случае, когда расстояние от а до идеальной оценки меньше, чем расстояние от b до идеальной оценки. В частности, для рисунка 2.1 получаем групповой профиль Р1
Р2
Р3
e-d
c
c
c
b
d
b
a
b
a
d
a-e
e В качестве групповой ранжировки по Кумбсу берется ранжировка субъекта, чья идеальная оценка есть медиана на множестве оценок. В данном случае это субъект 3, поэтому групповая ранжировка есть Р c d b a-e Таким образом, первое правило (функция) группового выбора Кумбса имеет следующий вид. 1 Делаются количественные оценки всех альтернатив из множества А на некоторой шкале. 21
2 Выясняются идеальные оценки субъектов из множества N, отражающие их предпочтения
на
этой
же
шкале.
Тем
самым
строится
совмещенная
количественная шкала субъектов и альтернатив. 3 Вычисляется медиана на множестве идеальных оценок субъектов. 4 В качестве групповой ранжировки берется ранжировка медианного субъекта (медианная ранжировка). Заметим, что медианная ранжировка в приведенном примере совпадает с ранжировкой, получаемой по правилу простого большинства. Оказывается, что это совпадение не случайно. Теорема 2.1 [Робертс 1986]. Пусть А – множество альтернатив, R2k+1(A) – множество всех профилей группы из 2k+1 субъектов на А, полученных по первому правилу Кумбса. Функция группового выбора Кумбса на R2k+1(A) совпадает с правилом простого большинства. Доказательство. Предположим, что субъект i, определяющий медиану, предпочитает альтернативу а альтернативе b. Покажем, что по крайней мере k других (кроме i) идеальных оценок ближе к а, чем к b, и поэтому а лучше b по крайней мере для k+1 субъектов, т.е. для большинства. Все возможные случаи взаимного расположения оценок альтернатив а и b и идеальной оценки медианного субъекта i показаны на рис 2.2. 1. i
a b
5. i
b
a 2. b a
i
6. b
i a
3. a
i b
7. a i b
4. b
i a
8. i
a b
Рис. 2.2 Случаи взаимного расположения оценок альтернатив и медианной оценки 22
В случаях 1,3,5 половина субъектов находится левее медианы i, поэтому для них тоже а ближе (лучше) b. Соответственно, в случаях 2,4,6 половина субъектов находится правее медианы i, поэтому для них тоже а ближе (лучше) b. В случае 7, где а и b для i равноценны, k субъектов считают, что а лучше b, а еще k считают наоборот, поэтому для группы в целом а и b тоже равноценны. Наконец, в случае 8 а и b имеют одинаковые оценки и поэтому равноценны для всех субъектов. Предположим теперь, что количественные оценки получить не удается, но можно построить единое качественное упорядочение всех альтернатив и субъектов. Будем считать для простоты, что полученная ранжировка строгая. Пример такого упорядочения (совмещенная качественная шкала субъектов и альтернатив) показан на рис. 2.3. a b 2 c 1 d e 3 Рис. 2.3. Совмещенная качественная шкала субъектов и альтернатив Определим расстояние между элементами этой шкалы (включая как альтернативы, так и субъектов) как число элементов между ними плюс единица. Например, расстояние между а и с равно 3. Тогда субъект i определяет свою ранжировку следующим образом: если он находится на равном расстоянии от а и b, то в качестве более предпочтительной альтернативы он может выбрать любую, в противном случае предпочтительной является ближайшая к i альтернатива. 23
Полученная в результате ранжировка является строгой. Так, для примера на рис.2.3 групповой профиль строится в виде Р1
Р2
Р3
c
b
e
d
c
d
e
a
c
b
d
b
a
e
a
На множестве субъектов можно выбрать медиану, а именно
(k+1)-го
субъекта, считая с любого конца шкалы. Медианным субъектом в данном случае является субъект 1, поэтому в качестве групповой ранжировки по Кумбсу берется ранжировка Р c d e b a В целом второе правило (функцию) группового выбора Кумбса
можно
описать следующим образом. 1 Построить совмещенную качественную шкалу субъектов и альтернатив. 2 Построить групповой профиль, используя расстояния между элементами шкалы. 3 Определить медиану на множестве субъектов. 4 Выбрать в качестве групповой медианную ранжировку. 24
Заметим, что и здесь медианная ранжировка совпадает с ранжировкой, получаемой по правилу простого большинства. Это совпадение вновь не случайно. Теорема 2.2 [Робертс 1986]. Пусть А – множество альтернатив, S2k+1(A) – множество всех профилей группы из 2k+1 субъектов на А, полученных по второму правилу Кумбса. Функция группового выбора Кумбса на S2k+1(A) совпадает с правилом простого большинства и удовлетворяет аксиомам Эрроу. Вернемся к групповому профилю из примера по рис.2.3 и представим каждую ранжировку в виде (ломаной) кривой следующим образом. На оси х приведены альтернативы в порядке, задаваемом совмещенной качественной шкалой. По оси у отложены числа Борда Bi(x). Результаты приведены на рис.2.4. Bi(x)=0
Субъект 3 4 3 2
Субъект 1 Субъект 2
1 0
a
c
b
d
e
x
Рис. 2.4. Примеры однопиковых кривых Заметим, что каждая кривая на рис.2.4 является унимодальной (или, как принято говорить в теории группового выбора, однопиковой). Говорят, что профиль
удовлетворяет
условию
однопиковости,
если
существует
такое
упорядочение множества альтернатив, что для этого упорядочения кривые, соответствующие
всем
ранжировкам
Справедлива
25
профиля,
являются
однопиковыми.
Теорема 2.3 [Робертс 1986]. Групповой профиль из строгих ранжировок можно получить по совмещенной качественной шкале тогда и только тогда, когда этот профиль удовлетворяет условию однопиковости. Упражнения 2.1 Найти медиану для следующих множеств: a) {1,3,4,2,5,6,2}; b) {4,2,6,5,8}; c) {3,3,3,5,1}. 2.2 Пусть совмещенная количественная шкала имеет вид
Субъект 3
Субъект 1
15 a=0
Субъект 5
Субъект 4
Субъект 2
25 b=2
40
60 c=45
70 d=90
e=100
а) построить групповой профиль; б) определить медианного субъекта; в) проверить, что его ранжировка и ранжировка, полученная по правилу простого большинства, совпадают; г) повторить упражнение, если идеальные оценки субъектов равны 10, 20, 50, 80, 95. 2.3 Пусть совмещенная качественная шкала имеет вид a 1 b c 2 d 3 e 26
а) построить групповой профиль; б) найти медианного субъекта; в) проверить, что его ранжировка и ранжировка, полученная по правилу простого большинства, совпадают; г) повторить упражнение для шкалы 1 a b c 2 3 d e 2.4 Представить графически ранжировку a b c d для каждого из приведенных ниже способов упорядочения альтернатив и определить однопиковые кривые. 2.5 Доказать, что соответствующий парадоксу Кондорсе профиль отличен от однопикового (рассмотреть все возможные упорядочения альтернатив). 2.6 Определить, являются ли однопиковым следующий профиль: Р1
Р2
Р3
a
c
c
b
b
а
c
a
b 27
3 КОЛЛЕКТИВНЫЕ РЕШЕНИЯ НА ОСНОВЕ РАССТОЯНИЙ МЕЖДУ РАНЖИРОВКАМИ Еще один подход к проблеме «борьбы» с парадоксом Эрроу был предложен уже известными нам по первой части курса американскими математиками Дж.Кемени и Дж.Снеллом. Их идея заключается в следующем. Рассмотрим групповой профиль Р1
Р2
Р3
a
a
d
b
c
e
c
b
c
d
d
b
e
e
a
По-видимому, естественно считать, что ранжировки Р1 и Р2 близки между собой, а Р2 и Р3 или Р2 и Р3 - наоборот, далеки. С учетом этого наблюдения Кемени и Снелл предложили следующую программу действий. 1 Формализовать понятие расстояния между ранжировками. 2 Выбрать в качестве групповой ранжировки такую, которая находится на наименьшем суммарном расстоянии от всех ранжировок профиля. Сначала определим для ранжировок понятие «между». Будем говорить, что ранжировка Q находится между ранжировками P и R и обозначать этот факт B(P,Q,R), если для каждой пары альтернатив а и b из множества А результат их сравнения в Q находится между результатами их сравнения в P и R. А именно, если в P и R результаты сравнения а и b совпадают, то они должны совпадать и в Q. Если же в P и R результаты сравнения а и b различны, то результат сравнения в Q совпадает с любым из них, причем в Q альтернативы а и b могут быть равноценны, если в одном случае а предпочтительнее b, а в другом b 28
предпочтительнее
а.
Например,
для
следующего
профиля
справедливо
B(P1, P2, P3): Р1
Р2
Р3
a
a
b
b
b
d
c
d
a
d
c
c
e
e
e
Будем определять расстояние между ранжировками как функцию d : P(A) x P(A) → R, где Р(А) – множество ранжировок на А. Представляется естественным потребовать выполнения следующих аксиом для всех P,Q,R из Р(А). Аксиома 1.1. d(P,Q) ≥ 0, причем равенство достигается тогда и только тогда, когда P=Q. Аксиома 1.2. d(P,Q) = d(Q,Р). Аксиома 1.3. d(P,Q) + d(Q,R) ≥ d(P,R) , причем равенство достигается тогда и только тогда, когда B(P,Q,R). Вторая аксиома утверждает, что расстояния не должны измениться, если переименовать элементы из А. Аксиома 2. Если ранжировки P’и Q’ получаются из ранжировок P и Q одной и той же перестановкой элементов множества А, то d(P,Q) = d(P’,Q’). Пусть, например, профиль имеет вид P
Q
P’
Q’
a
b
c
d
b
c
d
a
c
d
a
b
d
a
b
c 29
Тогда d(P,Q) = d(P’,Q’), поскольку P’ и Q’ можно получить из Р и Q циклическим сдвигом последовательности {a,b,c,d} на два элемента. Для
формулировки
следующей
аксиомы
введем
понятие
сегмента
ранжировки. Подмножество S из А называется сегментом ранжировки Р, если каждый элемент а из A\S находится либо ниже любого элемента из S, либо выше любого элемента из S. Например, в приведенном выше профиле множества S1 = {a,b}, S2 = {b,c}, S3 = {c,d} будут сегментами ранжировки Р. Множество {a,c} не будет сегментом Р, так как между а и с находится b. Если S = S (Р) – сегмент Р, то множество ST(P), содержащее все элементы выше S в ранжировке Р, и множество SB(P), содержащее все элементы ниже S в Р, тоже являются сегментами Р. Обозначим через Р(S), Р(ST), Р(SB) ранжировки, полученные из Р для элементов, входящих в сегменты S , ST , SB соответственно. Будем говорить, что ранжировки P и Q согласованы вне S, если: – S – их общий сегмент; – ST(P) = ST(Q) = ST, SB(P) = SB(Q) = SB; – P(ST) = Q(ST), P(SB) = Q(SB). Например, P и Q согласованы вне S = {c,d,e} для следующего профиля: P
Q
a
a
b
b
c
c-d
d
e
e
f
f
g
g
30
Аксиома 3. Пусть выполнены следующие условия: – S – общий сегмент ранжировок P, Q, P’,Q’ ; – ранжировки P,Q и P’,Q’ попарно согласованы вне S; – P(S) = P’(S) , Q(S) = Q’(S). Тогда d(P,Q) = d(P’,Q’). Рассмотрим в качестве примера следующий профиль. Здесь S = {c,d,e} – общий сегмент ранжировок P, Q, P’,Q’ ; ранжировки P,Q и P’,Q’ попарно согласованы вне S; P(S) = P’(S) , Q(S) = Q’(S). Поэтому d(P,Q) = d(P’,Q’). P
Q
P’
Q’
a
a
b
b
b
b
a
a
c
c-d
c
c-d
d
e
d
e
e
f
e
f-g
f
g
f-g
g Последняя аксиома носит технический характер и устанавливает единицу измерения. Аксиома 4 Минимальное положительное расстояние между ранжировками равно единице, т.е. для всех P и Q из Р(А) d(P,Q) = 0 или d(P,Q) ≥ 1, а для некоторых P и Q из Р(А) d(P,Q) = 1. Кемени и Снеллу удалось показать, что предложенный ими набор аксиом является категоричным. Теорема 3.1 (Кемени, Снелл). Для каждого множества альтернатив А, содержащего не менее двух элементов, существует единственная функция расстояния d : P(A) x P(A) → R, удовлетворяющая аксиомам 1-4. Доказательство существования (доказательство единственности опустим). Пусть P и Q – ранжировки на множестве А, а и b – элементы из А. Положим 31
δP,Q(a,b) равным нулю, если порядок а и b совпадает в P и Q; равным двум, если в одной ранжировке а лучше b, а в другой b лучше а; равным единице в остальных случаях. Тогда функция d(P,Q) равна сумме значений δP,Q(a,b) по всем неупорядоченным парам {a,b} из А. Покажем теперь, что определенная таким образом функция d удовлетворяет аксиомам 1-4 для любого множества А, содержащего не менее двух элементов. Аксиома 1.1 Все величины δP,Q(a,b) неотрицательны, поэтому их сумма также неотрицательна. Эта сумма равна нулю тогда и только тогда, когда каждый ее член равен нулю, т.е. когда для всех а и b из А ранжировки P и Q совпадают. Аксиома 1.2 Выполняется, поскольку δP,Q(a,b) = δQ,Р(a,b). Аксиома 1.3 Определим величину δP(a,b) следующим образом: 1, если aPb, δP(a,b) =
-1, если bPa,
(3.1)
0, если a,b равноценны в Р. Тогда для всех a,b из А имеем δP,Q(a,b) = | δP(a,b) – δQ(a,b)|, | δP(a,b) – δQ(a,b)| + | δQ(a,b) – δR(a,b)| ≥ | δP(a,b) – δR(a,b)|.
(3.2)
Складывая неравенства (3.2) по всем парам {a,b}, получим d(P,Q) + d(Q,R) ≥ d(P,R).
(3.3)
Равенство в (3.3) может достигаться только тогда, когда в (3.2) имеется равенство для всех a,b из А, что означает, что δQ(a,b) находится между δP(a,b) и δR(a,b). Тогда легко показать (упражнение 3.9), что равенство в (3.2) для всех a,b из А oзначает, что B(P,Q,R). Аксиома 2 Перестановка элементов А не влияет на d, поскольку означает сложение в другом порядке тех же слагаемых δP,Q(a,b). Аксиома 3 Проверить самостоятельно (упражнение 3.10). Аксиома 4 Поскольку δP,Q(a,b) всегда является неотрицательным целым числом, таким же свойством обладает и d(P,Q). Пусть a≠b, а P и Q имеют вид: 32
P
Q
a-b
a
A\{a,b}
b A\{a,b}
Тогда δP,Q(a,b) = 1 и δP,Q(х,у) = 0 для всех остальных пар, поэтому d(P,Q) = 1. Таким образом, минимальное положительное расстояние равно единице. При |A| = 3 расстояния легко вычисляются с помощью фигуры, показанной на рис.3.1. a b c a-b c
b a c b a-c
1
1
1
a b-c
2
2
1
1
1
2
1
1 b c a
a c b
1 b-c a
2
2
1
1
1 c a-b
a-c b c a b
c b a
Рис.3.1 Фигура для определения расстояний между ранжировками при |A| = 3 Для определения расстояния между двумя произвольными ранжировками P и Q следует найти на рис.3.1 кратчайшую цепь из Р в Q и положить расстояние равным сумме весов ее ребер. Например, расстояние между ранжировками а b
b-c и
a
с 33
равно 5. В общем случае придется непосредственно вычислять и складывать величины δP,Q(a,b). Теперь обратимся ко второму пункту программы Кемени-Снелла. Функция расстояния определена, нужно с ее помощью построить согласованную групповую ранжировку. Назовем медианой профиля ранжировок P1 ,…, Pn такую ранжировку Р, для которой d(P,P1) + … + d(P,Pn) минимальна, а средней ранжировкой – такую ранжировку Р, что d2(P,P1) + … + d2(P,Pn) минимальна. Целесообразно выбирать в качестве групповой ранжировки для данного профиля медиану или среднюю ранжировку. Идея предлагаемого подхода вполне понятна и разумна, но ее применение для определенных профилей, как всегда бывает в теории выбора, приводит к трудностям и парадоксам. Например, рассмотрим профиль Р1
Р2
Р3
ЦСКА
ЦСКА
Динамо
Динамо
Динамо
ЦСКА
Спартак
Спартак
Спартак
Используя рис. 3.1, получим в качестве медианы ранжировку Р ЦСКА Динамо Спартак Действительно, Σ d(P,Pi) = 2, в то время как для любой другой ранжировки Q имеем Σ d(Q, Pi) ≥ 3. Для доказательства заметим, что если Q = Р3, то Σ d(Q, Pi) = 2 +2 + 0 = 4. Если же Q отлична от Р1, Р2, Р3, то по аксиоме 4 d(Q, Pi) ≥ 1 для всех i. 34
Средней ранжировкой в этом примере является Q ЦСКА - Динамо Спартак Для нее Σ d2(Q, Pi) = 1 = 1 + 1 = 3. Эта величина минимальна, поскольку для любой другой ранжировки Р либо d(P,P1) ≥ 2, либо (P,P3) ≥ 2, и поэтому Σ d2(Q, Pi) ≥ 4. Таким образом, в этом примере медианная ранжировка отличается от средней. При этом понятны содержательные аргументы в пользу обоих вариантов выбора: медиана принимается большинством субъектов, а при выборе средней данные о предпочтительности ЦСКА по сравнению с Динамо считаются недостаточными. Таким образом, однозначной рекомендации по принятию решения подход Кемени-Снелла в данном случае не дает. Следующий профиль иллюстрирует другую проблему. Р1
Р2
Р3
ЦСКА
Динамо
Спартак
Динамо
Спартак
ЦСКА
Спартак
ЦСКА
Динамо
Легко видеть, что этот профиль соответствует хорошо нам знакомому парадоксу Кондорсе. Для него все три ранжировки Р1,
Р2,
Р3 являются
медианами. Средней оказывается ранжировка ЦСКА – Динамо – Спартак. Таким образом, здесь говорить о какой-то конструктивной рекомендации вообще не приходится: в качестве медианы можно выбирать любую индивидуальную ранжировку, а средняя ранжировка приводит к полному «дележу мест», к тому же они различаются между собой. При этом опять-таки можно выдвинуть содержательные аргументы в пользу обоих вариантов: первый рекомендует субъектам «остаться при своих», а второй предполагает, что имеющиеся различия в предпочтениях несущественны. 35
Средние ранжировки также определяются в общем случае не однозначно, о чем свидетельствует следующий профиль: Р1
Р2
ЦСКА
Спартак
Динамо
Динамо
Спартак
ЦСКА
Здесь средними оказываются три ранжировки: Динамо ЦСКА – Спартак
ЦСКА – Спартак
ЦСКА – Динамо – Спартак
Динамо,
и проблема выбора по данному критерию снова остается открытой. Упражнения 3.1 Пусть А = {апельсины, мандарины, яблоки, груши}. Рассмотрим профиль Р
Q
R
Апельсины
Апельсины
Мандарины
Мандарины
Яблоки-груши
Яблоки-груши-
Яблоки
Мандарины
апельсины
Груши а) Вычислить d(P,Q), d(Q,R), d(P,R). б) Применив аксиому 1.3, выяснить, находится ли Q между Р и R. в) Проверить условие B(P,Q,R) с помощью определения отношения «между». 3.2 Повторить упражнение 3.1 для следующего профиля Р
Q
R
Пушкин
Пушкин-Лермонтов
Толстой
Лермонтов
Достоевский-Толстой
Достоевский
Достоевский
Лермонтов
Толстой
Пушкин 36
3.3 Пусть Р – ранжировка без равноценных альтернатив на множестве А. Обозначим через РС обратную ранжировку (например, в упражнении 3.2 R обратна к Р). Показать, что d(P, РС) = n(n-1), где n = |A|. 3.4 Пусть Р – ранжировка без равноценных альтернатив на множестве А, а в ранжировке О все альтернативы равноценны. Показать, что d(P, О) = n(n-1)/2, где n = |A|. 3.5 Применить аксиому 2 к следующему профилю: Р
Q
R
S
a
c
a-c
a-b
b
a
b
c
c
b
Верно ли, что: а) d(P,Q) = d(R,S)? б) d(P,R) = d(Q,S)? в) d(P,S) = d(Q,R)? 3.6. Повторить упражнение 3.5 для следующего профиля: Р
Q
R
S
a
a-b-c
b
a-b-c
b
a
c
c
3.7 К какому выводу позволяет прийти аксиома 3 для следующего профиля? Р
Q
R
S
Ниссан
Ниссан
Субару
Субару
Мазда
Мазда
Мазда
Мазда
Мицубиши
Мицубиши-
Мицубиши-
Мицубиши
Хонда
Хонда
Хонда
Хонда
Субару
Субару
Ниссан
Ниссан
Тойота
Тойота
Тойота
Тойота
37
3.8 Используя рис. 3.1, найти все медианы и средние ранжировки для следующих профилей: Р
Q
R
a
a-b-c
c
b
b
c
a
Р
Q
R
S
T
a-b-c
a-b-c
a-b-c
a-b-c
a b c
Р
Q
R
Апельсины
Апельсины
Апельсины
Яблоки
Груши
Груши-яблоки
Груши
Яблоки
3.9 Доказать, что если величина δP определяется формулой (3.1), то Q лежит между Р и R тогда и только тогда, когда для всех a,b из А δP(a,b) ≤ δQ(a,b) ≤ δR (a,b) или δP(a,b) ≥ δQ(a,b) ≥ δR (a,b) . Проверить, что равенство в соотношении (3.2) для всех a,b из А достигается тогда и только тогда, когда Q лежит между Р и R. 3.10 Проверить выполнение аксиомы 3 для функции расстояния. 3.11 Пусть в ранжировке О все альтернативы равноценны, а ранжировки Р и R имеют вид Р
R
a-b-c
h-i
d
g
e-f
e-f
g-h-i
d a-b-c
Показать, что О лежит между Р и R. 38
4 МАРКОВСКИЕ МОДЕЛИ ГРУППОВОГО ПРИНЯТИЯ РЕШЕНИЙ Задачу группового выбора можно решать с помощью различных математических моделей. В частности, интересные результаты получены с использованием аппарата цепей Маркова. Напомним необходимые сведения из этой области [1,5]. Цепь Маркова (марковская цепь) представляет собой частный случай стохастического процесса, под которым понимают следующее. Пусть имеется множество исходов (состояний), в которых находится моделируемая система в моменты времени t,t+1, … Предполагается, что если известны исходы в моменты времени 0,1,…, t, то можно предсказать исход в момент t+1 с определенной вероятностью. Марковские цепи выделяются из множества стохастических процессов следующими тремя свойствами. 1 Множество состояний {u1 ,…, un} конечно. 2 Вероятность нахождения системы в состоянии uj в момент времени t+1 зависит только от состояния ui , в котором система находилась в момент t. Как говорят, марковские цепи имеют память длиной в один шаг. 3 Указанная в пункте 2 зависимость одна и та же для всех t. Основной характеристикой марковской цепи является матрица переходов (переходная матрица) Р = || pij || , где pij - вероятность перехода системы из состояния ui в состояние uj за один шаг. Очевидно, выполняются условия pij ≥ 0, ∑ pij = 1, i=1,…,n. Таким образом, строки переходной матрицы j состоят из неотрицательных чисел, сумма которых равна 1. Такие векторы называются вероятностными (стохастическими), а состоящие из них матрицы – также вероятностными (стохастическими).
39
Удобно сопоставлять марковской цепи ориентированный граф D=(V,P), вершины которого суть состояния марковской цепи, а веса дуг определяются ее переходной матрицей. Иногда удобно использовать образующий орграф D=(V,А), в котором дуга (ui , uj) проводится тогда и только тогда, когда pij > 0 (веса при этом не учитываются). Рассмотрим в качестве примера (разумеется, не для подражания) модель известной игры «русская рулетка», в которой игрок вставляет в шестизарядный револьвер один патрон, проворачивает барабан и стреляет себе в голову. Переходная матрица возникающей при этом марковской цепи и соответствующий орграф изображены на рис.4.1. смерть жизнь
P=
смерть 1
0
1 6
5 6
жизнь
1
смерть
1 6
5 6
жизнь
Рис. 4.1 Переходная матрица и орграф для игры в русскую рулетку Будем говорить, что множество С состояний цепи Маркова замкнуто (в вероятностном смысле), если для любого состояния ui ∈ С и любого состояния uj ∈V\C имеет место pij = 0. Множество состояний Е называется эргодическим, если оно замкнуто и никакое его подмножество не замкнуто. Эргодические множества удобно описывать с помощью орграфов. Пусть на рис.4.2 изображен образующий орграф для некоторой цепи Маркова и его конденсация [6].
40
2
5
К1
1
4
3
К2
6 D*
D
Рис. 4.2 Образующий орграф цепи Маркова и его конденсация Очевидно, эргодическое множество орграфа D есть E={4,5,6}. Легко показать, что эргодическое множество состояний марковской цепи соответствует сильной компоненте D без исходящих дуг, то есть сильной компоненте, образующей контрабазу вершин в D* (в нашем примере К2). Все сильные компоненты D, отличные от эргодических, называются неустойчивыми (переходными) множествами. В частности, на рис.4.2 {1,2,3} есть переходное множество. Таким образом, любое состояние цепи Маркова является либо эргодическим, либо переходным. В теории цепей Маркова доказывается, что при t → ∞ система обязательно переходит в эргодическое множество (и остается в нем). Таким образом, основной интерес представляет изучение именно эргодических множеств. Если все множество состояний цепи Маркова есть эргодическое множество, то цепь называется эргодической. Очевидно, цепь Маркова эргодическая тогда и только тогда, когда ее образующий орграф сильно связен. Если из любого состояния эргодической цепи можно перейти в любое другое состояние ровно за k шагов, то цепь Маркова называется регулярной. Не всякая эргодическая цепь является регулярной. Например, контур длины 2 – регулярная цепь, но из каждой вершины можно перейти в нее саму только за четное число шагов, а в другую вершину – только за нечетное, поэтому такая цепь не будет регулярной. Удобное достаточное условие регулярности эргодической цепи – наличие хотя бы одной петли в образующем орграфе (или соответственно 41
хотя бы одного ненулевого диагонального элемента переходной матрицы). Справедлива следующая Теорема 4.1[5]. Пусть Р – переходная матрица регулярной цепи Маркова. Тогда: 1) при t → ∞ матрица Pt стремится к стохастической матрице W, состоящей из одинаковых стохастических векторов-строк w с положительными компонентами; 2) w – единственный стохастический вектор, обладающий свойством wP = w (стационарный вектор). Второй пункт теоремы 4.1 указывает способ нахождения вектора w (а тем самым и предельной матрицы W). Векторное уравнение wP = w в координатной форме имеет вид wPi = wi , где Pi -
(4.1)
i-й столбец матрицы W. Если дополнить эту систему условием для
стохастического вектора w1 + … + wn = 1,
(4.2)
то уравнения (4.1) и (4.2) имеют единственное решение. Рассмотрим теперь модель формирования общего мнения в социальной группе. Пусть V = {u1 ,…, un} – множество членов группы , bi(t) – мнение члена группы ui в момент t. Предполагаются известными начальные мнения членов группы b1(0), …, bn (0). Далее, обозначим через aij влияние ui на uj. Будем считать, что величины aij не зависят от времени и удовлетворяют условиям aij ≥ 0, ∑ aij = 1, j=1,…, n (последнее условие можно обеспечить. i путем деления aij на ∑ aij ). Это позволяет трактовать величины aij как коэффициенты относительного влияния ui на uj . 42
Удобно использовать орграф влияний D = (V,A), где A = || aij ||. Матрица А состоит из стохастических векторов – столбцов. Будем считать, что орграф влияний со временем не изменяется и что взаимные влияния оказываются в дискретные моменты времени t = 1,2,… Основная гипотеза модели состоит в том, что изменение мнений членов группы под влиянием других ее членов происходит по правилу n bj(t+1) = ∑ aij bi(t) , j=1,…,n.
(4.3)
i=1 Модель предназначена для ответа на следующие основные вопросы: 1) существует ли финальное мнение каждого члена группы b i* = lim bi(t) ? t→∞ 2) если да, то существует ли единое групповое финальное мнение b* = b1* = … = bn* ? Для исследования модели определим понятие обращения для взвешенного орграфа D. Орграф C(D) называется обращением D, если он содержит дугу (ui ,uj) с весом pij тогда и только тогда, когда D содержит дугу (uj , ui) с весом aij . Иными словами, при обращении орграфа направления всех дуг (кроме петель) меняются на противоположные. На рис.4.3 показаны орграф влияний D и его обращение C(D). 1 2
u
1 2
1 2 3 4
v
1 2
v
u
D
C(D)
Рис. 4.3 Орграф влияний и его обращение 43
1 4
Если орграф D есть орграф влияний некоторой социальной группы, то его обращение C(D) можно рассматривать как переходный орграф марковской цепи. Будем считать, что хотя бы для одного члена группы aii > 0 (вполне естественно предположить, что хотя бы один человек в группе сам влияет на собственное мнение, а не всецело зависит от мнений других). Гипотезу (4.3) можно переписать в векторной форме как b(t+1) = Р b(t), где b(t) – вектор мнений членов группы в момент t. Тогда получаем выражение b(t) = Рt b(0), t = 1,2, …
(4.4)
Теорема 4.2 [5]. Если орграф влияний социальной группы D сильно связный и содержит хотя бы одну петлю, то члены группы достигают единого финального мнения. Это групповое мнение имеет вид n ∑ wi bi(0) , i=1 где wi - компоненты стационарного вектора цепи Маркова, bi(0) – начальные мнения членов группы. Доказательство. Легко показать, что если D есть сильно связный орграф, то его обращение C(D) – тоже сильно связный орграф. Тогда C(D) определяет эргодическую и в силу наличия петли – регулярную цепь Маркова. Тогда по теореме 4.1 при t → ∞ матрица Pt стремится к стохастической матрице W, состоящей из одинаковых стохастических векторов-строк w с положительными компонентами. Из формулы (4.4) следует, что для каждого i=1,…,n n bj(t) → ∑ wi bi(0) . i=1 44
Таким образом, каждое мнение bj(t) стремится к единому финальному мнению. Следствие Если орграф влияний социальной группы D сильно связный и содержит хотя бы одну петлю, то арифметическое среднее начальных мнений достигается группой в качестве единого финального мнения тогда и только тогда, когда матрица A = || aij || стохастическая. Доказательство Матрица называется дважды стохастической, если все ее элементы неотрицательны и суммы элементов каждой строки и каждого столбца равны единице. Таким образом, стохастичность матрицы A = || aij || есть необходимое и достаточное условие того, что матрица Р = || pij || дважды стохастическая. Легко показать (упражнение 4. ), что стационарный вектор w = (w1 ,…, wn) равен (1/n ,…, 1/n) тогда и только тогда, когда Р – дважды стохастическая матрица. В примере на рис. 4.3 стационарный стохастический вектор имеет вид w = (3/5 , 2/5). Если вектор начальных мнений есть (10, 5), то финальным групповым решением будет мнение w1 b1(0) + w2 b2(0) = 8. Интересно
отметить,
что
рассмотренная
модель
не
использует
вероятностных соображений, тем не менее аппарат марковских цепей оказывается полезным для ее исследования. Упражнения 4.1
Производится
многократное
бросание
неправильной
монеты.
Пусть
вероятность выпадения герба равна 1/3. Определяет ли последовательность исходов цепь Маркова? 4.2 Известно, что находящаяся у власти партия имеет больше шансов победить на выборах, чем оппозиционные партии. Более того, если партия побеждала на президентских выборах несколько раз подряд, то ее шансы на следующих 45
выборах еще более повышаются. Определяет ли последовательность правящих партий цепь Маркова? 4.3 Привести пример матрицы, не являющейся стохастической. 4.4 Могут ли две компоненты вероятностного вектора равняться 1/2? А более чем две? 4.5 Рассмотрим цепь Маркова с матрицей переходов 1 0 0 Р = 1/3 1/3 1/3 1/2 0 1/2 а. Если начальное состояние цепи равно 2, чему равна вероятность оказаться в состоянии 2 после двух шагов? б. Если начальное состояние цепи выбирается случайным образом, чему равна вероятность оказаться в состоянии 2 после двух шагов? 4.6 Имеются клубы болельщиков ЦСКА, Спартака и Динамо, каждый мужчина может примкнуть к одному из них. Пусть 80% сыновей болельщиков ЦСКА тоже болеют за ЦСКА, а остальные за Спартак. Среди сыновей спартаковцев 60% болеют за Спартак, 20% за ЦСКА, остальные за Динамо. Среди болельщиков Динамо 50% болеют за Динамо, 40% за ЦСКА, остальные за Спартак. Пусть каждый отец имеет единственного сына и каждый сын вступает в один и только один клуб. а. Описать переходные орграф и матрицу, соответствующие членству сыновей в клубах. б. Какова вероятность, что внук болельщика Спартака тоже станет спартаковцем? в. Является ли эргодической данная марковская цепь? 4.7 Для стохастических орграфов, показанных на рис.4.4, определить все замкнутые, эргодические и переходные множества.
46
u2
1/ 2
u3 1/ 3
2/3
1
1
3/ 4
u1 1/ 4
u5
1/ 2
u7
u6 1 / 2
1/ 2
1/ 3
1
u8
u1
1
1/ 6
1/ 3
u2
7/8
u3
1/ 3
1/ 6
1/ 6
u9
1/ 4
u4 3/ 4
u7
1/ 2
1
u5 1/ 2
u6
1
а
б
Рис. 4.4 Стохастические орграфы 4.8 Пусть рассматриваются взаимоотношения в группе, состоящей из трех человек. Известно, что каждый член группы в одинаковой степени подвержен влиянию остальных членов группы, включая себя самого. Нарисовать для этой группы орграф влияний и его обращение. Существует ли финальное групповое мнение и каково оно? 4.9 Для орграфов на рис.4.5 выполнить следующие задания: а) изобразить обращение; б) выяснить, существует ли финальное групповое мнение; в) если да, то вычислить его, используя известные начальные мнения.
1 3
u
1 2 2 4
1 2
1 2
u v
1 2
v
1 2
1 2 1 2
a
w
б
Рис.4.5. Орграфы влияний. Начальные мнения: а) (10,20); б) (30,20,40). 47
1 4
ЛИТЕРАТУРА 1. Кемени Дж., Снелл Дж. Конечные цепи Маркова. – М.: Наука, 1970. – 271 с. 2. Кемени Дж., Снелл Дж. Кибернетическое моделирование. – М.: Сов.радио, 1972. – 192 с. 3. Кемени Дж., Снелл Дж., Томпсон Дж. Введение в конечную математику. – М.:Мир, 1965. – 486 с. 4. Мулен Э. Кооперативное принятие решений. Аксиомы и модели. –
М.:
Мир, 1991. – 464 с. 5. Робертс Ф. Дискретные математические модели с приложениями к социальным, биологическим и экологическим задачам. – М.: Наука, 1986. – 496 с. 6. Угольницкий Г.А. Теоретико-графовые модели структуры сложных систем. – УПЛ ЮФУ, 2008.
48