Презентация Теория статистических решений (статистические игры, игры с «природой«)

Смотреть слайды в полном размере
Презентация Теория статистических решений (статистические игры, игры с «природой«)


Вашему вниманию предлагается презентация «Теория статистических решений (статистические игры, игры с «природой«)», с которой можно предварительно ознакомиться, просмотреть текст и слайды к ней, а так же, в случае, если она вам подходит - скачать файл для редактирования или печати.

Презентация содержит 53 слайда и доступна для скачивания в формате ppt. Размер скачиваемого файла: 779.00 KB

Просмотреть и скачать

Pic.1
Теория статистических решений (статистические игры, игры с «природой«)
Теория статистических решений (статистические игры, игры с «природой«)
Pic.2
Содержание Основные понятия Игры без эксперимента Игры с единичным экспериментом Игры с многократным
Содержание Основные понятия Игры без эксперимента Игры с единичным экспериментом Игры с многократным экспериментом Дерево решений при принятии решений в условиях неопределенности
Pic.3
Литература Коршунов Ю. М. Математические основы кибернетики. М. : Энергия,1980 – 424 с. Зайченко Ю.
Литература Коршунов Ю. М. Математические основы кибернетики. М. : Энергия,1980 – 424 с. Зайченко Ю. П. Исследование операций, Киев: Высшая школа, 1975, 1988, 1993, 2001 гг. , Таха Х. Исследование операций. 1985, 2002. Исследование операций. Под ред. Моудера Дж. , Эльмаграби С. М. : Мир, 1981г. (В 2-х томах)
Pic.4
Тема 1. Статистические игры. Основные понятия
Тема 1. Статистические игры. Основные понятия
Pic.5
1. Основные понятия теории статистических решений В основе теории антагонистических игр – предположе
1. Основные понятия теории статистических решений В основе теории антагонистических игр – предположение о том, что интересы двух игроков противоположны, что имеет место конфликтная ситуация. В таких играх игрок действует активно в противовес интересам других игроков (если игры не кооперативные)
Pic.6
1. 1. Основные понятия теории статистических решений Во многих практических ситуациях - один из игро
1. 1. Основные понятия теории статистических решений Во многих практических ситуациях - один из игроков нейтрален, т. е. не стремится обратить в свою пользу ошибки, совершаемые противником В таких ситуациях сторону, выступающую в качестве объективной реальности, т. е. совокупность внешних обстоятельств (имеющих случайный неопределенный характер), в которых приходится принимать решения, принято называть «природой»
Pic.7
1. 1. Основные понятия теории статистических решений # Df 1. Модели ситуаций, в которых в качестве о
1. 1. Основные понятия теории статистических решений # Df 1. Модели ситуаций, в которых в качестве одного из противников выступает «природа» - называют играми с «природой» или статистическими играми
Pic.8
1. 1. Основные понятия теории статистических решений # Df 2. Второй участник игры с «природой» - «ст
1. 1. Основные понятия теории статистических решений # Df 2. Второй участник игры с «природой» - «статистик» или ЛПР «Природа» не совершает злого умысла по отношению к человеку («статистику») → «природу» нельзя рассматривать как разумного противника, который мог бы использовать ошибки, совершаемые «статистиком» → в игре с «природой» есть только задача «статистика», но нет задачи «природы»
Pic.9
1. 1. Основные понятия теории статистических решений # Df 3. Задача «статистика» Необходимо: выработ
1. 1. Основные понятия теории статистических решений # Df 3. Задача «статистика» Необходимо: выработать (принять решение) с наибольшей для себя выгодой в условиях неопределенности (неполной информации) о поведении «природы» т. к. информация неполна, т. е. есть возможность принятия ошибочного решения, нужно выработать такое решение (стратегию), которое сводит к минимуму нежелательные последствия ошибочного решения
Pic.10
1. 1. Основные понятия теории статистических решений # Df 3. Задача «статистика» Необходимо: учитыва
1. 1. Основные понятия теории статистических решений # Df 3. Задача «статистика» Необходимо: учитывать то, что в некоторых ситуациях можно провести эксперимент (со стоимостными и временными затратами), поэтому нужен анализ: имеет ли смысл проводить эксперимент и каковы его характеристики
Pic.11
1. 1. Основные понятия теории статистических решений # Df 4. Теория статистических решений (ТСтР) –
1. 1. Основные понятия теории статистических решений # Df 4. Теория статистических решений (ТСтР) – это теория статистических игр (игр с «природой» ТСтР – это теория оптимального недетерминированного поведения в условиях неопределенности /МЭ, т. 5, стр. 183/ ТСтР (более узко, с точки зрения математической статистики) - это теория проведения статистических наблюдений, их обработки и использования /Там же/
Pic.12
Теория статистических решений Современная общая концепция статистического решения принадлежит А. Вал
Теория статистических решений Современная общая концепция статистического решения принадлежит А. Вальду /Вальд А. Последовательный анализ. М. 1960/ Классическая задача математической статистики – на основе качественного описания распределения вероятностей некоторой случайной величины и результатов фиксированного числа наблюдений (измерений) случайной величины необходимо сделать вывод об оценке закона распределения (и выбрать оптимальное поведение)
Pic.13
Теория статистических решений Последовательный анализ Вальда - каждый дополнительный эксперимент име
Теория статистических решений Последовательный анализ Вальда - каждый дополнительный эксперимент имеет стоимость, ошибочное решение штрафуется. Необходимо построить решающее правило, оптимальное в том смысле, что минимизируется математическое ожидание всех убытков Применение последовательного анализа ведет к снижению необходимого числа наблюдений (экспериментов) В 1820 г. Лаплас уподобил получение статистической оценки азартной игре, в которой статистик терпит поражение, если его оценки плохи
Pic.14
Тема 2. Статистические игры без эксперимента
Тема 2. Статистические игры без эксперимента
Pic.15
2. Игра без эксперимента. 2. 1. Постановка задачи ДАНО (блок данных B): D = {d1,d2,…,dm} – множество
2. Игра без эксперимента. 2. 1. Постановка задачи ДАНО (блок данных B): D = {d1,d2,…,dm} – множество стратегий «статистика» (ЛПР) S = {s1,s2,…sn} – множество состояний «природы» L(d,s) : {ai,j} – функция потерь (выигрышей) _______________________ Возможно ! ДАНО (блок B’): P(S) = (p1,p2,…,pn) – вероят-ности состояний «природы» _________________________ НАЙТИ: («чистую») стратегию поведения «статистика» (ЛПР)
Pic.16
Вопросы для обсуждения Какую исходную информацию в теории статистических игр можно считать объективн
Вопросы для обсуждения Какую исходную информацию в теории статистических игр можно считать объективной (экспертной), а какую субъективной? Понятие чистых и смешанных стратегий в антагонистических и статистических играх, что общего? В чем различие?
Pic.17
2. Игра без эксперимента. 2. 2. Подходы к решению задачи Принцип Сэвиджа … Принцип Гурвица … Принцип
2. Игра без эксперимента. 2. 2. Подходы к решению задачи Принцип Сэвиджа … Принцип Гурвица … Принцип Лапласа … Какие еще принципы (критерии) оптимальности используются в играх без эксперимента? Смысл их введения? Принцип максимального правдоподобия … Критерий «ожидаемое значение – дисперсия» … Критерий предельного уровня … … Таха Х. Исследование операций Лабскер Л. Г. , Яновская Е. В. Общая методика конструирования критериев оптимальности решений в условиях риска и неопределенности // Финансовый менеджмент №5, 2002 [
Pic.18
2. Игра без эксперимента. 2. 2. Подходы к решению задачи Принцип минимакса (критерий Вальда) d* : L
2. Игра без эксперимента. 2. 2. Подходы к решению задачи Принцип минимакса (критерий Вальда) d* : L (d*) = min max L(d,s) d s Принцип минимальных ожидаемых потерь (критерий Байеса) d* : ML (d*) = min ML (d), d где ML(d) = ∑ L(d,s)*P(s) =∑ai,j*pj s j - математическое ожидание потерь при выборе «статистиком» стратегии d
Pic.19
2. Игра без эксперимента 2. 2. Подходы к решению задачи Комментарии к принципу Байеса /Таха Х. / Нец
2. Игра без эксперимента 2. 2. Подходы к решению задачи Комментарии к принципу Байеса /Таха Х. / Нецелесообразно использовать ожидаемое значение стоимостного выражения (выигрыша или потерь) [принцип Байеса] как единственный критерий для получения решения Этот критерий служит только ориентиром, а окончательное решение может быть принято лишь на основе всех существенных факторов Использование данного принципа предполагает многократное решение одной и той же задачи
Pic.20
2. Игра без эксперимента 2. 2. Подходы к решению задачи Комментарии к принципу Байеса /Таха Х. / Мат
2. Игра без эксперимента 2. 2. Подходы к решению задачи Комментарии к принципу Байеса /Таха Х. / Математически это утверждение можно доказать следующим образом: если X – случайная величина, а М{X} – математическое ожидание X, то при достаточно большом объеме выборки разница между выборочным средним и математическим ожиданием стремится к нулю. Следовательно, использование данного критерия, допустимо лишь в случае, когда одно и тоже решение приходится принимать достаточно большое число раз ► Вывод !!: ориентация на ожидания будет приводить к неверным результатам для решений, которые приходится принимать небольшое число раз
Pic.21
2. Игра без эксперимента. 2. 3. Дерево решений
2. Игра без эксперимента. 2. 3. Дерево решений
Pic.22
Игра без эксперимента Вопросы для обсуждения Критерии или принципы оптимальности ? Как сформулироват
Игра без эксперимента Вопросы для обсуждения Критерии или принципы оптимальности ? Как сформулировать ответ в терминах исходной задачи? Что общего и различного в принципах оптимальности в антагонистических и статистических играх? Чем это объясняется?
Pic.23
Тема 3. Статистические игры c единичным экспериментом 3. 1. Постановка задачи 3. 2. Подходы к решени
Тема 3. Статистические игры c единичным экспериментом 3. 1. Постановка задачи 3. 2. Подходы к решению
Pic.24
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 1 ДАНО (блоки данных: B+B’+C+C’) Б
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 1 ДАНО (блоки данных: B+B’+C+C’) Блок данных C: e1 – единичный эксперимент с(e1) – стоимость эксперимента Z = {z1,z2,…za} – множество исходов эксперимента P{z/s} – распределение условных вероятностей исходов эксперимента при том или ином состоянии «природы», т. е P(zl/sj), l=1, … , a ; j=1, … , n
Pic.25
3. Игра c единичным экспериментом. 3. 1 Постановка задачи. Слайд 2 Блок данных C (продолжение): !!!
3. Игра c единичным экспериментом. 3. 1 Постановка задачи. Слайд 2 Блок данных C (продолжение): !!! Возможные решения задачи представляются в виде решающих функций вида: φk (z,d) : φk (zl) = di , k=1,w НАЙТИ: решение задачи в виде решающей функции, т. е. найти способ поведения в зависимости от результата эксперимента
Pic.26
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 3 ДООПРЕДЕЛЕНИЕ задачи (блок С’) :
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 3 ДООПРЕДЕЛЕНИЕ задачи (блок С’) : Функция риска – математическое ожидание потерь в случае выбора той или иной решающей функции при определенном состоянии «природы» R(φ,s) = ML (φ,s) = ∑L(φk (zl, di) *P(zl/sj) z R(φk, sj) = = ∑L(φk (zl) = di ; sj) * P(zl / sj) l
Pic.27
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 4 ДООПРЕДЕЛЕНИЕ задачи (блок С’) :
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 4 ДООПРЕДЕЛЕНИЕ задачи (блок С’) : R(φk, sj) = ∑L(φk (zl) = di ; sj) * P(zl / sj) l
Pic.28
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 5 ДООПРЕДЕЛЕНИЕ задачи (блок С’) :
3. Игра c единичным экспериментом. 3. 1. Постановка задачи. Слайд 5 ДООПРЕДЕЛЕНИЕ задачи (блок С’) : R(φk, sj) = ∑L(φk (zl) = di ; sj) * P(zl / sj) l
Pic.29
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 1 Принцип минимакса φ *(z)
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 1 Принцип минимакса φ *(z) : R(φ*) = = min max R (φ,s) φ s
Pic.30
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 2 Принцип минимального ожид
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 2 Принцип минимального ожидаемого риска φ * : R(φ*) = min MR (φ), φ где MR (φk) = ∑ R(φ,s) * P(s), s т. е. : MR (φk) =∑R(φ k,sj) * P(sj) j
Pic.31
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи . Слайд 3 принципы, основанные на
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи . Слайд 3 принципы, основанные на использовании апостериорных вероятностей ДООПРЕДЕЛЕНИЕ задачи: Блок D’ – расчет апостериорных вероятностей
Pic.32
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи . Слайд 4 ДООПРЕДЕЛЕНИЕ задачи: Бл
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи . Слайд 4 ДООПРЕДЕЛЕНИЕ задачи: Блок D1 – расчет апостериорных вероятностей
Pic.33
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 5 ДООПРЕДЕЛЕНИЕ задачи: Бло
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 5 ДООПРЕДЕЛЕНИЕ задачи: Блок D1 – расчет апостериорных вероятностей
Pic.34
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 6 ДООПРЕДЕЛЕНИЕ задачи: Бло
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 6 ДООПРЕДЕЛЕНИЕ задачи: Блок D1 – расчет апостериорных вероятностей
Pic.35
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 7 принципы, основанные на и
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 7 принципы, основанные на использовании апостериорных вероятностей ДООПРЕДЕЛЕНИЕ задачи: Блок D2 – расчет ожидаемых потерь на основе апостериорных вероятностей ML^( d, z ) = ∑ L(d, s) * P (s / z) s ML^( di, zk) = ∑ L(di, sj) * P (sj / zk) j где ML^( d, z ) - ожидаемые потери, рассчитанные на основе апостериорных вероятностей
Pic.36
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 8 ДООПРЕДЕЛЕНИЕ задачи: Бло
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 8 ДООПРЕДЕЛЕНИЕ задачи: Блок D2 – расчет ожидаемых потерь на основе апостериорных вероятностей ML^( di, zk) = ∑ L(di, sj) * P (sj / zk) j
Pic.37
Игра c единичным экспериментом. Подходы к решению задачи - 9 ДООПРЕДЕЛЕНИЕ задачи: Блок D2 – расчет
Игра c единичным экспериментом. Подходы к решению задачи - 9 ДООПРЕДЕЛЕНИЕ задачи: Блок D2 – расчет ожидаемых потерь на основе апостериорных вероятностей ML^( di, zk) = ∑ L(di, sj) * P (sj / zk) j
Pic.38
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 10 ДООПРЕДЕЛЕНИЕ задачи: Бл
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 10 ДООПРЕДЕЛЕНИЕ задачи: Блок D2 – расчет ожидаемых потерь на основе апостериорных вероятностей ML^( di, zk) = ∑ L(di, sj) * P (sj / zk) j
Pic.39
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 11 принципы, основанные на
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 11 принципы, основанные на использовании апостериорных вероятностей: - Принцип максимального правдоподобия - Байесовский принцип – принцип минималь-ного ожидаемого риска, рассчитанного на основе знания апостериорных вероятностей
Pic.40
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 12 Принцип максимального пр
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 12 Принцип максимального правдоподобия: на основе каждого исхода эксперимента делаются выводы о возможном состоянии природы в соответствии с наибольшей условной вероятностью P(s,z) При построении решающей функции учитываются наиболее вероятные состояния природы
Pic.41
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 13 Принцип максимального пр
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 13 Принцип максимального правдоподобия:
Pic.42
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 14 Байесовский принцип φ*(z
3. Игра c единичным экспериментом. 3. 2. Подходы к решению задачи. Слайд 14 Байесовский принцип φ*(z) : ML^ (d*,z) = min ML^ (d*,z)
Pic.43
Примеры ответов в терминах модели Примеры ответов в терминах модели - Обоснование выбора критерия: «
Примеры ответов в терминах модели Примеры ответов в терминах модели - Обоснование выбора критерия: «Для решения задачи был выбран критерий Лапласа, в соответствии с указанной степенью уверенности в преобладании выигрышной ситуации над проигрышной. Значение alpha принято равным 0. 5» - Рекомендация по поводу необходимости проведения следующего эксперимента: «ПЕРВЫЙ эксперимент не рекомендуется проводить по причине его слишком высокой стоимости в сопоставлении с предполагаемым выигрышем» - Выбор стратегии для исхода эксперимента: «При ВТОРОМ исходе ПЕРВОГО эксперимента следует выбрать ВТОРУЮ стратегию. Ожидаемый выигрыш увеличивается с учётом стоимости эксперимента до 20»
Pic.44
Теория статистических решений (Статистические игры, игры с «природой«)
Теория статистических решений (Статистические игры, игры с «природой«)
Pic.45
Тема 4. Статистические игры с многократным экспериментом (с последовательными выборками)
Тема 4. Статистические игры с многократным экспериментом (с последовательными выборками)
Pic.46
Основные определения Игры, в которых статистик по результатам каждого эксперимента (каждой серии исп
Основные определения Игры, в которых статистик по результатам каждого эксперимента (каждой серии испытаний) на основе имеющейся информации принимает: либо решение прекратить эксперимент и выбрать стратегию d* или φ*, либо решение продолжить эксперименты, называются играми с многократным экспериментом (с последовательными выборками) Примечание: Если задано предельно допустимое число экспериментов (испытаний), после которых решение должно быть обязательно выбрано (принято), то игра называется игрой с усеченной последовательной выборкой
Pic.47
Основные определения Стратегия статистика в игре с многократным экспериментом состоит: в выборе план
Основные определения Стратегия статистика в игре с многократным экспериментом состоит: в выборе плана проведения эксперимента, указывающего, когда должен быть закончен эксперимент, в выборе решающей функции, указывающей, какое решение должно быть принято по окончании эксперимента
Pic.48
Стоимость проведения эксперимента (если выигрыш, получаемый от снижения неопределенности ситуации, м
Стоимость проведения эксперимента (если выигрыш, получаемый от снижения неопределенности ситуации, меньше стоимости эксперимента, эксперимент нецелесообразен!) Стоимость проведения эксперимента (если выигрыш, получаемый от снижения неопределенности ситуации, меньше стоимости эксперимента, эксперимент нецелесообразен!) 2. Основные принципы оптимальности: байесовский принцип принцип максимального правдоподобия
Pic.49
Общее число стратегий (решающих функций) в играх с многократным экспериментом получается значительно
Общее число стратегий (решающих функций) в играх с многократным экспериментом получается значительно большим, чем в играх с единичным экспериментом: Общее число стратегий (решающих функций) в играх с многократным экспериментом получается значительно большим, чем в играх с единичным экспериментом: при e1: w1 = ma1, при e2: w2 = w1a2, … → трудоемкость составления полного перечня стратегий статистика и выбора наилучшей из них → использование апостериорных вероятностей позволяет упростить вычисления
Pic.50
4. Если при проведении многократного эксперимента рассчитываются апостериорные вероятности, можно сн
4. Если при проведении многократного эксперимента рассчитываются апостериорные вероятности, можно снизить неопределенность относительно состояния природы 4. Если при проведении многократного эксперимента рассчитываются апостериорные вероятности, можно снизить неопределенность относительно состояния природы Признак для определения момента окончания эксперимента (при определенных его исходах) - …
Pic.51
Случай двухальтернативной гипотезы: Случай двухальтернативной гипотезы: Дано: D = {d1,d2}, S = {s1,s
Случай двухальтернативной гипотезы: Случай двухальтернативной гипотезы: Дано: D = {d1,d2}, S = {s1,s2}, P(S) = (p1,p2) = (p, 1-p) - апостериорное распределение вероятностей после проведения q экспериментов Информация ЛПР: «пороговые» значения δ и γ
Pic.52
Диапазоны Δ (d1) = [0, δ ] и Δ (d2) = [γ, 1] Диапазоны Δ (d1) = [0, δ ] и Δ (d2) = [γ, 1] называются
Диапазоны Δ (d1) = [0, δ ] и Δ (d2) = [γ, 1] Диапазоны Δ (d1) = [0, δ ] и Δ (d2) = [γ, 1] называются областями остановки Область остановки: Δ (d) = Δ (d1) ∩ Δ (d2), т. е. , если после эксперимента при каком-то его исходе выполняется условие: P (s) принадлежит области Δ (d), то эксперимент прекращается - (неопределенность «снята» !!)
Pic.53
ПРИМЕР: ПРИМЕР: Пусть информация ЛПР: δ = 0,2 γ = 0,8 По исходам первого эксперимента (звонок в мете
ПРИМЕР: ПРИМЕР: Пусть информация ЛПР: δ = 0,2 γ = 0,8 По исходам первого эксперимента (звонок в метеослужбу) рассчитаны апостериорные вероятности: Следовательно, при исходе эксперимента z3 («будет ясно») эксперимент можно прекратить


Скачать презентацию

Если вам понравился сайт и размещенные на нем материалы, пожалуйста, не забывайте поделиться этой страничкой в социальных сетях и с друзьями! Спасибо!