Экономическая кибернетика (работа 1)

Эк. Кибернетика.

Игра – матем. Модель конфликтной ситуации.

Стратегия игрока – это правила выбора действий в сложившейся ситуации.

Решение игры – это нахождение оптимальной стратегии для каждого игрока, т.е. нахождение цены игры.

Оптимальная стратегия игрока – это стратегия, которая в среднем (настрив. на длительную игру) дает игроку возможный наибольший выигрыш.

Неонтогонистическая – если выигрыш одной из сторон склад. из проигрыша др. стороны, иначе антогонистическая – выигрыш одного равен проигрышу др.

Матричные игры.

- самые простые игры. Играют 2 чел. У каж конечное число стратегий. Список стратегий известен каж играющему, т.е. игра с полной инф. Игра одноходовая.

Величина выигрыша известна заранее, опис. В числовых единицах. Оба дейст. Сознательны, никто не поддается. Игра яв-ся антогонистической. Правила определяют победителя.

Игры с седловой точкой обладают св-м устойчивости – если один игрок примен оптим стратегию, то др. игроку не выгодно отклон-ся от своей оптим стратегии.

Первонач сведен по т. вероятности.

Случайные событие – это событие, которое может произойти или не произойти в данной ситуации.

Вероятность – это количественная характеристика, мера появ-я событий.

P(А)=(число благопр. событий)/(общее число событий).

М(х)=_>i>х_>i>p_>i>_>>– матем. ожидание.

D(x)=_>i>х²_>i>p_>i> – (M(x))² – дисперсия.

(x)=D(x) – средне квадратичное отклонение – показывает степень разбросанности значений случайной величины относительно матем. ожидания.

Правило 3 сигм ():

PM(x)-3(x)<x<M(x)+3(x)= 0,997

Вероятность того, что сличайная величина х попадает в интервал с концами матем. ожидания -3(х) и +3(х) равняется 0,997.

Многоуголь. распределение – ломанная линия соед-я последовательно точки с коор-ми (х_>i>;p_>i>).

Смешанные стратегии.

- распределение вероятностей на множестве его чистых стратегий, обобщение обычной стратегии.

Чистая стратегия – это стратегия, которая применяется с вероятностью 1.

Теорема Неймана: Любая матричная игра имеет оптимальное решение возможно среди смешанных стратегий.

Стратегия А_>i> активная первого игрока – если вероятность исполь-я в оптим стратегии больше нуля (А_>i>-акт, если р^*_>i>>0); S^*_>A>- оптим стратегия.

Стратегия В_>j> активная второго игрока – если вероятность исполь-я ее в опти стратегии больше нуля (B_>i>-акт, если q^*_>i>>0); S^*_>B> - оптим стратегия.

Неактивная стратегия – вероятность применения, которой в оптим стратегии равна нулю.

Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2 игроку не выгодно выходить за рамки своих активных стратегий.

Теорема: В матр. игре количество активных стратегий у каж игрока одинаковое.

Применение решений в усл. неопределенности.

Рассмотрим игру человек и природа. Человек – лицо принимающее решение. Природа – экон-я среда в состоянии рынка.

Отличия от матричной игры: Активные решения принимает только чел, он хочет найти наиболее оптим решение. У природы стихийное поведение и она не стремится к выигрышу. Считается, что чел знает список сост природы, но не знает какое из них будет фактическим. В игре с природой чел труднее сделать свой выбор, поэтому сущ несколько подходов нахождения оптимального решения.

Подход определяется склонностью чел к риску.

Риск – это может быть упущенная выгода или необход понести дополнит произв-е затраты.

Элементы матрицы – это ожидание резуль. Деятельности в завис от сост природы.

1) Подход махмах “оптимистический”: В каж точке мы находим макс элемент и после этого находим макс из полученных чисел. _>i>=max_>j> a_>ij>=max_>i>_>i>=_>i0> выб А_>i0>.

Выбираем макс значение. Чел ориентир на самый лучший возмож результат, не обращ внимание на возмож неудачи.

2) Критерий Вальда – критерий пессимизма: Находим в каж строчке миним элемент и выбираем ту стратегию, которая дает макс гарантируемый доход.

_>i>=min_>j> a_>ij>=max_>i> _>i>=_>i>  выб А_>i0>.

3)Критерий Гурвица () – ур пессимизма: Человек выбирает 01. Находим число _>i>=_>i>+(1-)_>i> _>maxi>_>i>=_>i0> выб А_>i0>. Если =1 – кр Вальда (пессимизма), если =0 – кр оптимизма. Конкретная величина  опред-ся эк-ой ситуацией.

4) Критерий Сэвиджа – кр минимального риска: Состав март риска по формуле r_>ij>=_>j>-а_>ij>. _>ij>=max a_>ij>  r_>ij>=_>j>-a_>ij>.

R=(r_>ij>) –матр риска; r_>i>=max_>j> r_>ij> min_>i> r_>i>=r_>i0>  выб А_>i0>.

Если бы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го решения: r_>ij>=0 (если П_>j>)  А_>i>. Риск = величине упущенной возможности.

У каж критерия есть свои особенности применения. Если мы оценив ситуацию по разным критериям, то мы можем принять более обоснован решение. Трудность обоснования яв-ся, что природа не стремится к выигрышу.

Принятие решения в усл риска.

Рассотрим вариант игры чел и природы в случаи, когда нам известно сост природы. Природа к выигрышу не стремится. Находим стратегию, которая приносит макс средний доход. Средний доход расчитывается по правилу теории вероятности.

Величина среднего дохода равна матем ожиданию при этой стратегии.

1) М(A_>i>)=ⁿ_>j=1>a_>ij>p_>j>_>> Находим макс max_>i> M(A_>i>)

2) Правило минималь среднего риска. R=(A_>i>)=ⁿ_>j=1>r_>ij>p_>j>. Находим наимень min_>i> R(A_>i>).

Лемма: Указ выше 2 критерия в результате всегда приводят к выбору одной и той же оптим стратегии.

Док-во: Найдем миним сред риска min_>i> R(A_>i>)= min_>i>_>j>r_>ij>p_>j>= min_>i>(_>j>(_>j>-а_>ij>)p_>j>)= min_>i>(_>j>_>j> p_>j>-_>j>а_>ij>p_>j>)=_>j>_>j> p_>j> – не зависит от переменной i, значит это const С= min_>i>(С-_>j>а_>ij>p_>j>) минимум разности соот-ет максимуму вычитаемого.

max_>i> _>j>а_>ij>p_>j>=M(A_>i>).

Номера стратегий, на которых достиг миним среднего риска, равны номерам стратегий обеспеч наиболь средний выигрыш.

Бейссовский подход нахождения оптимального решения.

Бейсовский подход: Если первонач распредел вероятности мы получ доход Q^. Если мы можем провести эксперемент дающий новое распред вероятности в завис от первонач Q^и нового Q’ , мы делаем свой выбор стратегии. p'Q’^.

Некоторые св-ва матричной игры.

Замеч№1 О масштабе игр: Пусть даны 2 игры одинаковой размерности с платежной матрицей р⁽¹⁾ и р⁽²⁾. При чем при любых i и j выпол (а⁽²⁾_>ij>=a⁽¹⁾_>ij>+), некоторые числа  и . Тогда: 1) опт стратегии 1 игрока в 1 и 2 игре одинаковые. Опт стратегии 2 игрока одинаковы в обеих играх.

2) Цена второй игры V_>2>=V_>1>+.

Для некот методов решений все элементы матр должны быть не отрицательными.

Заме№2 О доминировании стратегий: Этот прием применяется для умень размерности игры.

А: А_>i> доминирует над А_>к> (А_>i>>А_>к>), если для любого j выпол нерав-во а_>ij>>a_>kj> и хотя бы одно из этих нерав-в строгое.

А_>к> – заведомо невыгодна; сред размер выигрыша меньше; р^*_>к>=0, стратегия пассивная.

В: В_>j> доминирует над В_>t> (В_>j>>В_>t>), если для любого i выпол нерав-во а_>ij>>a_>it> и хотя бы одно из этих нерав-в строгое.

B_>t> – невыгодна  q^*_>t>=0 – актив стратегия.

Доминир стратегии вычеркиваются и получ матр меньшей размерностью.

Замеч№3 Сравнение операций по методу Парето: Допустим есть операции Q_>1>, Q_>2>,… Q_>n>. Для каж опер-и расчит 2 параметра: 1) E(Q) – эффективность (доход);

2) r(Q) – степень риска (-сред квадратич отклон).

Самая лучшая операция – это опер с наилуч эф-ю и с наимень риском. F(Q)=E(Q)-r(Q), где  - это склонность к риску (не мат проблема). Находим макс из этих критериев max_>i> F(Q_>i>). Операция Q_>i>>Q_>,>если эф-ть не менее E(Q_>i>)E(Q_>j>), а риск опер r(Q_>i>)r(Q_>j>) и хотя бы одно из нерав-в строгое.

Доминир страт отбрас, как заведомо невыгодные.

Множ Парето – это все недоминир-е операции. Наиболее эф-е среди них.

Понятие о позиционных игр.

У каж игрока своя платежная матрица. Выигрыш одного не означ проигр др. Таким способом можно высчитывать взаимные интересы игроков, а также возможность образования коалиции. Можно расчит динамические игры учитывая фактор времени и т.д.

Позиционные игры –возникает в случаи, когда надо принимать последо-но несколько решений, при чем выбор решения опираются на предыдущ-е решения.

Рассотрим простейш случ позиц-й игры с природой. Решение изобр в виде дерева решений.

Дерево решений – граф-е изобр-е всех возможных альтернатив игрока и сост природы с указ вероятности соответ-х состояний и размеров выигрыша в каж ситуации.

Альтернатива игрока изобр квадратом – список возможных стратегий в соот-й ситуации. Сост-е природы кружочком, чел на них влиять не может. Делается оценка каж вершины и наход макс оценка ситуаций соот-х каж ветви дерева решений.

EMV – денежное решение; EMV=_>i>(отдача в i-ом сост-и)p_>i>

max_{>вершина}> (EMV)=?