Экономическая кибернетика (работа 1)
Эк. Кибернетика.
Игра – матем. Модель конфликтной ситуации.
Стратегия игрока – это правила выбора действий в сложившейся ситуации.
Решение игры – это нахождение оптимальной стратегии для каждого игрока, т.е. нахождение цены игры.
Оптимальная стратегия игрока – это стратегия, которая в среднем (настрив. на длительную игру) дает игроку возможный наибольший выигрыш.
Неонтогонистическая – если выигрыш одной из сторон склад. из проигрыша др. стороны, иначе антогонистическая – выигрыш одного равен проигрышу др.
Матричные игры.
- самые простые игры. Играют 2 чел. У каж конечное число стратегий. Список стратегий известен каж играющему, т.е. игра с полной инф. Игра одноходовая.
Величина выигрыша известна заранее, опис. В числовых единицах. Оба дейст. Сознательны, никто не поддается. Игра яв-ся антогонистической. Правила определяют победителя.
Игры с седловой точкой обладают св-м устойчивости – если один игрок примен оптим стратегию, то др. игроку не выгодно отклон-ся от своей оптим стратегии.
Первонач сведен по т. вероятности.
Случайные событие – это событие, которое может произойти или не произойти в данной ситуации.
Вероятность – это количественная характеристика, мера появ-я событий.
P(А)=(число благопр. событий)/(общее число событий).
М(х)=>i >х>i>p>i>> >– матем. ожидание.
D(x)=>i >х2>i>p>i> – (M(x))2 – дисперсия.
(x)=D(x) – средне квадратичное отклонение – показывает степень разбросанности значений случайной величины относительно матем. ожидания.
Правило 3 сигм ():
PM(x)-3(x)<x<M(x)+3(x)= 0,997
Вероятность того, что сличайная величина х попадает в интервал с концами матем. ожидания -3(х) и +3(х) равняется 0,997.
Многоуголь. распределение – ломанная линия соед-я последовательно точки с коор-ми (х>i>;p>i>).
Смешанные стратегии.
- распределение вероятностей на множестве его чистых стратегий, обобщение обычной стратегии.
Чистая стратегия – это стратегия, которая применяется с вероятностью 1.
Теорема Неймана: Любая матричная игра имеет оптимальное решение возможно среди смешанных стратегий.
Стратегия А>i> активная первого игрока – если вероятность исполь-я в оптим стратегии больше нуля (А>i>-акт, если р*>i>>0); S*>A>- оптим стратегия.
Стратегия В>j> активная второго игрока – если вероятность исполь-я ее в опти стратегии больше нуля (B>i>-акт, если q*>i>>0); S*>B> - оптим стратегия.
Неактивная стратегия – вероятность применения, которой в оптим стратегии равна нулю.
Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2 игроку не выгодно выходить за рамки своих активных стратегий.
Теорема: В матр. игре количество активных стратегий у каж игрока одинаковое.
Применение решений в усл. неопределенности.
Рассмотрим игру человек и природа. Человек – лицо принимающее решение. Природа – экон-я среда в состоянии рынка.
Отличия от матричной игры: Активные решения принимает только чел, он хочет найти наиболее оптим решение. У природы стихийное поведение и она не стремится к выигрышу. Считается, что чел знает список сост природы, но не знает какое из них будет фактическим. В игре с природой чел труднее сделать свой выбор, поэтому сущ несколько подходов нахождения оптимального решения.
Подход определяется склонностью чел к риску.
Риск – это может быть упущенная выгода или необход понести дополнит произв-е затраты.
Элементы матрицы – это ожидание резуль. Деятельности в завис от сост природы.
1) Подход махмах “оптимистический”: В каж точке мы находим макс элемент и после этого находим макс из полученных чисел. >i>=max>j> a>ij>=max>i>>i>=>i0> выб А>i0>.
Выбираем макс значение. Чел ориентир на самый лучший возмож результат, не обращ внимание на возмож неудачи.
2) Критерий Вальда – критерий пессимизма: Находим в каж строчке миним элемент и выбираем ту стратегию, которая дает макс гарантируемый доход.
>i>=min>j> a>ij>=max>i> >i>=>i> выб А>i0>.
3)Критерий Гурвица () – ур пессимизма: Человек выбирает 01. Находим число >i>=>i>+(1-)>i> >maxi>>i>=>i0> выб А>i0>. Если =1 – кр Вальда (пессимизма), если =0 – кр оптимизма. Конкретная величина опред-ся эк-ой ситуацией.
4) Критерий Сэвиджа – кр минимального риска: Состав март риска по формуле r>ij>=>j>-а>ij>. >ij>=max a>ij> r>ij>=>j>-a>ij>.
R=(r>ij>) –матр риска; r>i>=max>j> r>ij> min>i> r>i>=r>i0> выб А>i0>.
Если бы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го решения: r>ij>=0 (если П>j>) А>i>. Риск = величине упущенной возможности.
У каж критерия есть свои особенности применения. Если мы оценив ситуацию по разным критериям, то мы можем принять более обоснован решение. Трудность обоснования яв-ся, что природа не стремится к выигрышу.
Принятие решения в усл риска.
Рассотрим вариант игры чел и природы в случаи, когда нам известно сост природы. Природа к выигрышу не стремится. Находим стратегию, которая приносит макс средний доход. Средний доход расчитывается по правилу теории вероятности.
Величина среднего дохода равна матем ожиданию при этой стратегии.
1) М(A>i>)=n>j=1>a>ij>p>j>> > Находим макс max>i> M(A>i>)
2) Правило минималь среднего риска. R=(A>i>)=n>j=1>r>ij>p>j>. Находим наимень min>i> R(A>i>).
Лемма: Указ выше 2 критерия в результате всегда приводят к выбору одной и той же оптим стратегии.
Док-во: Найдем миним сред риска min>i> R(A>i>)= min>i> >j>r>ij>p>j>= min>i> (>j>(>j>-а>ij>)p>j>)= min>i> (>j>>j> p>j>->j>а>ij>p>j>)=>j>>j> p>j> – не зависит от переменной i, значит это const С= min>i> (С->j>а>ij>p>j>) минимум разности соот-ет максимуму вычитаемого.
max>i> >j>а>ij>p>j>=M(A>i>).
Номера стратегий, на которых достиг миним среднего риска, равны номерам стратегий обеспеч наиболь средний выигрыш.
Бейссовский подход нахождения оптимального решения.
Бейсовский подход: Если первонач распредел вероятности мы получ доход Q. Если мы можем провести эксперемент дающий новое распред вероятности в завис от первонач Qи нового Q’ , мы делаем свой выбор стратегии. p'Q’.
Некоторые св-ва матричной игры.
Замеч№1 О масштабе игр: Пусть даны 2 игры одинаковой размерности с платежной матрицей р(1) и р(2). При чем при любых i и j выпол (а(2)>ij>=a(1)>ij>+), некоторые числа и . Тогда: 1) опт стратегии 1 игрока в 1 и 2 игре одинаковые. Опт стратегии 2 игрока одинаковы в обеих играх.
2) Цена второй игры V>2>=V>1>+.
Для некот методов решений все элементы матр должны быть не отрицательными.
Заме№2 О доминировании стратегий: Этот прием применяется для умень размерности игры.
А: А>i> доминирует над А>к> (А>i>>А>к>), если для любого j выпол нерав-во а>ij>>a>kj> и хотя бы одно из этих нерав-в строгое.
А>к> – заведомо невыгодна; сред размер выигрыша меньше; р*>к>=0, стратегия пассивная.
В: В>j> доминирует над В>t> (В>j>>В>t>), если для любого i выпол нерав-во а>ij>>a>it> и хотя бы одно из этих нерав-в строгое.
B>t> – невыгодна q*>t>=0 – актив стратегия.
Доминир стратегии вычеркиваются и получ матр меньшей размерностью.
Замеч№3 Сравнение операций по методу Парето: Допустим есть операции Q>1>, Q>2>,… Q>n>. Для каж опер-и расчит 2 параметра: 1) E(Q) – эффективность (доход);
2) r(Q) – степень риска (-сред квадратич отклон).
Самая лучшая операция – это опер с наилуч эф-ю и с наимень риском. F(Q)=E(Q)-r(Q), где - это склонность к риску (не мат проблема). Находим макс из этих критериев max>i> F(Q>i>). Операция Q>i>>Q>, >если эф-ть не менее E(Q>i>)E(Q>j>), а риск опер r(Q>i>)r(Q>j>) и хотя бы одно из нерав-в строгое.
Доминир страт отбрас, как заведомо невыгодные.
Множ Парето – это все недоминир-е операции. Наиболее эф-е среди них.
Понятие о позиционных игр.
У каж игрока своя платежная матрица. Выигрыш одного не означ проигр др. Таким способом можно высчитывать взаимные интересы игроков, а также возможность образования коалиции. Можно расчит динамические игры учитывая фактор времени и т.д.
Позиционные игры –возникает в случаи, когда надо принимать последо-но несколько решений, при чем выбор решения опираются на предыдущ-е решения.
Рассотрим простейш случ позиц-й игры с природой. Решение изобр в виде дерева решений.
Дерево решений – граф-е изобр-е всех возможных альтернатив игрока и сост природы с указ вероятности соответ-х состояний и размеров выигрыша в каж ситуации.
Альтернатива игрока изобр квадратом – список возможных стратегий в соот-й ситуации. Сост-е природы кружочком, чел на них влиять не может. Делается оценка каж вершины и наход макс оценка ситуаций соот-х каж ветви дерева решений.
EMV – денежное решение; EMV=>i>(отдача в i-ом сост-и)p>i>
max>вершина> (EMV)=?