Центральная предельная теорема и ее доказательство через ряды Тейлора
Прежде чем приступить к рассмотрению центральной предельной теоремы, я считаю нужным сказать о слабой сходимости.
Пусть задана последовательность
случайных величин (далее с. в.)
,
задано некоторое распределение
с
функцией распределения
и
—
произвольная с. в., имеющая распределение
.
Определение.
Говорят, что последовательность с. в.
при
сходится
слабо или по
распределению к с. в.
и пишут:
,
или
,
или
,
если для любого
такого,
что функция распределения
непрерывна
в точке
,
имеет место сходимость
при
.
Иначе говоря, слабая сходимость — это поточечная сходимость функций распределения во всех точках непрерывности предельной функции распределения.
Свойство 1.
Если
,
и функция распределения
непрерывна
в точках
и
,
то
и т.д. (продолжить ряд).
Наоборот, если во всех точках
и
непрерывности
функции распределения
имеет
место, например, сходимость
,
то
.
Следующее важное свойство уточняет отношения между сходимостями.
Свойство 2.
1. Если
,
то
.
2. Если
,
то
.
Свойство 3.
1. Если
и
,
то
.
2. Если
и
,
то
.
Несколько содержательных примеров слабой сходимости я рассмотрю ниже. Но основной источник слабо сходящихся последовательностей и необычайно мощное и универсальное средство для асимптотического анализа распределений сумм независимых и одинаково распределенных случайных величин предоставляет нам центральная предельная теорема.
Я буду называть следующее утверждение «ЦПТ Ляпунова» (А. М. Ляпунов: 1901), но сформулирую и докажу теорему Ляпунова только в частном случае, т.е. для последовательности независимых и одинаково распределенных случайных величин.
Центральная предельная теорема.
Пусть
—
независимые и одинаково распределенные
случайные величины с конечной и ненулевой
дисперсией:
.
Обозначим через
сумму
первых
случайных
величин:
.
Тогда последовательность случайных
величин
слабо сходится к стандартному нормальному
распределению.
Доказательство.
Пусть
—
последовательность независимых и
одинаково распределенных случайных
величин с конечной и ненулевой дисперсией.
Обозначим через
математическое
ожидание
и
через
—
дисперсию
.
Требуется доказать, что
Введем
стандартизированные случайные величины
—
независимые с.в. с нулевыми математическими
ожиданиями и единичными дисперсиями.
Пусть
есть
их сумма
.
Требуется доказать, что
Характеристическая
функция величины
равна
Характеристическую
функцию с.в.
можно
разложить в ряд Тейлора, в коэффициентах
которого использовать известные моменты
,
.
Получим
Подставим
это разложение, взятое в точке
,
в равенство и устремим
к
бесконечности. Еще раз воспользуемся
замечательным пределом:
В пределе получили характеристическую функцию стандартного нормального закона. По теореме о непрерывном соответствии можно сделать вывод о слабой сходимости :
распределений стандартизованных сумм к стандартному нормальному распределению, что и утверждается в ЦПТ.
Пользуясь определением и свойствами
слабой сходимости, и заметив, что функция
распределения
любого
нормального закона непрерывна всюду
на
,
утверждение ЦПТ можно сформулировать
любым из следующих способов:
Следствие.
Пусть
—
независимые и одинаково распределенные
случайные величины с конечной и ненулевой
дисперсией. Следующие утверждения
эквивалентны друг другу и равносильны
утверждению ЦПТ.
Для любых вещественных
при
имеет
место сходимость
Для любых вещественных
при
имеет
место сходимость
Для любых вещественных
при
имеет
место сходимость
Если
—
произвольная с. в. со стандартным
нормальным распределением, то
Следствием из ЦПТ является предельная теорема Муавра-Лапласа.
Предельная теорема Муавра — Лапласа.
Пусть
—
событие, которое может произойти в любом
из
независимых
испытаний с одной и той же вероятностью
.
Пусть
—
число осуществлений события
в
испытаниях.
Тогда
.
Иначе говоря, для любых вещественных
при
имеет
место сходимость
Доказательство.
По-прежнему
есть
сумма независимых, одинаково распределенных
с. в., имеющих распределение Бернулли
с параметром, равным вероятности успеха
:
Осталось воспользоваться ЦПТ.
Ниже я рассмотрю примеры использования ЦПТ.
Пример 1.
З а д а ч а. Монета подбрасывается 10000 раз. Оценить вероятность того, что частота выпадения герба отличается от вероятности более чем на одну сотую.
Р е ш е н и е.
Требуется найти
,
где
,
—
число выпадений герба, а
—
независимые с. в., имеющие одно и то
же распределение Бернулли с параметром
1/2. Домножим обе части неравенства под
знаком вероятности на
и
поделим на корень из дисперсии
одного
слагаемого.
Согласно ЦПТ или предельной теореме Муавра — Лапласа, последовательность
слабо
сходится к стандартному нормальному
распределению. Рассмотрим произвольную
с. в.
,
имеющую распределение
.
Пример 2.
Прекрасным примером ЦПТ в экономике может служить ее использование в страховом деле. В большинстве случаев конкретный вид распределения потерь (размеров отдельных требований о выплате страховых сумм) не играет существенной роли, поскольку сумма исков, предъявляемых страховщику (величина суммарного иска), обычно зависит только от средней величины и дисперсии убытка. Дело в том, что если количество страховых случаев значительно превышает единицу, то в силу центральной предельной теоремы распределение суммарного иска является нормальным распределением. Обозначив его дисперсию как D>Z>, а математическое ожидание (среднее значение суммарного иска) как <Z> = <N><Q>
- где <N>, <Q> - среднее значение числа страховых случаев и величины страховой выплаты, получаем следующее выражение для рисковой надбавки Т>r>:
Т>r> = [(Т>0>)/(<N><Q>)](<N>D>Q> + <Q>2D>N>) 0.5
- где D>Q> и D>N> -дисперсии величины страховой выплаты и количества страховых случаев.
В простейшем случае, когда все выплаты одинаковы (а, следовательно, их дисперсия равна нулю), имеем:
Т>r> = (Т>0>)/N0.5
Эта формула также дает неплохое приближение, если коэффициент вариации уровня страховых выплат значительно меньше единицы.
При включении в страховой полис нескольких независимых рисков ожидаемая величина страховых выплат в соответствии с теоремой о сложении вероятностей представляет собой сумму ожидаемых страховых выплат по каждому риску в отдельности, а рисковая надбавка вычисляется как среднеквадратичная величина всех рисковых надбавок.