Распределение случайной величины. Эмпирические линии регрессии
Контрольная работа № 1
Задача 1
Рабочие обслуживают три станка, на которых обрабатывается однотипные детали. Вероятность изготовления бракованной детали на первом станке равна 0,2, на втором – 0,3, на третьем – 0,4. Обработанные детали складываются в один ящик. Производительность первого станка в три раза больше чем второго, а третьего – в два раза меньше чем второго. Взятая на удачу деталь оказалась бракованной. Найти вероятность того, что она изготовлена на третьем станке.
Решение:
Событие А – взятая деталь оказалась бракованной. Деталь может быть изготовлена на первом, втором или третьем станке, обозначим через В>1>, В>2> и В>3>. Соответственно Р(В>1>) = , Р(В>2>) = , Р(В>3>) = .
Условная вероятность того, что бракованная деталь изготовлена первым станком Р>В1>(А) = 0,02, аналогично Р>В2>(А) = 0,03 и Р>В3>(А) = 0,04.
По формуле полной вероятности
Р(А) =
По формуле Бейеса
Ответ: Р>А>(В>3>) = 0,1818
Задача 2
Каждая из пяти упаковок тетрадей содержит две тетради в линейку и три в клетку. Из каждой упаковки случайным образом отбираются по две тетради. Найти вероятность того, что не менее чем в трех из отобранных пяти пар тетрадей обе тетради будут в клетку.
Решение:
Вероятность взять 2 тетради в клетку из пачки
Р = .
Не менее трех пар из пяти отобранных должны быть – 3 пары, 4 пары, 5 пар.
Вычислим
Р>5>(3) + Р>5>(4) + Р>5>(5).
P>n>(k) = ,
где р = 0,3 и q = 0,7.
Р>5>(3) = 0,1323
Р>5>(4) = 0,0284
Р>5>(5) = 0,0024
Искомая вероятность равна 0,1323 + 0,0284 + 0,0024 = 0,1631
Ответ: 0,1631
Задача 3
Вероятность того, что договор страховой кампании завершится выплатой по страховому случаю, равна 0,1. Страховая кампания заключила 2000 договоров. Найти вероятность того, что страховой случай наступит: а) 210 раз; б) от 190 до 250 раз включительно.
Решение:
а) Используем локальную теорему Лапласа, где k = 210, р = 0,1 и q = 0,9.
P>n>(k) = , где =
Р>2000>(210) =
б) Используем интегральную теорему Лапласа, где n = 2000, k>2> = 250, k>1> = 190.
P>n>(k>1>;k>2>) = (x’’) - (x’),
х’’ = .
х’ = .
(x’’) = (3,73) = 0,4999.
(x’) = (-0,75) = - 0,2764.
P>2000>(190;250) = 0,4999 + 0,2764 = 0,7763/
Ответ: а) Р>2000>(210) = 0,0224, б) Р>2000>(190;250) = 0,7763
Задача 4
Законное распределение независимых случайных величин Х и У имеют вид:
Х:
-
x>i>
0
1
2
p>i>
0,3
?
0,2
Y:
-
y>i>
1
2
p>i>
0,4
?
Найти вероятность P(X = 1), P(Y = 2).
Составить закон распределения случайной величины
Z = X*Y.
Проверить выполнение свойства математического ожидания:
M(Z) = M(X)*M(Y)
Решение:
Р(Х = 1) = 1 – (0,3 + 0,2) = 0,5
Р(Y = 2) = 1 – 0,4 = 0,6
Составим закон распределения случайной величины Z = X*Y
x>j> |
0 |
1 |
2 |
|
y>i> |
p>j> p>i> |
0,3 |
0,5 |
0,2 |
1 |
0,4 |
0 0,12 |
1 0,2 |
2 0,08 |
2 |
0,6 |
0 0,18 |
20,3 |
4 0,12 |
z>i> |
0 |
1 |
2 |
4 |
p>i> |
0,3 |
0,2 |
0,38 |
0,12 |
p>i> = 0,3 + 0,2 + 0,38 + 0,12 = 1
M(Z) = 0*0,3 + 1*0,2 + 2*0,38 + 4*0,12 = 1,44
M(X) = 0*0,3 + 1*0,5 + 2*0,2 = 0,9
M(Y) = 1*0,4 + 2*0,6 = 1,6
M(Z) = M(X)*M(Y) = 0,9*1,6 = 1,44.
Ответ:
-
Z>i>
0
1
2
4
P>i>
0,3
0,2
0,38
0,12
Задача 5
Функции распределения непрерывной случайной величины Х имеет вид:
0 при х -1,
F(x) = (х + 1)2 при -1 х 0,
1 при х 0.
Найти математическое ожидание этой случайной величины и вероятность того, что при каждом из трех независимых наблюдений этой случайной величины будет выполнено условие .
Решение:
Найдем плотность распределения
0 при х -1,
f(x) = F’(x) = 2(x + 1) при -1 х 0,
1 при х 0.
М(х) =
- математическое ожидание.
Р(х ) = Р( -1 х < ) = F() – F( -1) =
Ответ: М(х) = и Р(х < ) =
Контрольная работа № 4
Задача 1
При выборочном опросе ста телезрителей, пользующихся услугами спутникового телевидения, получены следующие результаты распределения их по возрасту
Возраст (лет) |
Менее 20 |
20 – 30 |
30 – 40 |
40 – 50 |
50 – 60 |
60 – 70 |
Более 70 |
Итого |
Количество пользователей (чел.) |
8 |
17 |
31 |
40 |
32 |
15 |
7 |
150 |
Найти:
а) Вероятность того, что средний возраст телезрителей отличается от среднего возраста, полученного по выборке, не более чем на два года (по абсолютной величине);
б) Границы, в которых с вероятностью 0,97 заключена доля телезрителей, возраст которых составляет от 30 до 50 лет;
в) Объем бесповторной выборки, при котором те же границы для доли можно гарантировать с вероятностью 0,9876; дать ответ на тот же вопрос, если никаких предварительных сведений о доле нет.
Решение:
Вычислим среднюю арифметическую и дисперсию распределения. Величина интервала k = 10 и с = 45, середина пятого интервала. Вычислим новые варианты в рабочей таблице:
i |
[x>i>;x>i+1>] |
x>i> |
u>i> |
n>i> |
u>i>;n>i> |
u2>i>;n>i> |
u>i> +1 |
(u>i> + 1)n>i> |
1 |
10 – 20 |
15 |
-3 |
8 |
-24 |
72 |
-2 |
32 |
2 |
20 – 30 |
25 |
-2 |
17 |
-34 |
68 |
-1 |
17 |
3 |
30 – 40 |
35 |
-1 |
31 |
-31 |
31 |
0 |
0 |
4 |
40 – 50 |
45 |
0 |
40 |
0 |
0 |
1 |
40 |
5 |
50 – 60 |
55 |
1 |
32 |
32 |
32 |
2 |
128 |
6 |
60 – 70 |
65 |
2 |
15 |
30 |
60 |
3 |
135 |
7 |
70 – 80 |
75 |
3 |
7 |
21 |
63 |
4 |
112 |
|
315 |
0 |
150 |
-6 |
326 |
7 |
464 |
a) Найдем среднюю квадратическую ошибку бесповторной выборки
Искомая доверительная вероятность
б) Выборочная доля зрителей от 30 до 50 лет
Средняя квадратическая ошибка бесповторной выборки для доли
Из соотношения = Ф(t) = 0,97; t = 2,17
Предельная ошибка выборки для доли = 2,17*0,0376 = 0,08156
Искомый доверительный интервал
0,4733 – 0,08156 р 0,4733 + 0,08156
0,3918 р 0,5549
в) Учитывая = Ф(t) = 0,3876; t = 2,5
человек.
Если о доле p = w ничего не известно, полагаем (pq)>max> = 0,25
человек.
Ответ: а) ; б) 0,3918 р 0,5549 ; в) 190 человек
Задача 2
По данным задачи 1, используя критерий 2 – Пирсона, при уровне значимости, а = 0,5 проверить гипотезу о том, что случайная величина Х – количество телезрителей – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Решение:
Выдвигается гипотеза Н>0>: случайная величина Х – количество телезрителей – распределена нормально. с параметрами а = 44,6 и 2 = 217,17.
Для расчета р>i> используем функцию Лапласа
Дальнейшие расчеты покажем в таблице
i |
[x>i>;x>i+1>] |
n>i> |
p>i> |
np>i> |
(n>i> – np>i>) |
|
1 |
10 – 20 |
8 |
0,0582 |
8,7225 |
0,522 |
0,0598 |
2 |
20 – 30 |
17 |
0,1183 |
17,738 |
0,5439 |
0,0307 |
3 |
30 – 40 |
31 |
0,2071 |
31,065 |
0,0042 |
0,0001 |
4 |
40 – 50 |
40 |
0,2472 |
37,073 |
8,5703 |
0,2312 |
5 |
50 – 60 |
32 |
0,2034 |
30,51 |
2,2201 |
0,0728 |
6 |
60 – 70 |
15 |
0,1099 |
16,478 |
2,183 |
0,1325 |
7 |
70 – 80 |
7 |
0,0517 |
7,755 |
0,57 |
0,0735 |
|
150 |
0,9956 |
149,34 |
0,6006 |
Фактическое значение 2 = 0,6006 Соотносим критическое значение 2>0,05;4> = 9,49 k = m – r – 1 = 7 – 2 – 1 = 4.
Так как 2 2>0,05;4>, гипотеза Н>0> согласуется с опытными данными. Выполним построение:
Ответ: Гипотеза о выбранном теоретическом нормальном законе N (44,6; 217,17) согласуется с опытными данными.
Задача 3
Распределение 50 однотипных малых предприятий по основным фондам Х (млн., руб.) и себестоимости выпуска единицы продукции. У (тыс., руб.) представлено в таблице:
у х |
1,25 |
1,5 |
1,75 |
2,0 |
2,25 |
Итого |
80 – 130 |
1 |
2 |
3 |
6 |
||
130 – 180 |
1 |
4 |
3 |
8 |
||
180 – 230 |
4 |
8 |
3 |
1 |
16 |
|
230 – 280 |
2 |
5 |
4 |
11 |
||
280 – 330 |
3 |
4 |
2 |
9 |
||
Итого: |
5 |
3 |
16 |
9 |
7 |
50 |
Необходимо:
1. Вычислить групповые средние x>j> и y>i> и построить эмпирические линии регрессии.
2. Предполагая, что между переменными Х и Y существует линейная корреляционная зависимость:
а) найти уравнение прямых регрессий и построить их графики на одном чертеже с эмпирическими линиями регрессии;
б) вычислить коэффициент корреляции на уровне значимости, а=0,05, оценить его значимость и сделать вывод о тесноте и направлении связи между переменными Х и Y;
в) используя соответствующие уравнения регрессии, определить количество выпускаемой продукции при стоимости одной единицы продукции, равной 2,5 тыс., руб.
Решение:
1) Составим корреляционную таблицу
х |
у x>i> |
1,25 |
1,5 |
1,75 |
2 |
2,25 |
n>i> |
у>i> |
80 – 130 |
105 |
1 |
2 |
3 |
6 |
2,0833 |
||
130 – 180 |
155 |
1 |
4 |
3 |
8 |
2,0625 |
||
180 – 230 |
205 |
4 |
8 |
3 |
1 |
16 |
1,7656 |
|
230 – 280 |
255 |
2 |
5 |
4 |
11 |
1,5456 |
||
280 – 330 |
305 |
3 |
4 |
2 |
9 |
1,4722 |
||
n>j> |
5 |
13 |
16 |
9 |
7 |
50 |
||
x>j> |
285 |
255 |
220,63 |
160,56 |
140,71 |
Построим эмпирические линии регрессии
2) Предположим, что между переменными Х и Y существует линейная корреляционная зависимость;
а) Вычислим среднее значение
Найдем уравнение
у>х> = b>yx>(x – x) + y,
где b>yx> =
у>х> = - 0,0036(х – 214) + 1,75
у>х> = - 0,0036х + 2,5105
х>у> - х = b>yx>(у – у),
где b>ху> =
х>у> = - 157,14(х – 1,75) + 214
х>у> = - 157,14х + 489
б) Коэффициент корреляции
связь обратная и тесная;
Статистика критерия
При а = 0,05 и k = 48; t>0,05;48> = 2,01, так как t t>0,05;48> коэффициент значительно отличается от 0.
в) Используя х>у> = - 157,14у + 489
х = - 157,14*2,5 + 489 = 96,14
Ответ: а) у>х> = - 0,0036х + 2,5105; х>у> = - 157,14х + 489.
б) k = - 0,7473.
в) х = 96,14 при у = 2,5