Анализ зависимости между уровня комплемента в крови больных системной красной волчанкой и степенью тяжести поражения почек

Санкт-Петербургский Государственный Университет

Факультет прикладной математики – процессов управления

Кафедра диагностики функциональных систем

Анализ зависимости между УК в крови больных СКВ и степенью тяжести поражения почек

Курсовая работа

Варламова

Александра

Александровна

Научный руководитель

доктор медицинских наук, профессор Шишкин В.И.

Санкт-Петербург 2008

Содержание

§1. Введение

§2. Постановка задачи

§3. Используемые методы

1. Дисперсионный анализ по одному признаку для проверки равенства нескольких средних

2. Непараметрический дисперсионный анализ по одному признаку с применением критерия Краскала-Уоллиса для нескольких независимых выборок

3. Непараметрический дисперсионный анализ по одному признаку с применением критерия Джонкхиера для нескольких выборок, упорядоченных по возрастанию влияния фактора

§4.Вывод

§5. Список литературы

§1. Введение

Формулировка проблемы

Изложим проблемную ситуацию, имеющую место в настоящее время в решении задач обработки результатов исследований. Известно, что в распоряжении исследователей имеется большая и постоянно растущая в объеме база данных результатов измерений из разных областей естествознания: астрономии, экспериментальной физики, экономики, биологии, медицины.

По мнению автора, сформировавшемуся вследствии ознакомления с содержанием официальных высказываний ведущих политиков и ученых мира, наибольшего развития в 21 веке среди других наук достигнут биология и медицина. Известно и напечатано, например, в книге Е.В. Гублера "Информатика в патологии, клинической медицине и педиатрии" [1] , что в этом аспекте решение задач обработки результатов измерений приобретает ключевое значение . Следуя рекомендациям пособия "Кандидатская диссертация" [2] выполним критический анализ ситуации, сложившейся в настоящее время в России в решении задач обработки результатов наблюдений. Уже на предварительном этапе исследования имеет место противоречивая ситуация: с одной стороны – обработка найденных в медицине результатов измерений является актуальной задачей в современной науке, с другой стороны – известно, что в медицинских ВУЗах математика, как дисциплина учебного процесса , практически не изучается. Следовательно, то что методы обработки данных медицинских исследований стали предоставляться математикам-специалистам, создает прецедент выдвижения медицины в число приоритетных направлений Российской науки.

Изложив проблемную ситуацию, перейдем к определению цели и объекта исследования.

§2. Постановка задачи

Предварительные замечания

Системные заболевания соединительной ткани, такие как системная красная волчанка , характеризуются прежде всего выраженной патологией по иммунологической компоненте. Мониторинг этого контингента больных позволяет отнести системные заболевания к числу крайне тяжелых недугов, поражающих людей в наиболее деятельный возрастной период ( в среднем 30-50 лет )[8] и приводящих к ранней инвалидизации, а порой и к летальным исходам. Усиливающееся год от года неблагоприятное воздействие окружающей среды приводит к росту иммунодефицитов различной этиологии, в том числе возрастает заболеваемость системными вариантами иммунокомплексных патологий.

В иммунокомплексных патологиях система комплемента играет важную, хотя и не всегда ясную, роль. Таким образом изучение динамики комплемента приобретает ключевое теоретическое и практическое значение. В связи с этим нами предпринят анализ зависимости уровня комплемента с тяжестью течения классического иммунокомплексного заболевания системной красной волчанкой.

Объект, предмет, цель и задача исследования

В качестве исходных данных для исследования даны выборки численных значений медико-биологических показателей человеческого организма, а именно: уровня комплемента в крови больных системной красной волчанкой ( в дальнейшем – СКВ) и степенью тяжести поражения почек. . В целях полноты изложения приведем необходимое определение : "Комплемент - система сывороточных белков, которая активируется комплексом антиген - антитело с образованием биологически-активных веществ, способных вызывать необратимые повреждения клеточных мембран. Комплемент является одним из факторов естественного иммунитета и широко применяется в диагностических иммунологических реакциях."[3, ст. 57]

Объектом нашего исследования являлись выборочные данные результатов измерений уровня комплемента ( в дальнейшем - УК), причем изучаемые данные представляют собой пять столбцов чисел ,в первом из которых представлены данные без нефрита, во втором с нефритом слабовыраженным, в третьем с нефритом средней выраженности, в четвертом с нефротическим синдром, а в пятом- с почечной недостаточностью.

Предмет исследования определяем, как нахождение зависимости УК в крови больных СКВ и степенью тяжести поражения почек.

§3. Используемые методы

Будем использовать методы биометрического анализа, основанные на проверке гипотез однородности выборок.[9]

    Дисперсионный анализ по одному признаку для проверки равенства нескольких средних

Во многих случаях практики интерес представляет вопрос о том, в какой мере существенно влияние того или иного фактора на рассматриваемый признак [9]. В данном случае фактором является степень поражения почек, а признаком - УК.

Научное обоснованное решение подобной задачи при некоторых предположениях составляет предмет дисперсионного анализа , введенного математиком- статистиком Р. А. Фишером.[10]

Статистическая модель

Выборки производятся из нормальных совокупностей. Первая выборка производиться из совокупности со средним, вторая - со средним , k-я из совокупности со средним . Все наблюдения независимы. Будем считать распределение данной мне совокупности нормальным.

Гипотезы №1.

Н>0> : = =…=

Н>1>: не все средние равны. все средние равны.

Критическая область.

Верхняя 5%-ная область F>k-1.>>N>>->>k> -распределения. В нашем случае F>4,474> -распределения, так как k=4, а =n>1> + n>2> + n>3> + n>4> + n>5 >=479. Эта область определяется неравенством F2.37. ( Определяется по таблице, см. Таблица А.4а на стр. 334 "Справочника по вычислительным методам статистики" Дж. Поллард [6] )

Вычисление значения критериальной статистики

Будем рассматривать исходные данные, представленные Таблицей №1.

Таблица №1. Значения УК в зависимости от тяжести ГН.

.Нет нефрита

Выборка объема

n>1>= 210

Слабый нефрит

Выборка объема n>2>= 101

Средний нефрит

Выборка объема n>3>= 98

Нефротический синдром

Выборка объема

n>4> = 45

Почечная недостаточность

Выборка объема

n>5> = 25

36

11

7

10

20

38

35

27

5

20

40

37

6

6

21

31

15

5

15

24

33

40

40

20

3

33,8

0

5

25

12

37

33

45

28

10

38

33

45

32

0

33

5

46

46

18,2

37

40

45

33

46

48

25

24

44

10

40

33

24

25

0

42

50

43

22,5

20

35

25

24,5

24,5

30,4

15

20

20,5

38

0

35

50

9

12

33,3

48

50

12

54,7

14,7

45

18

32

20,7

34,1

38

20

43

0

22,4

15

33

35,5

26,1

17,8

13

43

44

11

33,5

40

10

50

11,7

29,6

40

12

34

34,4

13,6

38

23

12

0

35

32,7

34

0

0

37

60

30

25,1

42

50

35

22,5

32,3

51

22

31

16

45

22,2

33

32,5

25

20

41,9

39,3

33

21

41,7

40,2

33

22

37,1

0

39

10

33,4

39,1

35,8

37,4

33

37,7

41,7

22,4

34,3

33,5

38,2

35

33

43,8

37,4

37,3

36,9

16

10

39,6

41

16

37,9

0

33

31

39,3

32,8

32,15

52

37,2

24

38,8

51

37,8

25

48,1

33,5

49,1

38

0

48

36,15

29

0

27

43,8

32

26,6

48

40

32

52,8

40

20

27

36

32,3

13,6

45

10

10

43,5

33,9

19,5

35

45,74

51,2

35

0

40,4

19,5

49,1

46,05

24,2

38

0

33

0

25,2

40,4

43,5

28

30

32,3

27

36

41

35

10

40

29

25

29,7

50

30

30

20

32

27,6

0

31

21,4

15,6

45

23

35

20

34,3

0

45

18

46

15

50,4

59,2

30,4

48,2

0

50

37,3

22,5

46

35

0

35

25

24

15

20

45

18

38

28,9

28

47,5

30,5

36,7

37,9

45,5

47,8

40,3

43

39,2

60

34,7

36,5

34,1

32,6

32

46,7

38,4

45,7

39

37,15

46,9

31,4

39

15,6

32

52,15

34,1

42

52,2

44,7

43,8

0

26,5

39,1

0

36,6

16

0

30,3

26,5

33

47

43

43

50

36,9

46,6

52,2

29,4

59,3

38,5

30,6

0

41

35,6

15,5

40

38,7

21,2

45

38,2

22,8

25,5

26,1

28,3

27,7

43,2

28,15

22,5

46

38,5

45

35,6

26

33

32,4

48,3

50

47,5

50

32

50

35,6

33,5

56,9

28,9

40

35,2

42,5

50

46,2

52,7

49,1

38

33,7

32,6

30

28,9

44,4

48,2

38,15

42

28,4

33,5

39,4

38,6

34,3

37,7

27,3

39,2

29,2

39,2

33,5

18

31,2

23,4

36,9

57,3

45

45,3

16,5

34,9

43,1

30,8

0

34,5

28

16

28,9

23

27

41,6

43,4

36

49

25

41,5

35,5

35

33,1

41,7

39,15

30,8

45,7

35,4

35,8

27

19,5

29,4

33,3

36,6

42,6

30

36,1

43

33,3

28,7

28,7

45,1

31,8

33

39,1

29

46,7

41,05

29,9

50

47

34,4

11

20,6

36,6

38,6

29,48

25

0

38

34,7

38,2

43,8

40,3

38,5

60

50

36

55

33,5

25,1

24,8

Всего:Т>1>=7502,38

Т>2>=3157,44

Т>3>=2819,55

Т>4>=1223,50

Т>5>=505,60

Т = Т>1> + Т>2 >+ Т>3> + Т>4> + Т>5>

Т=15208,47, Т2 = 231297559,74, N = 479

Средние значения выборок:

=35,6

= 31,1

= 28,7

= 26,38

= 19,8

Возведем в квадрат значение всех наблюдений и просуммируем их [6].

Вычисляем:

=567988,11

Общая сумма квадратов будет следующей:

- /N = 85112,2

Находим сумму квадратов между выборками:

(/n>1> +….+/n>k> ) – T2/N = 8470,35

Теперь можно заполнить таблицу дисперсионного анализа [6].

Таблица №2. Дисперсионный анализ по одному признаку.

Компонента дисперсии

(1)

Сумма квадратов

(2)

Степень свободы

(3)

Средний квадрат

(4)=(2)/(3)

Между выборками

()-/N

k-1

(определяется делением)

Остаточная

(определяется вычитанием)

N-k

Полная

N-1

-----

Получаем:

Таблица №2а. Дисперсионный анализ по одному признаку. Результаты.

Компонента дисперсии

(1)

Сумма квадратов

(2)

Степень свободы

(3)

Средний квадрат

(4)=(2)/(3)

Между выборками

8470,35

4

2117,59

Остаточная

76641,85

474

161,69

Полная

85112,2

478

-----

Значение критериальной статистики равно:

F = средний квадрат между выборками / остаточный средний квадрат = 2117,59 / 161,69 = 13,09

Сравним F и F>критич> : 13,092,37

Вывод. Следовательно, мы отвергаем гипотезу Н>0> ,то есть можно предположить, что при 5%-ном уровне значимости УК в крови больных СКВ зависит от степени тяжести поражения почек.

Мы не знаем, какое распределение имеют наши выборки. Описанный метод применяется , как это было описано в статистической модели, для нормальных совокупностей. В связи с этим будет правомочно применить непараметрический метод для выяснения равенства нескольких средних.

2. Непараметрический дисперсионный анализ по одному признаку с применением критерия Краскала-Уоллиса для нескольких независимых выборок

Для проверки совпадений нескольких средних часто применяется непараметрический критерий, свободный от распределения. Его можно использовать, когда рассматриваемые совокупности не являются нормально распределенными [7].

Статистическая модель

Имеется k совокупностей, в нашем случае 5 совокупностей. Каждая выборка извлекается из своей совокупности. Все наблюдения независимы.

Гипотезы

Н>0> : все k совокупностей одинаково распределены.

Н>1> : нулевая гипотеза не верна.

Критическая область

Верхняя 5%-ная область распределения 2>k>>-1. >В нашем случае 2>4> , что соответствует значению критерия , превышающему 9,49. Данное число взято из Таблицы А.2 на стр. 331 "Справочника по вычислительным методам статистики" Дж. Полларда. [6]

Вычисление значения критериальной статистики

Для этого наблюдения x>ij> заменяются их рангами r>ij> .Все n наблюдений упорядоченны по возрастанию от 1 до n. Находим сумму рангов R>1>, R>2>,…, R>k> для k групп. Вычисляем критерий [4]:

H= ( R2>1>/n>1 >+….+ R2>k>/n>k> ) – 3 ( N + 1 )

Значения комплемента упорядочены по возрастанию. Они иногда совпадают, тогда ранг принимает среднее значение.

Далее, используя Таблицу №1, присваиваем каждому значению комплемента соответствующий ранг в данных пяти выборках и получаем сумму рангов [5] .

Таблица №3. Таблица рангов наблюдений.

Нет

нефрита

Выборка объема n>1> = 210

Слабый

нефрит

Выборка объема

n>2> = 101

Средний

нефрит

Выборка объема

n>3> = 98

Нефротический синдром

Выборка объема

n>4> = 45

Почечная недостаточность

Выборка объема

n>5> = 25

УК

Ранг

УК

Ранг

УК

Ранг

УК

Ранг

УК

Ранг

36

282

11

45

7

33

10

39

20

86

38

315,5

35

264

27

144,5

5

28,5

20

86

40

352,5

37

296,5

6

31,5

6

31,5

21

95,5

31

188,5

15

59,5

5

28,5

15

59,5

24

115

33

220

40

352,5

40

352,5

20

86

3

26

33,8

242

0

13

5

28,5

25

126,5

12

50

37

296,5

33

220

45

405,5

28

28

10

39

38

315,5

33

220

45

405,5

32

197,5

0

13

33

220

5

28,5

46

420,5

46

420,5

18,2

77

37

296,5

40

352,5

45

405,5

33

220

46

420,5

48

436,5

25

126,5

24

115

44

396,5

10

39

40

352,5

33

220

24

115

25

126,5

0

13

42

375,5

50

453,5

43

383

22,5

105,5

20

86

35

264

25

126,5

24,5

119,5

24,5

119,5

30,4

181,5

15

59,5

20

86

20,5

92

38

315,5

0

13

35

264

50

453,5

9

34

12

50

33,3

231

48

436,5

50

453,5

12

50

54,7

471

14,7

56

45

405,5

18

74,5

32

197,5

20,7

94

34,1

247

38

315,5

20

86

43

383

0

13

22,4

102,5

15

59,5

33

220

35,5

273,5

26,1

137,5

17,8

72

13

53

43

383

44

396,5

11

45

33,5

237

40

352,5

10

39

50

453,5

11,7

47

29,6

171

40

352,5

12

50

34

244,5

34,4

252,5

13,6

54,5

38

315,5

23

110

12

50

0

13

35

264

32,7

210

34

244,5

0

13

0

13

37

296,5

60

478

30

176,5

25,1

132,5

42

375,5

50

453,5

35

264

22,5

105,5

32,3

204

51

462,5

22

99,5

31

188,5

16

68

45

405,5

22,2

101

33

220

32,5

207

25

26,5

20

86

41,9

373

39,3

345,5

33

220

21

95,5

41,7

371

40,2

359

33

220

22

99,5

37,1

299

0

13

39

334

10

39

33,4

233

39,1

337

35,8

278,5

37,4

304,5

33

220

37,7

306,5

41,7

371

22,4

102,5

34,3

250

33,5

237

38,2

323

35

264

33

220

43,8

393,5

37,4

304,5

37,3

302,5

36,9

293

16

68

10

39

39,6

346

41

365

16

68

37,9

309,5

0

13

33

220

31

188,5

39,3

343,5

32,8

211

32,15

202

52

465

37,2

301

24

115

38,8

332

51

462,5

37,8

308

25

126,5

48,1

439

33,5

237

49,1

445

38

315,5

0

13

48

436,5

36,15

286

29

165

0

13

27

144,5

43,8

393,5

32

197,5

26,6

141

48

436,5

40

352,5

32

197,5

52,8

470

40

352,5

20

86

27

144,5

36

282

32,3

204

13,6

54,5

45

405,5

10

39

10

39

43,5

390,5

33,9

243

19,5

79

35

264

45,74

417

51,2

464

35

264

0

13

40,4

362,5

19,5

79

49,1

445

46,05

424

24,2

118

38

315,5

0

13

33

220

0

13

25,2

134

40,4

362,5

43,5

390,5

28

152,5

30

176,5

32,3

204

27

144,5

36

282

41

365

35

264

10

39

40

352,5

29

165

25

126,5

29,7

172

50

453,5

30

176,5

30

176,5

20

86

32

197,5

27,6

149

0

13

31

188,5

21,4

98

15,6

64,5

45

405,5

23

110

35

264

20

86

34,3

250

0

13

45

405,5

18

74,5

46

425

15

59,5

50,4

461

59,2

475

30,4

181,5

48,2

440,5

0

13

50

453,5

37,3

302,5

22,5

105,5

46

420,5

35

264

0

13

35

264

25

126,5

24

115

15

59,5

20

86

45

405,5

18

74,5

38

315,5

28,9

161,5

28

152,5

47,5

432,5

30,5

183

36,7

291

37,9

309,5

45,5

414

47,8

434

40,3

360,5

43

383

39,2

341

60

478

34,7

255,5

36,5

287

34,1

247

32,6

208,5

32

197,5

46,7

427,5

38,4

325

45,7

415,5

39

334

37,15

300

46,9

429

31,4

192

39

334

15,6

64,5

32

197,5

52,15

466

34,1

247

42

375,5

52,2

467,5

44,7

399

43,8

393,5

0

13

26,5

139,5

39,1

337

0

13

36,6

289

16

68

0

13

30,3

180

26,5

139,5

33

220

47

430,5

43

383

43

383

50

453,5

36,9

293

46,6

426

52,2

467,5

29,4

168,5

59,3

476

38,5

327

30,6

184

0

13

41

365

35,6

276

15,5

63

40

352,5

38,7

331

21,2

97

45

405,5

38,2

323

22,8

108

25,5

135

26,1

137,5

28,3

156

27,7

150

43,2

388

28,15

155

22,5

46

420,5

38,5

327

45

105,5

35,6

276

26

136

33

220

32,4

206

48,3

442

50

453,5

47,5

432,5

50

453,5

32

197,5

50

453,5

35,6

276

33,5

237

56,9

473

28,9

161,5

40

352,5

35,2

271

42,5

378

50

453,5

46,2

425

52,7

469

49,1

445

38

315,5

33,7

241

32,6

208,5

30

176,5

28,9

161,5

44,4

398

48,2

440,5

38,15

321

42

375,5

28,4

157

33,5

237

39,4

345

38,6

329,5

34,3

250

37,7

306,5

27,3

148

39,2

341

29,2

167

39,2

341

33,5

237

18

74,5

31,2

191

23,4

112

36,9

293

57,3

474

45

405,5

45,3

413

16,5

71

34,9

257

43,1

387

30,8

185,5

0

13

34,5

254

28

152,5

16

68

28,9

161,5

23

110

27

144,5

41,6

369

43,4

389

36

282

49

443

25

126,5

41,5

368

35,5

273,5

35

264

33,1

229

41,7

371

39,15

339

30,8

185,5

45,7

415,5

35,4

272

35,8

278,5

27

144,5

19,5

79

29,4

168,5

33,3

231

36,6

289

42,6

379

30

176,5

36,1

285

43

383

33,3

231

28,7

158,5

28,7

158,5

45,1

412

31,8

193

33

220

39,1

337

29

165

46,7

427,5

41,05

367

29,9

173

50

453,5

47

430,5

34,4

252,5

11

45

20,6

93

36,6

289

38,6

289

29,48

170

25

126,5

0

13

38

315,5

34,7

255,5

38,2

323

43,8

393,5

40,3

360,5

38,5

327

60

478

50

453,5

36

282

55

472

33,5

237

25,1

132,5

24,8

121

Всего:

R>1>=

57877

R>2>=

23298.5

R>3>=

21259.5

R>4>=

8789

R>5>=

3072

N = 479

k = 5

R>1> = 57877

n>1> = 210

R>2> = 23298,5

n>2> = 101

R>3> = 21259,5

n>3> = 98

R>4> = 8789

n>4> = 45

R>5> = 3072

n>5 >= 25

Теперь можно полученные суммы рангов подставить в формулу и получить значение критериальной статистики Краскела-Уоллиса [4] :

Н=23,03

Полученный результат не является незначимым, поэтому нельзя считать, что выборки извлечены из одинаково распределенных совокупностей и что средние значения совокупностей совпадают. Но этот вывод является приближенным, так как в нашей таблице есть много совпадающих значений. Для учета влияния связей можно воспользоваться модифицированной формой статистики Краскела-Уоллиса [4]:

Н` =

, где g – число групп совпадающих значений, Т>j>> >= (t - t), t– число совпадающих наблюдений в группе с номером j .

Таблица №4. Группы совпадающих наблюдений.

Повторяющиеся значения УК

Кол-во повторений t >j>

Значение T>j>

0

25

15600

5

4

60

6

2

6

10

9

720

11

3

24

12

5

120

13,6

2

6

15

6

210

15,6

2

6

16

5

120

18

4

60

19,5

3

24

20

11

1320

21

2

6

22

2

6

22,4

2

6

22,5

4

60

23

3

24

24

5

120

24,5

2

6

25

10

990

25,1

2

6

26,1

2

6

26,5

2

6

27

6

210

28

4

60

28,7

2

6

28,9

4

60

29

3

24

29,4

2

6

30

6

210

30,4

2

6

30,8

2

6

31

4

60

32

8

504

32,3

3

24

32,6

2

6

33

17

4896

33,3

3

24

33,5

7

336

34

2

6

34,1

3

24

34,3

3

24

34,4

2

6

34,7

2

6

35

13

2184

35,5

2

6

35,6

3

24

35,8

2

6

36

5

120

36,6

3

24

36,9

3

24

37

4

60

37,3

2

6

37,4

2

6

37,7

2

6

37,9

2

6

38

10

990

38,2

3

24

38,5

3

24

38,6

2

6

39

3

24

39,1

3

24

39,2

3

24

39,3

2

6

40

12

1716

40,3

2

6

40,4

2

6

41

3

24

41,7

3

24

42

4

60

43

7

336

43,5

2

6

43,8

4

60

44

2

6

45

12

1716

45,7

2

6

46

6

210

46,7

2

6

47

2

6

47,5

2

6

48

4

60

48,2

2

6

49,1

3

24

50

14

2730

51

2

6

52,2

2

6

60

3

24

g = 88

Теперь можно полученные результаты подставить в модифицированную формулу и получить уточненное значение критериальной статистики Краскела-Уоллиса :

Н` = 23,037

Вывод. Скорректированное значение Н` статистики Краскела-Уоллиса несущественно отличается от значения Н, т.о. мы можем отвергнуть гипотезу Н>0> на минимальном уровне значимости. Следовательно , мы подтвердили результат полученный ранее : существует зависимость между УК в крови больных СКВ и степенью тяжести поражения почек .

3. Непараметрический дисперсионный анализ по одному признаку с применением критерия Джонкхиера для нескольких выборок, упорядоченных по возрастанию влияния фактора

Нам заранее известно, что имеющиеся группы результатов упорядочены по возрастанию влияния фактора.. В нашем случае фактором является степень тяжести ГН. В таких случаях целесообразно использовать критерий Джонхиера , более чувствительный против альтернатив об упорядоченном влиянии фактора [5].

Статистическая модель

Имеется k совокупностей, в нашем случае 5 совокупностей. Каждая выборка извлекается из своей совокупности. Все наблюдения независимы. имеющиеся группы результатов упорядочены по возрастанию влияния фактора . 1-й столбец Таблицы №1 отвечает наименьшему уровню фактора, последний – наибольшему, а промежуточные столбцы получили номера, соответствующие их положению. В нашем случае фактором является степень тяжести поражения почек [4] .

Гипотезы

Н>0> :==…= ( влияние фактора упорядоченно.)

Н>1> :

Критическая область

Верхняя 5% область F-распределения, что в нашем случае соответствует значению критерия, превышающему значение 2,21. Данное число взято из таблицы А.4 на стр. 334 [6].

Вычисление значения критериальной статистики

Вычислим статистику Манна – Уитни. Сравниваем k способов обработки, в нашем случае 5. Поступим следующим образом : для каждой пары натуральных чисел u и v , где 1 u  v  k , составляем по выборкам с номерами u,v статистику Манна – Уитни [4].

U = , y)

Определим так же статистику Джонхиера как :

J =

Для нахождения значений статистики Манна – Уитни будем использовать программу,( так как мы имеем выборки большого объема) написанную на языке Fortran Power Station для Windows , версия 4.0 .Выбор данного языка программирования связан с тем, что он максимально приближен к общепринятому языку математических формул. [11].

implicit real*8 (a-h, o-z)

dimension a1(210), a2(101),a3(98),a4(45),a5(25)

open (unit=11, file='1.dat', access='sequential', status='old')

open (unit=12, file='2.dat', access='sequential', status='old')

open (unit=13, file='3.dat', access='sequential', status='old')

open (unit=14, file='4.dat', access='sequential', status='old')

open (unit=15, file='5.dat', access='sequential', status='old')

open (unit=16, file='res.dat',access='append',status='unknown')

do 2222 i=1,210

read (11, 21) a1(i)

21 format(e8.1)

2222 continue

do 2223 i=1,101

read (12, 21) a2(i)

2223 continue

do 2224 i=1,98

read (13, 21) a3(i)

2224 continue

do 2225 i=1,45

read (14, 21) a4(i)

2225 continue

do 2226 i=1,25

read (15, 21) a5(i)

2226 continue

u12=0

do 101 i=1,210

do 91 j=1,101

if (a1(i)<a2(j)) then

u12 = u12+1

elseif (a1(i).eq.a2(j)) then

u12= u12+0.5

else

u12= u12+0.0

endif

91 continue

101 continue

u13=0

do 102 i=1,210

do 92 j=1,98

if (a1(i)<a3(j)) then

u13 = u13+1

elseif (a1(i).eq.a3(j)) then

u13= u13+0.5

else

u13= u13+0.0

endif

92 continue

102 continue

u14=0

do 103 i=1,210

do 93 j=1,45

if (a1(i)<a4(j)) then

u14 = u14+1

elseif (a1(i).eq.a4(j)) then

u14= u14+0.5

else

u14= u14+0.0

endif

93 continue

103 continue

u15=0

do 104 i=1,210

do 94 j=1,25

if (a1(i)<a5(j)) then

u15 = u15+1

elseif (a1(i).eq.a5(j)) then

u15= u15+0.5

else

u15= u15+0.0

endif

94 continue

104 continue

u23=0

do 105 i=1,101

do 95 j=1,98

if (a2(i)<a3(j)) then

u23 = u23+1

elseif (a2(i).eq.a3(j)) then

u23= u23+0.5

else

u23= u23+0.0

endif

95 continue

105 continue

u24=0

do 106 i=1,101

do 96 j=1,45

if (a2(i)<a4(j)) then

u24 = u24+1

elseif (a2(i).eq.a4(j)) then

u24= u24+0.5

else

u24= u24+0.0

endif

96 continue

106 continue

u25=0

do 107 i=1,101

do 97 j=1,25

if (a2(i)<a5(j)) then

u25 = u25+1

elseif (a2(i).eq.a5(j)) then

u25= u25+0.5

else

u25= u25+0.0

endif

97 continue

107 continue

u34=0

do 108 i=1,98

do 98 j=1,45

if (a3(i)<a4(j)) then

u34 = u34+1

elseif (a3(i).eq.a4(j)) then

u34= u34+0.5

else

u34= u34+0.0

endif

98 continue

108 continue

u35=0

do 109 i=1,98

do 99 j=1,25

if (a3(i)<a5(j)) then

u35 = u35+1

elseif (a3(i).eq.a5(j)) then

u35= u35+0.5

else

u35= u35+0.0

endif

99 continue

109 continue

u45=0

do 110 i=1,45

do 100 j=1,25

if (a4(i)<a5(j)) then

u45 = u45+1

elseif (a4(i).eq.a5(j)) then

u45= u45+0.5

else

u45= u45+0.0

endif

100 continue

110 continue

U=u12+u13+u14+u15+u23+u24+u25+u34+u35+u45

22 format(2x,'u12=',f10.3)

23 format(2x,'u13=',f10.3)

24 format(2x,'u14=',f10.3)

25 format(2x,'u15=',f10.3)

26 format(2x,'u23=',f10.3)

27 format(2x,'u24=',f10.3)

28 format(2x,'u25=',f10.3)

29 format(2x,'u34=',f10.3)

30 format(2x,'u35=',f10.3)

31 format(2x,'u45=',f10.3)

32 format(2x,'U=',f10.3)

write(16,22)u12

write(16,23)u13

write(16,24)u14

write(16,25)u15

write(16,26)u23

write(16,27)u24

write(16,28)u25

write(16,29)u34

write(16,30)u35

write(16,31)u45

write(16,32)U

end

Обработав таким образом результаты наблюдений, получаем значения статистики Манна – Уитни:

u12= 8441,000

u13= 7793,500

u14= 3172,500

u15= 888,000

u23= 4637,500

u24= 1928,500

u25= 648,500

u34= 2054,500

u35= 805,500

u45= 411,000

Подставив в формулу полученные значения получаем результат для статистики Джонхиера:

J= 30780,5

Значение статистики Джонхиера очень велико, что свидетельствует в пользу гипотезы Н>1> об упорядоченном влиянии фактора , в нашем случае – зависимости УК в крови больных СКВ от степени поражения почек. То есть мы снова подтвердили результат, полученный ранее.

Но поскольку предложенные выборки велики, то можно проверить полученный результат, подсчитав приближенную статистику J* для большой выборки [4].

Вычислим величину:

J* = ( J – MJ ) /

Где MJ = ( N2 - ) , DJ = ( N2 ( 2N + 3 ) - ( 2n>j> + 3))

В результате вычислений мы получаем значение J* = 5,9.

Вывод. Полученный результат превышает критическое значение, что позволяет отклонить гипотезу Н>0>, и принять гипотезу Н>1. >Таким образом мы подтверждается результат, полученный с помощью статистики J – влияние фактора в предложенных выборках упорядоченно.

§4. Вывод

Целью данной курсовой работы был анализ зависимости между УК в крови больных СКВ и степенью тяжести поражения почек. Исходные данные были подвергнуты методам статистического анализа, независимым между собой. Результатом является доказательство наличия зависимости УК в крови больных СКВ и степенью тяжести поражения почек в каждом из использованных методов, что позволяет сформулировать окончательный вывод : УК в крови больных СКВ зависит от степени тяжести поражения почек, причем УК уменьшается с возрастанием степени тяжести поражения почек.

§5. Список литературы

    Гублер Е.В. Информатика в патологии, клинической медицине и педиатрии. –Л.: Медицина, 1990.-176с.

    Кузин Ф.А. Кандидатская диссертация . Методика написания, правила оформления и порядок защиты. Практическое пособие для аспирантов и соискателей ученой степени. –5-е изд., доп.-М.:Ось 89, 2000.-224с.

    Энциклопедический словарь медицинских терминов: В 3-х томах. Около 60000 терминов.-М.: Советская энциклопедия, - Т.2. 1983.-448с.

    Тюрин Ю.Н. , Макаров А.А. Статистический анализ данных на компьютере .-М.: Инфра – М., 1982.-528с.

    Холлендер М., Вулф Д.А. Непараметрические методы статистики.-М.: Финансы и статистика., 1983.-518с.

    Поллард Дж. Справочник по вычислительным методам статистики.-М.: Финансы и статистика., 1982.-344с.

    Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей.-М.: Финансы и статистика,-Т.2. 1985.-488с.

    Шишкин В.И., Кудрявцева Г.В. Регуляторная роль функциональной системы "Комплемент – простагландиды – пентозофосфатный путь обмена углеводов" в патогенезе основных ревматологических заболеваний.-СПб.: НИИХ. 2002.-38с.

    Колмогоров А.Н. Теория вероятности и математическая статистика.-М.:Наука.,1986.-535с.

    Фишер Р.А. Статистические методы для исследователей.-М.:Госстатиздат.,1982.-344с.

    Фишер Ф.П., Суиндл Д.Ф. Системы программирования.-М.:Статистика.,1971.-606с.