Компьютерные данные: типы данных, обработка и управление
Реферат
по медицинской информатике
на тему: «Компьютерные данные: типы данных, обработка и управление»
План
1 Компьютерные данные: типы данных
Точность
Корректность
2. Система информационной обработки данных
Технические средства
Программное обеспечение
Вычислительная система
3. Введение данных
Интерфейс пользователя
Обработка данных
Представление данных.
4. Системы управления базами данных в медицине
Основные требования к базам данных и систем управление базами данных
Современные СУБД
Структурирование
Архитектура информационной системы, организованной с помощью БД
Основные шаги проектирования БД
Основные типы моделей данных
Иерархическая модель данных
Сетевая модель данных.
Реляционная модель данных.
5 Заключение: Порядок выполнения практической работы
Компьютерные данные: типы данных, обработка и управление
Выделяют четыре основных типа данных:
- целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови, которые наблюдают под микроскопом);
- действительные числа: некоторая измеренная переменная (напр. температура или давление крови);
- код: условное обозначение некоторой переменной (напр., боль);
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность — это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных
включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
Пользователь:
- введение данных;
- интерфейс пользователя;
- обработка данных программным обеспечением;
- представление данных.
Введение данных
Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя. Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
Различают два основных типа интерфейсов пользователя:
символьные;
графические интерфейсы.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанные в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных. Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных. Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
4. Системы управления базами данных в медицине
Основные идеи, которые лежат в основе концепции базы данных:
- Изолировать любую прикладную программу от влияния изменений в других программах через общие данные путем размежевания логических записей, которые используются прикладными программами, от записей, которые физически запоминаются на магнитных носителях.
- Устранить чрезмерное дублирование данных.
- Централизовать управления данными.
Итак, суть концепции баз данных состоит в интегрированном сохранении и дифференцированном использовании прикладными программами всей информации об объектах предметной области, которые представляют определенный интерес для организации.
Все данные размещаются в едином хранилище. Пользователи автоматизированных информационных систем (АИС) имеют возможность обращаться к любым данным, которые их интересуют. Одни и те же данные могут быть в разных комбинациях и по-разному представленные соответственно потребностям пользователей (прикладных программ). Это обеспечивается за счет системы управление базами данных (СУБД).
БД – это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области. Синоним термина «база данных» – «банк данных».
Под предметной областью (Про) принят понимать часть реального мира, который подлежит изучению для организации управления, например, предприятие, ВНЗ и т.п..
БД может быть основана на одной модели или на совокупности нескольких моделей. Любую модель данных можно рассматривать как объект, который характеризуется своими свойствами (параметрами), и над ней, как над объектом, можно производить какие-либо действия.
СУБД называется совокупность языковых и программных средств, предназначенных для создания, управления и совместного использования БД многими пользователями.
Основные требования к базам данных и систем управление базами данных:
- Возможность представления адекватных реальной предметной области структур данных (построение адекватной информационной модели предметной области).
- Простота и малые затраты ресурсов на развитие системы (быстрая и дешевая модификация старых и разработка новых программных приложений в рамках автоматизированной информационной системы).
- Простота и оперативность доступа к данным, возможность поиска информации разными методами.
- Возможность одновременного эффективного обслуживания большого количества пользователей.
- Возможность использования в распределенных вычислительных сетях компьютеров.
- Обеспечение режима разграниченного доступа к данным и программам, исключение возможности их несанкционированного применения.
- Обеспечение представления данных пользователям в удобном виде для их дальнейшего применения.
- Обеспечение необходимой скорости решения задач при ограниченных затратах ресурсов компьютеров.
- Обеспечение защиты информации в БД от сбоев и отказов в работе технических средств и ошибок пользователей.
Основными преимуществами относительно применения БД и СУБД во время реализации на их основе автоматизированных поисково-информационных систем есть:
- Сокращение лишней чрезмерности данных, которые сохраняются. Данные, которые используются несколькими программами, интегрируются и сохраняются в одном месте. Чрезмерность данных есть, но она минимальная и необходимая только для обеспечения взаимосвязи разных данных определенной предметной области.
- Устраняется противоречивость данных, что может возникать, если одни и те же данные, которые используются разными программами, подаются несколько раз и если в случае необходимости их изменения не все копии восстановлены.
- Данные, которые сохраняются, используются совместно. Это предоставляет возможность разрабатывать новые программные приложения над уже существующей базой данных с минимальными затратами.
- Обеспечивается более простое, быстрое и дешевое развитие автоматизированных систем за счет обеспечения логической взаимной независимости программ и данных в БД.
- Упрощается поддержка целостности данных (адекватности и согласованности).
- Обеспечивается возможность быстрого предоставления данных на нестандартные (заранее непредвиденные) запросы пользователей без дополнительной разработки прикладных программ.
- Создается возможность комплексной автоматизации параметров АИС, возможное благодаря централизованному управлению базой данных.
- В случае централизованного управления базой данных упрощается стандартизация и унификация представления данных в АИС.
Основными недостатками, с которыми могут встретиться пользователи и разработчики программного обеспечения во время применения БД и СУБД, есть:
- дополнительные затраты аппаратных ресурсов (например памяти) во время размещения и работы СУБД;
- дополнительные затраты на установление и поддержку СУБД в рабочем состоянии;
- необходимость квалифицированного персонала для централизованного управления базой данных (администрации БД), а и также дополнительные затраты.
Современные СУБД могут поддерживать:
- разные типы представления данных и операции над ними (в том числе фактографических, документальных, картографических данных);
- естественное и эффективное представление в БД разных отношений между объектами (например, визуализация данных, которые характеризуются параметрами пространства и времени);
- проверку данных на непротиворечивость;
- дедуктивный вывод (дедуктивные БД);
- управление распределенными БД и интеграцию неоднородных БД;
- централизацию и интеграцию данных в сетях ПК.
Создавая базу данных, пользователь стремится привести в порядок информацию о разных признаках объектов и быстро получить выборку данных с произвольным соединением признаков. Сделать это возможно только если данные структурированные.
Структурирование - это введения соглашений о способах представления данных. Неструктурированными называют данные, записанные, например, в текстовом файле.
Архитектура информационной системы, организованной с помощью БД
Эффективность функционирования информационной системы во многом зависит от ее архитектуры. В настоящее время перспективной является архитектура клиент-сервер. В достаточно распространенном варианте она предполагает наличие компьютерной сети и распределенной базы данных, включающей БД корпоративную (БДК) и БД персональные (БДП). БДК размещается на компьютере-сервере, БДП размещаются на компьютерах сотрудников подразделений, являющихся клиентами корпоративной БД.
Сервером определенного ресурса в компьютерной сети называется компьютер (программа), управляющий этим ресурсом, клиентом — компьютер (программа), использующий этот ресурс.
В качестве ресурса компьютерной сети могут выступать, к примеру, базы данных, файловые системы, службы печати, почтовые службы. Тип сервера определяется видом ресурса, которым он управляет. Например, если управляемым ресурсом является база данных, то соответствующий сервер называется сервером базы данных.
Достоинством организации информационной системы по архитектуре клиент-сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей корпоративной информации с индивидуальной работой над персональной информацией. Структура распределенной БД, построенной по архитектуре клиент-сервер, показана на рис.
Корпоративная БД создается, поддерживается и функционирует под управлением сервера БД.
Для создания и управления функционированием персональных БД и приложений, работающих с ними, используются СУБД такие, например, как Microsoft Ассеss под ОС Windows, OpenOffice.org. Base под ОС Linux.
В зависимости от размеров организации и особенностей решаемых задач информационная система может иметь одну из следующих конфигураций:
• компьютер-сервер, содержащий корпоративную и персональные базы;
• компьютер-сервер и персональные компьютеры с БДП;
• несколько компьютеров-серверов и персональных компьютеров с БДП.
Использование архитектуры клиент-сервер дает возможность постепенного наращивания информационной системы предприятия, во-первых, по мере развития предприятия; во-вторых, по мере развития самой информационной системы.
Разделение общей БД на корпоративную БД и персональные БД позволяет уменьшить сложность проектирования БД по сравнению с централизованным вариантом, а значит, снизить вероятность ошибок при проектировании и стоимость проектирования.
Важнейшим достоинством применения БД в информационных системах является обеспечение независимости данных от прикладных программ. Это позволяет не обременять пользователей проблемами представления данных на физическом уровне: размещения данных в памяти, методов доступа к ним и т. д.
Такая независимость достигается поддерживаемым СУБД многоуровневым представлением данных в БД на логическом (пользовательском) и физическом уровнях. Иными словами, благодаря СУБД и наличию логического уровня представления данных обеспечивается отделение концептуальной (понятийной) модели БД от ее физического представления в памяти ЭВМ.
Основные шаги проектирования БД:
- Определить информационные потребности БД;
- Проанализировать объекты, которые нужно промоделировать в БД.
Основные типы моделей данных
Ядром любой базы данных есть модель данных. Модель данных представляет собой великое множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представленные объекты предметной области, взаимосвязи между ними. Модель данных - это совокупность структур данных и операций их обработки. Современная СУБД базируется на использовании иерархической, сетевой, реляционной и объектно-ориентированной моделях данных, комбинации этих моделей или на некотором их подмножестве.
Рассмотрим три основных типа моделей данных: иерархическую, сетевую, реляционнную и объектно-ориентированную.
Иерархическая модель данных. Иерархическая структура представляет совокупность элементов, связанных между собою по определенным правилам. Объекты, связанные иерархическими отношениями, образовывают ориентированный граф (перевернутое дерево), пример которого надається на рис.2. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Иерархическую модель организовывает данные в виде древовидной структуры. Узел - это совокупность атрибутов данных, которые описывают некоторый объект. На схеме иерархического дерева узлы имеют вид вершин графа. Каждый узел на более низком уровне связан только с одним узлом, который находится на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), которая не подчинена никакой другой вершине. Зависимые (подчиненные) узлы находятся на втором, третьем и других уровнях. Количество деревьев в базе данных определяется числом корневых записей.
Сетевая модель данных
Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.
Реляционнаяна модель данных. Понятие реляционный (англ. relation - отношение) связан с разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. Эти модели характеризуются простотой структуры данных, удобной для пользователя формой представления в виде таблиц и возможностью использования аппарата алгебры отношений и реляционнного вычисления для обработки данных.
На языке математики отношение определяется таким образом. Пусть задано n множеств D1,D2, ...,Dn. Тогда R есть отношение над этими множествами, если R есть множеством упорядоченных наборов вида <d1,d2,...,dn>, где d1 - элемент с D1 , d2 - элемент с D2 , ... , dn - элемент с Dn. При этом наборы вида <d1,d2,...,dn> называются кортежами, а множества D1,D2, ...Dn - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов.
Итак, реляционнная модель ориентирована на организацию данных в виде двумерных таблиц, любая из которых имеет следующие свойства:
- каждый элемент таблицы - это один элемент данных;
- все столбцы в таблицы - однородные, т.е все элементы в столбце имеют одинаковый тип (символьный, числовой и т.п.);
- каждый столбец носит уникальное имя;
- одинаковые строки в таблицы отсутствуют.
Таблицы имеют строки, которые отвечают записям (или кортежам), а столбцы -атрибутам отношений (доменам, полям).
Следующие термины являются эквивалентными:
отношение, таблица, файл (для локальных БД);
кортеж, строка, запись;
атрибут, столбик, поле.
Объектно-ориентированные БД объединяют в себе две модели данных, реляционную и сетевую, и используются для создания крупных БД со сложными структурами данных.
Реляционная БД есть совокупностью отношений, которые содержат всю необходимую информацию и объединенную разными связями.
БД считается нормализованной, если выполняются следующие условия:
- каждая таблица имеет главный ключ;
- все поля каждой таблицы зависят только от главного ключа;
- в таблицах отсутствуют группы повторных значений.
Для успешной работы с многотабличными БД, как правило, надо установить между ними связи. При этом пользуются терминамими “базовая таблица» (главная) и “подчиненная таблица». Связь между таблицами получается благодаря двух полей, одно из которых находится в базовой таблице, а второе - в подчиненной. Эти поля могут иметь значение, которое повторяются. Если значение в связанном поле записи базовой таблицы и в поле подчиненной совпадают, то эти записи называются связанными.
Существуют четыре типа отношений между таблицами: один к одному, один ко многим, много к одному, много ко многим.
Отношение один к одному означает, что каждая запись в одной таблице соответствует только одной записи в другой таблице.
Отношение один ко многим означает, что одна запись из первой таблицы может быть связана более чем с одной записью из другой таблицы.
Главная таблица – это таблица, которая содержит первичный ключ и составляет часть один в отношении один ко многим.
Внешний ключ – это поле, содержащее такой же тип информации в таблице со стороны много.
Практическая работа
Порядок выполнения:
1. Выполните запуск OpenOfficeBase следующим образом :
ПУСК – ПРОГРАММЫ –OpenOffice.org.2.0.3– OpenOfficeBase
2. После запуска программы на экране откроется окно Мастер базы данных, в котором необходимо выбрать команду – Создать базу данных – Готово. В следующем окне необходимо сохранить файл базы данных. Файл базы данных сохранить на диске в папке Houme под именем «своя фамилия».
Таким образом, создается пустая база данных, в которую в последствии можно поместить таблицы, формы, запросы, отчеты.
3. В режиме “Дизайна” создать три таблицы для Вашей базы данных:
Таблица1 – «Пациент» содержит следующие поля:
Код_амбул_карты - ключ (тип данных – Целое [INTEGER]);
Фамилия – (тип данных - текст [VARCHAR]
Имя– (тип данных - текст [VARCHAR]
Отчество– (тип данных - текст [VARCHAR]
Дата_рождения - (тип данных – дата [DATE]);
Адрес - (тип данных - текст [VARCHAR]
Таблица2 – «Диагноз» содержит следующие поля:
Код_амбул_карты - (тип данных – Целое [INTEGER]);
Код_диагноза – ключ (тип данных –Целое [INTEGER]);
Диагноз– (тип данных - текст [VARCHAR];
Таблица3 – «Лечение» содержит следующие поля:
Код_диагноза – (тип данных –Целое [INTEGER]);
Код_препарата ключ (тип данных –Целое [INTEGER]);
Препарат– (тип данных - текст [VARCHAR];
4. При описании поля – Дата_рождения - задать маску ввода.
5. Установить связи между таблицами:
-между таблицей «Пациент» и таблицей «Диагноз» - по полю Код_амбул_карты (один к одному);
- между таблицей «Диагноз» и таблицей «Лечение» – по полю Код_диагноза (один ко многим);
6. Заполнить базу данных: в таблицах записей не менее 10.
7. Cоздать форму с помощью мастера, в качестве источника выберите одну или несколько связанных между собой таблиц. Аналогично, создайте форму в режиме «Дизайна» связав между собой все три связанные таблицы.
8. Создайте два запроса 1) с помощью Мастера; 2) с помощью Дизайна.
Литература
Быкадоров Ю.А. Информатика и ИКТ
Гейн А.Г., Сенокосов А.И., Юнерман Н.А. Информатика и информационные технологии
Макарова Н.В., Волкова И.В., Николайчук Г.С и др. под ред. Макаровой Н.В. Информатика
Семакин И.Г., Залогова Л.А., Русаков С.В. и др. Информатика и ИКТ
Горячев А.В. Информатика и ИКТ
Горячев А.В., Суворова Н.И. Информатика
Матвеева Н.В., Челак Е.Н., Конопатова Н.К. и др. Информатика и ИКТ
Семенов А.Л., Рудченко Т.А. Информатика