Информатика (работа 7)

      Базы данных (БД) составляют в настоящее время основу компьютерного обеспечения информационных процессов, входящих практически во все сферы человеческой деятельности.

Действительно, процессы обработки информации имеют общую природу и опираются на описание фрагментов реальности, выраженное в виде совокупности взаимосвязанных данных. БД являются эффективным средством представления структур данных и манипулирования ими.

      БД должна поддерживаться в среде ЭВМ единым программным обеспечением, называемым системой управления базами данных (СУБД).

Одно из основных назначений СУБД – поддержка программными средствами представления, адекватного реальности.

      Для ввода в ЭВМ полученное описание должно быть представлено в терминах специального языка описания данных (ЯОД), который входит в комплекс средств СУБД.

      Интерфейс определяет переход от представления данных в БД к представлению, принятому среди пользователей, и обратно. В общем случае пользователи представляют данные в виде документов различных видов, от произвольных текстов до справок и таблиц фиксированного формата.

3.1 Работы ISO после завершения в 1989 г. разработки международного стандарта языка БД SQL

в основном осуществлялись в двух направлениях:

    развитие концепции распределенной обработки в открытых системах, что для СУБД влечет разработку концепции распределенной обработки транзакций и доступа к удаленной БД в сети ЭВМ;

    определение концепций и системы интерфейсов для словарной системы информационных ресурсов предприятия или организации.

Классификация по реализуемым функциям позволяет выделить 4 слоя услуг управления данными: базисный, баз данных, инструментальный и обслуживания запросов пользователя.

      Концепция SAA вытекает из практических требований обеспечения мобильности прикладных программ для ЭВМ фирмы IBM, имеющих различную архитектуру – от PS/2 до IBM старших моделей, и для различных операционных сред этих ЭВМ – OS/2, MVS/XA, VM/SP. При этом также должна обеспечиваться совместимость как для средств взаимодействия конечного пользователя с различными моделями ЭВМ, так и для средств соединения этих ЭВМ в вычислительную сеть.

      На данном этапе анализируются запросы пользователей, выбираются информационные объекты и их характеристики и на основе проведенного анализа структурируется предметная область.

5.2 Выявление информационных объектов и связей между ними.

Следующая фаза анализа предметной области состоит в выборе информационных объектов, задании необходимых свойств для каждого объекта, выявлении связей между объектами, определении ограничений, накладываемых на информационные объекты, типы связей между ними, характеристики информационных объектов.

      Построение информационной структуры.

Для построения концептуальной схемы используют традиционные методы агрегации и обобщения. При агрегации объединяются информационные объекты в один в соответствии с семантическими связями между объектами. При обобщении информационные объекты объединяются в родовой объект.

      Проектирование информационной структуры для системы БД.

Задача построения системы БД возникает, если:

    различные приложения требуют некоторого количества общих информационных объектов, однако все информационные объекты и все связи между этими объектами физически не могут быть реализованы в одной БД;

    информационные объекты имеют общие связи, отношения, общие типы атрибутов.

6.1 Проектирование текстовых БД.

Объектами хранения в текстовых БД являются тексты. Под текстом будут пониматься неструктурированные данные, построенные из строк.

Проектирование текстовой БД представляется следующим перечнем вопросов:

    Анализ информационных интересов пользователей к данной предметной области.

    Определение источников формирования БД.

    Выбор архитектуры БД.

    Разработка языка описания документов.

6.2 Технологию комплектования новой БД можно разделить на три этапа: отбор, конвертирование, редактирование.

6.3 Требования к информационно – поисковым языкам (ИПЯ):

    Селективная мощность, характеризующая возможность выбора документов по различным критериям.

    Производительность языка, характеризующая темп написания запросов и число совершаемых ошибок.

    Простота изучения.

    Многоуровневость языка. Минимальный уровень хорошо понимается пользователем, и его бывает достаточно для описания большинства документов и запросов. Лишь формулировка сложных запросов и описание сложных документов требует привлечения всех выразительных средств языка, о существовании которых пользователь и не подозревает.

    Открытость языка. Язык должен иметь возможность расширения и модификации.

    Возможность явного выражения смысловых отношений между терминами, отсутствием многозначности.

7.1 Выбор системы управления БД.

Основной задачей логического проектирования является разработка логической схемы.

Логическое проектирование состоит из следующих этапов:

    Выбор конкретной СУБД.

    Отображение концептуальной схемы на логическую схему.

    Выбор ключей.

    Описание языка запросов.

      Эту СУБД отличало простота использования в сочетании с широкими возможностями по разработке законченных приложений. СУБД позволяет задать типы данных и способы их хранения. Вы также можете задать критерии, которые СУБД будет в дальнейшем использовать для обеспечения правильности ввода данных. ACCESS предоставляет максимальную свободу в задании типа данных (текст, числовые данные, даты и др.).

ACCESS спроектирован таким образом, что он может быть использован как в качестве самостоятельной СУБД на отдельной рабочей станции, так и в сети в режиме “клиент – сервер”.

ACCESS предоставляет дополнительные средства разработки приложений, которые могут работать не только с собственными форматами данных, но и с форматами других наиболее распространенных СУБД.

      Архитектура Microsoft ACCESS.

Microsoft ACCESS называет объектами все, что может иметь имя (в смысле ACCESS). В базе данных ACCESS основными объектами являются таблицы(хранимые данные), запросы(просмотр данных), формы, отчеты, макросы и модули(функции, подпрограммы).

      База данных.

База данных ACCESS представляет собой несколько таблиц, между которыми некоторым образом распределены данные. Для хранения БД ACCESS используется один файл. Этот файл содержит все объекты БД (запросы, отчеты, формы и т.д.). Такой подход упрощает решение проблем с хранением объектов и исключает использование специальных мер при копировании, удалении и других операций над семейством таблицы и БД в целом.

      Типы данных.

Для каждого поля таблицы вы должны выбрать один из доступных типов данных. При этом в каждом поле могут храниться данные только одного типа.

      Запрос по образцу.

Для выборки данных из одной или нескольких таблиц ACCESS используют “запрос по образцу”.

      Запросы и выборки.

Запросы используются для выбора из базы данных интересующей пользователя информации. Под выборкой мы будем понимать динамическую таблицу с записями данных, которые удовлетворяют определенным условиям запроса.

      Взаимодействие с внешними приложениями.

ACCESS позволяет осуществить экспорт и импорт данных из следующих приложений:

    Microsoft ACCESS (другая БД).

    Текст с разделителями.

    Текст с фиксированной шириной полей.

    Файлы данных составных документов Microsoft Word для Windows.

    Microsoft Excel (версии 2-х, 3.0, 4.0, 5.0).

    Lotus 1 – 2 – 3 или 1 – 2 – 3/W (файлы .WKSI .WK1).

    Paradox (файлы .DB версий 3.х и 4.х).

    FoxPro (файлы .DBF версий 2.0 и 2.5).

    dBase III и dBase IV (файлы .DBF).

    Btrieve (вместе с файлами описаний данных File.DDF и FileD.DDF).

    БД SQL с использованием драйверов ODBC.

Кроме того, предусмотрены специальные средства для переноса данных в Excel и Word для последующего анализа, включения в отчет или слияния с другими данными.

      Технические характеристики системы.

Приведенные ниже значения могут быть ограничены размерами основной и внешней памяти компьютера.

    Число записей файла БД до 1 млрд.

    Объем файла БД до 2 млрд. байт.

    Размер записи файла БД до 4000 байт в файле dbf. и до 512 килобайт в файле dbt.

    Количество полей в файле БД до 128

    Количество одновременно открытых файлов БД до 10.

    Количество одновременно открытых файлов всех типов до 15.

    Количество индексных файлов на 1 открытый файл БД до 7.

    Количество открытых файлов форматов на 1 активный файл БД – один.

    Точность чисел до 15 значащих цифр.

    Число временных переменных до 256.

    Размер памяти для временных переменных по умолчанию 6000 байт.

9.2 Типы файлов.

Система хранит информацию в виде дисковых файлов различных форматов. Каждый из них служит целям различной обработки данных.

Разновидность файла Расширение файла

Двоичный .bin

Каталог .cat

Файл БД .dbf

Страховые копии .bak

Файл примечаний .dbt

Страховые копии примечаний .tbk

Индекс .ndx

Программа или командный файл .prg

Файл формата экрана .fmt

Файл марок .lbl

Файл временных переменных .mem

Файл запроса .qry

Файл описания экрана .scr

Файл выборки .vue

Файл формы отчета .frm

Текстовый файл .txt

      Структура БД dBase III.

Структура файла БД формируется путем определения каждого поля в БД, что осуществляется посредством команд CREATE и MODIFY STRUCTURE. Определение поля состоит в задании следующих элементов:

    имя поля

    тип поля

    ширина поля.

9.4 Структура команд системы.

Структура команды называется ее синтаксисом. Каждая командная строка начинается с глагола, который является основой команды. Общий синтаксис команды выглядит так:

ГЛАГОЛ [<область>] [<список выражений>] [FOR <условие>]

[WHILE<условие>].

ГЛАГОЛ – это имя команды системы.

[] (квадратные скобки) означают, что элемент необязателен.

<> означают, что элемент вводит пользователь.

9.5 Операции.

Система предусматривает 4 типа операций:

    Математические операции

    Операции отношений

    Логические операции

    Строчные операции

10.1 LOTUS ORGANIZER – это персональная информационная система, которая полностью имитирует работу с обычной записной книжкой, содержащей такие разделы, как ежедневник, список дел, адресный справочник, сведения о датах, план мероприятий на год и блокнот.

Терминологический словарь.

    Предметной областью называется фрагмент реальности, который описывается или моделируется с помощью БД и ее приложений.

    Простое (элементарное) данное – это наименьшая семантически значимая поименованная единица данных (ФИО, АДРЕС и т.д.).

    Процесс построения концептуального описания с учетом всех необходимых факторов называется процессом проектирования БД.

    Под документом понимается произвольный структурированный текст, который может быть представлен на алфавитно-цифровых печатающих устройствах.

    Под конвертированием систем БД понимается процесс переноса данных из существующей БД во вновь создаваемую БД с последующим переносом прикладных программ в среду целевой СУБД для работы с созданной БД.

    Под сущностью понимают основное содержание того явления, процесса или объекта, о которых собирают информацию для БД.

    Сущность принято определять поименованными характеристиками, называемыми атрибутами

Все остальные термины использованы в тексте данной логической схемы.