Выдержка из текста работы
Информационные системы предназначены для хранения и обработки больших объемов информации. Изначально такие системы существовали в письменном виде. Любая информационная система должна выполнять три основные функции: ввод данных, запросы по данным, составление отчетов.
Модель данных — это совокупность структур данных и операций их обработки. К числу классических относятся следующие модели данных:
иерархическая,
сетевая,
реляционная.
Иерархическая модель.В иерархической модели связи между данными можно описать с помощью упорядоченного графа (или дерева). Упрощенно представление связей между данными в иерархической модели показано на рис. 1.
К основным понятиям иерархической структуры относятся уровень, узел и связь.
Узел – это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину, не подчиненную никакой другой вершине и находящуюся на самом верхнем – первом уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т. д. уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи базы данных существует только один иерархический путь от корневой записи.
Рис.1. Представление связей в иерархической модели
Корневым называется тип, который имеет подчиненные типы и сам не является подтипом. Подчиненныйтип (подтип) является потомком по отношению к типу, который выступает для него в роли предка (родителя). Потомки одного и того же типа являются близнецамипо отношению друг к другу.
В сетевой структуре при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом, обобщая тем самым иерархическую модель данных рис. 2.
Рис. 2. Представление связей в сетевой модели
Сетевая БД состоит из набора записей и набора соответствующих связей. На формирование связи особых ограничений не накладывается. Если в иерархических структурах запись-потомок могла иметь только одну запись-предка, то в сетевой модели данных запись-потомок может иметь произвольное число записей-предков (сводных родителей).
Реляционная модель данных объекты и связи между ними представляет в виде таблиц, при этом связи тоже рассматриваются как объекты. Все строки, составляющие таблицу в реляционной базе данных, должны иметь первичный ключ. Все современные средства СУБД поддерживают реляционную модель данных.
Эта модель характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
1. Каждый элемент таблицы соответствует одному элементу данных.
2. Все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип и длину.
3. Каждый столбец имеет уникальное имя.
4. Одинаковые строки в таблице отсутствуют;
5. Порядок следования строк и столбцов может быть произвольным.
Общие понятия о базах данных
База данных – это реализованная с помощью компьютера информационная структура (модель), отражающая состояние объектов и их отношения.
Поскольку основу любой базы данных составляет информационная структура, базы данных делят на три рассмотренные выше типа: табличные (реляционные), сетевые, иерархические.
Опыт использования баз данных позволяет выделить общий набор их рабочих характеристик:
· полнота: чем полнее база данных, тем вероятнее, что она содержит нужную информацию (однако, не должно быть избыточной информации);
· правильная организация: чем лучше структурирована база данных, тем легче в ней найти необходимые сведения;
· актуальность: любая база данных может быть точной и полной, если она постоянно обновляется, т. е. необходимо, чтобы база данных в каждый момент времени полностью соответствовала состоянию отображаемого ею объекта;
· удобство для использования: база данных должна быть проста и удобна в использовании, иметь развитые методы доступа к любой части информации.
Иерархические и сетевые базы данных являются гораздо менее распространенными, чем реляционные и не могут быть реализованы с помощью наиболее популярных СУБД, входящих в состав программного обеспечения ЭВМ.
Реляционная модель базы данных
Реляционная модель данных (РМД), или табличная база данных содержит перечень объектов одного типа, то есть имеющих одинаковый набор свойств. Такую базу данных представляют в виде двумерной таблицы: в каждой ее строке последовательно размещаются значения свойств одного из объектов. Каждое значение свойства – в своем столбце, озаглавленном именем свойства.
Таблица – упорядоченная структура, состоящая из конечного набора однотипных записей.
Поле базы данных – это столбец таблицы, содержащий значения определенного свойства.
Запись базы данных – это строка таблицы, содержащая набор значений свойств, размещенный в полях базы данных.
Первичный ключ – поле или группа полей, позволяющие, однозначным образом, определить каждую строку в таблице. Первичный ключ должен обладать двумя свойствами:
1. Однозначная идентификация записи: запись должна однозначно определяться значением ключа.
2. Отсутствие избыточности: никакое поле нельзя удалить из ключа, не нарушая при этом свойства однозначной идентификации.
Кроме первичного, могут использоваться так называемые простые (или вторичные) ключи таблицы. Простых ключей может быть множество. Они используются при упорядочивании (индексировании) таблиц.
5.4. Основные понятия систем управления базами данных
и банками знаний
База данных предполагает наличие комплекса программных средств, обслуживающих эту базу данных и позволяющих использовать содержащуюся в ней информацию. Такие комплексы программ называют СУБД.
СУБД– это программная система, поддерживающая наполнение и манипулирование данными, представляющими интерес для пользователей при решении прикладных задач. Иными словами, СУБД является интерфейсом между базой данных и прикладными задачами.
По технологии обработки данных базы данных подразделяются на централизованные и распределенные.
Централизованная база данных хранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования баз данных часто применяют в локальных сетях ПК.
Распределенная база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
По способу доступа к данным базы данных разделяются на базы данных с локальным доступом и базы данных с удаленным доступом.
Системы централизованных баз данных с сетевым доступом предполагают различные архитектуры подобных систем;
· файл-сервер;
· клиент-сервер.
Файл-сервер. Архитектура систем БД с сетевым доступом предполагает выделение одной из машин сети в качестве центрального сервера файлов. На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы базы данных в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производится обработка. При большой интенсивности доступа к одним и тем же данным производительность информационной системы падает. Пользователи могут создавать также на рабочих станциях локальные БД, которые используются ими монопольно.
Клиент-сервер. В этой концепции подразумевается, что помимо хранения централизованной базы данных центральная машина (сервер базы данных) должна обеспечивать выполнение основного объема обработки данных. Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сервере. Извлеченные данные, но не файлы транспортируются по сети от сервера к клиенту. Спецификой архитектуры клиент-сервер является использование языка запросов SQL.
По степени универсальности различают два класса СУБД:
· системы общего назначения;
· специализированные системы.
СУБД общего назначения не ориентированы на какую-либо предметную область или на информационные потребности какой-либо группы пользователей. Использование СУБД общего назначения в качестве инструментального средства для создания автоматизированных информационных систем, основанных на технологии баз данных, позволяет существенно сокращать сроки разработки и экономить трудовые ресурсы. Этим СУБД присущи развитые функциональные возможности и определенная функциональная избыточность.
Специализированные СУБД создаются в редких случаях при невозможности или нецелесообразности использования СУБД общего назначения.
Основные операции с данными в СУБД
Входящие в состав современных СУБД средства совместно выполняют следующие функции:
· описание данных, их структуры
· первичный ввод, пополнение информации в базе данных;
· удаление устаревшей информации из базы данных;
· корректировку данных для поддержания их актуальности;
· упорядочение (сортировку) данных по некоторым признакам;
· поиск информации по некоторым признакам;
· подготовку и генерацию отчетов;
· отбор данных;
· вывод на печать;
· защиту информации и разграничение доступа пользователей к ней;
· резервное сохранение и восстановление базы данных, которое позволяет восстановить утраченную при сбоях и авариях аппаратуры информацию базы данных, а также накопить статистику работы пользователей с базой данных;
· защиту от необдуманных действий, предупреждающую пользователя и предотвращающую потерю информации в случае поспешных или ошибочных команд;
Объекты баз данных
К основным объектам относятся таблицы, запросы, формы, отчеты, макросы и модули.
Таблица – это объект, который определяется и используется для хранения данных. Каждая таблица включает информацию об объекте определенного типа. Как уже известно, таблица содержит поля (столбцы) и записи (строки).
Запрос– это объект, который позволяет пользователю получить нужные данные из одной или нескольких таблиц. Главное предназначение запросов – отбор данных на основании заданных условий.
Форма – предназначена для удобного вывода отображения данных, это всего лишь формат (бланк) показа данных на экране компьютера. Формы могут строиться только на основе таблиц или запросов. В форму могут быть внедрены рисунки, диаграммы, аудио (звук) и видео (изображение). Формы используются для просмотра и редактирования данных.
Отчет – это объект, предназначенный для печати данных, содержащихся в таблицах и запросах в красиво оформленном виде.
Макрос – служат для автоматизации повторяющихся операций.
Модуль– объект, содержащий программы, которые позволяют разбить процесс на более мелкие действия и обнаружить те ошибки, которые невозможно было бы найти с использованием макросов.
Искусственный интеллект
Научной задачей искусственного интеллекта (ИИ) является воссоздание (имитация) с помощью искусственных устройств разумных рассуждений и действий человека. Исследования в области искусственного интеллекта ведутся по двум направлениям:
1) бионическое – попытки смоделировать с помощью искусственных систем психофизиологическую деятельность человеческого мозга с целью создания искусственного разума;
2) прагматическое – создание программ, позволяющих с использованием ЭВМ воспроизводить не саму мыслительную деятельность, а являющиеся ее результатами процессы. Здесь достигнуты важнейшие результаты, имеющие практическую ценность.
Системы искусственного интеллекта (СИИ) основаны на знаниях. В отличие от данных, знания обладают следующими свойствами:
· внутренняя интерпретируемость: вместе с информацией в базе знаний представлены информационные структуры, позволяющие не только хранить знания, но и использовать их;
· структурированность: выполняются декомпозиция сложных объектов на более простые и установление связи между ними;
· связанность: отражаются закономерности относительно фактов, процессов, явлений и причинно-следственные отношения между ними;
· активность:на основе имеющихся знаний можно выводить (получать) новые знания. Эти свойства знаний должны обеспечивать возможность СИИ, моделировать рассуждения человека при решении прикладных задач. Со знаниями тесно связано понятие процедуры получения решения задач (стратегии обработки знаний). В системах обработки знаний такую процедуру называют механизмом вывода, механизмом рассужденийили логическим выводом.
Базы знаний
База знаний в информатике и исследованиях искусственного интеллекта – это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью.
База знаний – важный компонент интеллектуальной системы. Наиболее известный класс таких программ – это экспертные системы.
Простые базы знаний могут использоваться для создания экспертных систем хранения данных в организации: документации, руководств, статей технического обеспечения.
Двумя наиболее важными требованиями к информации, хранящейся в базе знаний интеллектуальной системы, являются:
1. достоверностьконкретных и обобщённых сведений, имеющихся в базе данных;
2. релевантностьинформации, получаемой с помощью правил вывода базы знаний(релевантность в информационном поиске – семантическое соответствие поискового запроса и поискового образа документа).
Экспертные системы
Систему искусственного интеллекта, построенную на основе глубоких специальных знаний о некоторой предметной области (полученных от экспертов-специалистов этой области), называют экспертной системой. Они предназначены для поиска способов решения проблем из некоторой предметной области, основываясь на записях БЗ и на пользовательском описании ситуации. Экспертные системы предназначены для поиска способов решения проблем из некоторой предметной области, основываясь на записях БЗ и на пользовательском описании ситуации.
Существуют экспертные системы по военному делу, геологии, инженерному делу, информатике, космической технике, математике, медицине, метеорологии, промышленности, сельскому хозяйству, управлению, физике, химии, электронике, юриспруденции и т.д.
Особенности экспертных систем:
· компетентность – в конкретной предметной области экспертная система должна достигать того же уровня, что и специалисты-люди; при этом она должна пользоваться теми же эвристическими приемами, также глубоко и широко отражать предметную область;
· символьные рассуждения –знания, на которых основана экспертная система, представляют в символьном виде понятия реального мира, рассуждения также происходят в виде преобразовании символьных наборов;
· глубина – экспертиза должна решать серьезные, нетривиальные задачи, отличающиеся сложностью знаний, которые экспертная система использует, или обилием информации; это не позволяет использовать полный перебор вариантов как метод решения задачи и заставляет прибегать к эвристическим, творческим, неформальным методам;
· самосознание– экспертная система должна включать в себя механизм объяснения того, каким образом она приходит к решению задачи.
Экспертные системы создаются для решения разного рода проблем, но они имеют схожую структуру рис. 3.
Рис. 3. Схема обобщенной экспертной системы