Понятие информации, Информатика

Выдержка из текста работы

Существует множество определений и взглядов на понятие "информация". Известно такое определение: информация (от латинского informatio) — это сведения, сообщения о каком-либо событии, деятельности и т.д.

В самом общем смысле информация есть обозначение некоторой формы связей или зависимостей объектов, явлений, мыслительных процессов. Информация есть понятие, абстракция, относящееся к определенному классу закономерностей материального мира и его отражения в человеческом сознании. В зависимости от области, в которой ведется исследование, и от класса задач, для которых вводится понятие информации, исследователи подбирают для него различные определения.

Информация — это:

· данные, определенным образом организованные, имеющие смысл, значение и ценность для своего потребителя и необходимая для принятия им решений, а также для реализации других функций и действий;

· совокупность знаний о фактических данных и зависимостях между ними, являющихся одним из видов ресурсов, используемых человеком в трудовой деятельности и быту;

· сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы представления;

· сведения, неизвестные до их получения;

· значение, приписанное данным;

· Средство и Форма передачи знаний и опыта, сокращающая неопределенность и случайность и неосведомленность;

· обобщенный термин, относящийся к любым сигналам, звукам, знакам и т.д., которые могут передаваться, приниматься, записываться и/или храниться.

Данные это:

· факты, цифры, и другие сведения о реальных и абстрактных лицах, предметах, объектах, явлениях и событиях, соответствующих определенной предметной области, представленные в цифровом, символьном, графическом, звуковом и любом другом формате (предметная (или прикладная) область — сегмент информационного пространства, отражающей определенную часть реального мира и представляющей собой совокупность сведений о реальных и абстрактных объектах и понятиях, их связях и признаках);

· информация, представленная в виде, пригодном для ее передачи и обработки автоматическими средствами, при возможном участии автоматизированными средствами с человеком;

· фактический материал, представленный в виде информации, чисел, символов или букв, используемый для описания личностей, объектов, ситуаций или других понятий с целью последующего анализа, обсуждения или принятия соответствующих решений.

Из всего многообразия подходов к определению понятия "данные" на наш взгляд справедливо то, которое говорит о том, что данные несут в себе информацию о событиях, произошедших в материальном мире, поскольку они являются регистрацией сигналов, возникших в результате этих событий. Однако данные не тождественны информации. Станут ли данные информацией, зависит от того, известен ли метод преобразования данных в известные понятия. То есть, чтобы извлечь из данных информацию необходимо подобрать соответствующий форме данных адекватный метод получения информации. Данные, составляющие информацию, имеют свойства, однозначно определяющие адекватный метод получения этой информации. Причем необходимо учитывать тот факт, что информация не является статичным объектом — она динамически меняется и существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных. Информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.

Одни и те же данные могут в момент потребления представлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов.

По своей природе данные являются объективными, так как это результат регистрации объективно существующих сигналах, вызванных изменениями в материальных телах или полях. Методы являются субъективными. В основе искусственных методов лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные людьми (субъектами). В основе естественных методов лежат биологические свойства субъектов информационного процесса. Таким образом, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

Знания — это:

· вид информации, отражающей знания, опыт и восприятие человека — специалиста (эксперта) в определенной предметной области;

· множество всех текущих ситуаций в объектах данного типа и способы перехода от одного описания объекта к другому;

· осознание и толкование определенной информации, с учетом путей наилучшего ее использования для достижения конкретных целей, характеристиками знаний являются: внутренняя интерпретируемость, структурируемость, связанность и активность. Согласно [Информационные системы в экономике. А.В. Хорошилов и др. Москва.: МЭСИ, 1998], "знания есть факты плюс убеждения плюс правила”.

Основываясь на приведенных выше трактовках рассматриваемых понятий, можно констатировать тот факт, что знание — это информация, но не всякая информация — знание. Информация выступает как знания, отчужденные от его носителей и обобществленные для всеобщего пользования. Другими словами, информация — это превращенная форма знаний, обеспечивающая их распространение и социальное функционирование. Получая информацию, пользователь превращает ее путем интеллектуального усвоения в свои личностные знания. Здесь мы имеем дело с так называемыми информационно-когнитивными процессами, связанными с представлением личностных знаний в виде информации и воссозданием этих знаний на основе информации.

В превращении информации в знание участвует целый ряд закономерностей, регулирующих деятельность мозга, и различных психических процессов, а также разнообразных правил, включающих знание системы общественных связей, — культурный контекст определенной эпохи. Благодаря этому знание становится достоянием общества, а не только отдельных индивидов. Между информацией и знаниями имеется разрыв. Человек должен творчески перерабатывать информацию, чтобы получить новые знания.

Таким образом, учитывая вышеизложенное, можно сделать вывод, что фиксируемые воспринимаемые факты окружающего мира представляют собой данные. При использовании данных в процессе решения конкретных задач — появляется информация. Результаты решения задач, истинная, проверенная информация (сведения), обобщенная в виде законов, теорий, совокупностей взглядов и представлений представляет собой знания [Романов, Майоров].

Те предметы или устройства, от которых человек может получить информацию, называют источниками информации.

Те предметы или устройства, которые могут получать информацию, называют приемниками информации.

Классификация информации

Информация может быть классифицирована следующим образом:

1) по объекту — показатели качества товара, его ресурсоемкость, параметры инфраструктуры рынка, организационно-технического уровня производства, социального развития коллектива, охраны окружающей среды и т.д.

2) по принадлежности к подсистеме системы менеджмента — информация по целевой подсистеме, научному сопровождению системы, внешней среде системы, обеспечивающей, управляемой и управляющей подсистемам;

3) по форме передачи — вербальная (словесная) информация и невербальная;

4) по изменчивости во времени — условно-постоянная и условно-переменная (недолговечная);

5) по способу передачи — спутниковая, электронная, телефонная, письменная и т.д.;

6) по режиму передачи — в нерегламентные сроки, по запросу и принудительно в определенные сроки;

7) по назначению — экономическая, техническая, социальная, организационная и т.д.

8) по стадиям жизненного цикла объекта — по стадии стратегического маркетинга, научно-исследовательских и опытно-конструкторских работ, организационно-технологической подготовке производства и т.д.;

9) по отношению объекта управления к субъекту — между фирмой и внешней средой, между подразделениями внутри фирмы по вертикали и горизонтали, между руководителем и исполнителями, неформальные коммуникации.

Понятие базы данных

Возможно, вы еще не знаете, что входит в понятие базы данных, но то, что вы ими постоянно пользуетесь абсолютно точно. Каждый раз, когда вы что-то ищете в поисковике, вы используете базу данных. Когда вы вводите свои логин и пароль для входа на какой-нибудь сервис, они сравниваются со значениями, которые хранятся в базе данных этого сервиса.

Несмотря на то, что мы постоянно используем базы данных, для многих остается непонятным, что же это такое на самом деле. И связано это отчасти с тем, что одни и те же термины, относящиеся к базам данных, используются людьми для определения совершенно разных вещей.

Давайте разберемся с терминами и понятиями баз данных:

База данных — набор сведений, хранящихся некоторым упорядоченным способом. Можно сравнить базу данных со шкафом, в котором хранятся документы. Иными словами, база данных — это хранилище данных. Сами по себе базы данных не представляли бы интереса, если бы не было систем управления базами данных (СУБД).

Система управления базами данных — это совокупность языковых и программных средств, которая осуществляет доступ к данным, позволяет их создавать, менять и удалять, обеспечивает безопасность данных и т.д. В общем СУБД — это система, позволяющая создавать базы данных и манипулировать сведениями из них. А осуществляет этот доступ к данным СУБД посредством специального языка — SQL.

SQL — язык структурированных запросов, основной задачей которого является предоставление простого способа считывания и записи информации в базу данных.

Итак, простейшая схема работы с базой данных выглядит примерно так:

По характеру использования СУБД делят на однопользовательские (предназначенные для создания и использования БД на персональном компьютере) и многопользовательские (предназначенные для работы с единой БД нескольких компьютеров, объединенных в локальные сети). Вообще деление по характеру использования можно представить следующей схемой:

Не вдаваясь далее в подробности, отметим, что на сегодняшний день число используемых СУБД исчисляется десятками. Наиболее известные однопользовательские СУБД — Microsoft Visual FoxPro и Access, многопользовательские — MS SQL Server, Oracle и MySQL.

В этих уроках мы будем использовать СУБД MySQL. Во-первых, она бесплатная, а во-вторых, она является стандартом де-факто у российских хост-провайдеров. Но об этом позже, а пока вернемся к основам. В определении базы данных говорится, что это сведения, которые упорядочены некоторым образом. А как собственно они упорядочены? Об этом и пойдет речь в следующем уроке.

Основные свойства БД: Целостность (В каждый момент времени существования БД сведения, содержащиеся в ней, должны быть непротиворечивы), Восстанавливаемость (Данное свойство предполагает возможность восстановления БД после сбоя системы или отдельных видов порчи системы), Безопасность (предполагает защиту данных от преднамеренного и непреднамеренного доступа, модификации или разрушения), Эффективность (сочетание минимального времени реакции на запрос пользователя и минимальной потребности в памяти), Предельные размеры и эксплуатационные ограничения.

Системы управления БД.

СУБД — это программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также осуществлять к ней контролируемый доступ.

Различаются два класса СУБД — системы общего назначения (не ориентированы на какую-либо конкретную предметную область, обладают средствами настройки на работу с конкретной БД в условиях конкретного применения, реализуются как программный продукт, способный функционировать на некоторой модели ЭВМ в определенной операционной обстановке) и специализированные системы (весьма трудоемкий процесс, к которому прибегают, в исключительных ситуациях).

В процессе реализации своих функций СУБД постоянно взаимодействует с базой данных и с другими прикладными программными продуктами пользователя, предназначенными для работы с данной БД и называемыми приложениями.

СУБД включает язык определения данных, с помощью которого можно определить базу данных, ее структуру, типы данных, а также средства задания ограничений для хранимой информации.

СУБД позволяет вставлять, удалять, обновлять и извлекать информацию из базы данных посредством языка управления данными (язык запросов).

Большинство СУБД могут работать на компьютерах с разной архитектурой и под разными операционными системами.

Многопользовательские СУБД имеют достаточно развитые средства администрирования БД.

СУБД предоставляет контролируемый доступ к базе данных с помощью системы обеспечения безопасности, системы поддержки целостности базы данных, системы управления параллельной работой приложений, системы восстановления, доступного пользователям каталога, содержащего описание хранимой в базе данных информации.

Система БД включает два основных компонента: собственно базу данных и систему управления базами данных – СУБД. Большинство СОД включают также программы обработки данных (прикладное программное обеспечение, ППО), которые обращаются к дан-ным через СУБД.

В соответствии с рис. СУБД обеспечивает выполнение двух групп функций:

· предоставление доступа к базе данных прикладному программному обеспечению (или квалифицированным пользователям);

· управление хранением и обработкой данных в БД.

Таким образом, обращение к базе данных возможно только через СУБД.

БД предназначена для хранения данных информационной системы. Пользователи обращаются к базе данных обычно не напрямую через средства СУБД, а с помощью внешнего интерфейса – приложения, входящего в состав АИС. Если пользователей можно разделить на группы по характеру решаемых задач, то приложений может быть несколько (по количеству задач или групп пользователей). Например, для библиотеки можно выделить три группы пользователей: читатели, которым нужно осуществлять поиск книг по различным признакам; сотрудники, выдающие и принимающие у читателей книги (библиотекари) и сотрудники отдела комплектации, осуществляющие приём новых книг и списание старых.

Банк данных (БнД)— это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей. Банк данных должен:

· Обеспечивать информационные потребности внешних пользователей.

· Обеспечивать возможность хранения и модификации больших объёмов многоаспектных данных.

· Обеспечивать заданный уровень достоверности хранимых данных и их непротиворечивость.

· Обеспечивать доступ к данным только пользователям с соответствующими полномочиями.

· Обеспечивать поиск данных по произвольной группе признаков.

· Удовлетворять заданным требованиям по производительности при обработке запросов.

· Иметь возможность реорганизации при изменении границ ПО.

· Обеспечивать выдачу пользователям данных в различной форме.

· Обеспечивать простоту и удобство обращения внешних пользователей к данным.

В структуре банка данных выделяют следующие компоненты (подсистемы):

• информационная база;

• лингвистические средства;

• программные средства;

• технические средства;

• организационно-административные подсистемы и нормативно-методическое обеспечение.

Модели данных в СУБД

Хранимые в базе данные имеют определенную логическую структуру, то есть представлены некоторой моделью, поддерживаемой СУБД.

К числу важнейших относятся следующие модели данных:

• иерархическая.

• сетевая.

• реляционная.

• объектно-ориентированная.

В иерархической модели данные представляются в виде древовидной (иерархической) структуры. Она удобна для работы с иерархически упорядоченной информацией и громоздка для информации со сложными логическими связями.

Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.

Реляционная модель данных (РМД) название получила от английского термина relation — отношение. При соблюдении определенных условий отношение представляется в виде двумерной таблицы, привычной для человека. Большинство современных БД для персональных ЭВМ являются реляционными.

Достоинствами реляционной модели данных являются ее простота, удобство реализации на ЭВМ, наличие теоретического обоснования и возможность формирования гибкой схемы БД, допускающей настройку при формировании запросов.

Реляционная модель данных используется в основном в БД среднего размера. При увеличении числа таблиц в базе данных заметно падает скорость работы с ней. Определенные проблемы использования РМД возникают при создании систем со сложными структурами данных, например, систем автоматизации проектирования.

Объектно — ориентированные БД объединяют в себе две модели данных, реляционную и сетевую, и используются для создания крупных БД со сложными структурами данных.

По характеру использования СУБД делят на:

• персональные (СУБДП)

• многопользовательские (СУБДМ)

К персональным СУБД относятся Visual FoxPro, Paradox, Clipper, dBase, Access и др. К многопользовательским СУБД относятся, например, СУБД Oracle и Informix. Многопользовательские СУБД включают в себя сервер БД и клиентскую часть, работают в неоднородной вычислительной среде — допускаются разные типы ЭВМ и различные операционные системы. Поэтому на базе СУБДМ можно создать информационную систему, функционирующую по технологии клиент-сервер. Универсальность многопользовательских СУБД отражается соответственно на высокой цене и компьютерных ресурсах, требуемых для их поддержки.

СУБДП представляет собой совокупность языковых и программных средств, предназначенных для создания, ведения и использования БД. Персональные СУБД обеспечивают возможность создания персональных БД и недорогих приложений, работающих с ними, и при необходимости создания приложений, работающих с сервером БД.

Понятие модели данных

Модель данных – это совокупность правил порождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значения данных, последовательность их изменения [6]. Итак, модель данных состоит из трёх частей:

· Набор типов структур данных.

Здесь можно провести аналогию с языками программирования, в которых тоже есть предопределённые типы структур данных, такие как скалярные данные, вектора, массивы, структуры (например, тип struct в языке Си) и т.д.

· Набор операторов или правил вывода, которые могут быть применены к любым правильным примерам типов данных, перечисленных в (1), чтобы находить, выводить или преобразовывать информацию, содержащуюся в любых частях этих структур в любых комбинациях.

Такими операциями являются: создание и модификация структур данных, внесение новых данных, удаление и модификация существующих данных, поиск данных по различным условиям.

· Набор общих правил целостности, которые прямо или косвенно определяют множество непротиворечивых состояний базы данных и/или множество изменений её состояния.

Правила целостности определяются типом данных и предметной областью. Например, значение атрибута Счётчик является целым числом, т.е. может состоять только из цифр. А ограничения предметной области таковы, что это число не может быть меньше нуля.

Сетевая модель данных (СМД)

Сетевая модель позволяет организовывать БД, структура которых представляется графом общего вида (пример СМД – на рис. 2.4). Организация данных в сетевой модели соответствует структуризации данных по версии CODASYL. Каждая вершина графа хранит экземпляры сущностей (записи одного типа) и сведения о групповых отношениях с сущностями других типов. Каждая запись может хранить произвольное количество значений атрибутов (элементов данных и агрегатов), характеризующих экземпляр сущности. Для каждого типа записи выделяется первичный ключ – атрибут, значение которого позволяет однозначно идентифицировать запись среди экземпляров записей данного типа.

Связи между записями в СМД выполняются в виде указателей, т.е. каждая запись хранит ссылку на другую однотипную запись (или признак конца списка) и ссылки на списки подчинённых записей, связанных с ней групповыми отношениями. Таким образом, в каждой вершине записи хранятся в виде связного списка. Если список организован как однонаправленный, запись имеет ссылку на следующую однотипную запись в списке; если список двунаправленный – то на следующую и предыдущую однотипные записи.

Групповые отношения характеризуются следующими признаками:

· Способ упорядочения подчинённых записей

Поддерживаются три способа упорядочения:

1. Очередь – добавление в конец списка (FIFO – first input, first output).

2. Очередь – добавление в конец списка (FIFO – first input, first output).

3. Сортировка по значению ключа. При этом задаётся ключев Очередь – добавление в конец списка (FIFO – first input, first output).

4. ое поле (группа полей), и вновь поступившая запись добавляется в упорядоченный список в соответствии со значением этого поля (значением ключа).

· Режим включения подчинённых записей.

Режим включения бывает автоматический и ручной.

При автоматическом режиме подчинённая запись связана с записью-владельцем обязательной связью, поэтому она включается в групповое отношение и прикрепляется к записи-владельцу в момент внесения в БД. (Из этого следует, что запись-владелец должна быть внесена в базу данных до внесения первого экземпляра подчинённой записи.)

При ручном режиме включения подчинённая запись может находиться в БД и не быть прикрепленной к записи-владельцу. Она вручную включается в групповое отношение тогда, когда это отношение (связь) возникает.

· Режим исключения подчинённых записей

Режим исключения определяется классом членства. Различают три класса членства – фиксированный, обязательный и необязательный:

1. Записи с обязательным членством должны быть удалены до удаления записи–владельца: владелец, к которому прикреплена хотя бы одна запись с обязательным членством, не может быть удалён.

2. Записи с фиксированным членством удаляются вместе с записью–владельцем.

3. Записи с необязательным членством при удалении записи–владельца останутся в БД.

В СМД применяются следующие операции над данными:

· запомнить: внесение информации в БД;

· включить в групповое отношение: установление связей между данными;

· переключить: переход члена набора к другому владельцу;

· обновить: модификация данных;

· извлечь: чтение данных;

· удалить: физическое или логическое удаление данных;

· исключить из группового отношения: разрыв связей между данными.

В сетевой модели данных предусмотрены специальные способы навигации и манипулирования данными. Аппарат навигации в графовых моделях служит для установления тех записей, к которым будет применяться очередная операция манипулирования данными. Такие записи называются текущими. В СМД возможны переходы:

· от текущего экземпляра записи определённого типа к следующему экземп-ляру записи этого же типа;

· из текущей вершины в любую вершину, с которой текущая связана групповым отношением.

Навигация в СМД может начинаться с любой записи.

СМД является наиболее полной с точки зрения реализации различных типов связей и ограничений целостности, но она является достаточно сложной для проектирования и поддержки. В этой модели не обеспечивается физическая независимость данных, т.к. наборы организованы с помощью физических ссылок. Также в СМД не обеспечивается независимость данных от программ. Из-за этих недостатков эта модель не получила широкого распространения.

Иерархическая модель данных (ИМД)

Иерархическая модель позволяет строить БД с иерархической древовидной структурой. Структура ИМД описывается в терминах, аналогичных терминам сетевой модели данных (версия CODASYL). Группу в ИМД принято называть сегментом. В основе ИМД лежит понятие дерева.

Дерево – это связный неориентированный граф, который не содержит циклов. При работе с деревом выделяют какую-то конкретную вершину, определяют её как корень дерева и рассматривают особо – в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным, ориентация определяется от корня. Дерево как ориентированный граф определяется так:

· имеется единственная особая вершина, называемая корнем, в которую не заходит ни одно ребро;

· во все остальные вершины заходит только одно ребро, а исходит произвольное количество ребер;

· граф не содержит циклов.

Конечные вершины, то есть вершины, из которых не выходит ни одной дуги, называются листьями дерева. Количество вершин на пути от корня к листьям в разных ветвях дерева может быть различным.

В иерархических моделях данных используется ориентация древо-видной структуры от корня к листьям. Графическая диаграмма концептуальной схемы базы данных называется деревом определения. Пример иерархической базы данных приведён на рис. 2.6. Каждая некорневая вершина в ИМД связана с родительской вершиной (сегментом) иерархическим групповым отношением. Каждая вершина дерева соответствует типу сущности ПО. Тип сущности характеризуется произвольным количеством атрибутов, связанных с ней отношением 1:1. Атрибуты, связанные с сущностью отношением 1:n, образуют отдельную сущность (сегмент) и переносятся на следующий уровень иерархии. Реализация связей типа n:m не поддерживается.

Рис. 2.6. Пример фрагмента иерархической базы данных

Тип вершины определяется типом сущности и набором её атрибутов. Каждая вершина дерева хранит экземпляры сущностей – записи. Следствием внутренних ограничений иерархической модели является то, что каждому экземпляру зависимой группы в БД соответствует уникальное множество экземпляров родительских записей – по одному экземпляру (записи) каждого типа вершин вышестоящих уровней.

По сравнению с СМД иерархическая имеет ограниченный набор режимов включения и исключения подчинённых записей. Это определяется обязательностью связей: в дереве не может быть «висячих» вершин, не связанных с вершиной верхнего уровня (кроме корневой). Поэтому ИМД не поддерживает необязательный класс членства и ручной режим включения записей.

В ИМД предусмотрены специальные способы навигации. Передвижение по дереву всегда начинается с корневой вершины, от которой можно перейти на конкретный экземпляр записи любой вершины следующего уровня. Эта вершина становится текущей вершиной, а экземпляр – текущей записью. От этой записи можно перейти к другой записи данной вершины, к экземпляру записи родительской вершины или к экземпляру записи подчинённой вершины. Т.о., попасть в любую вершину можно, только проделав полный путь по дереву от корня. Связи между записями в ИМД обычно выполнены в виде ссылок (т.е. хранятся адреса связанных записей).

Корневая запись дерева должна содержать ключ с уникальным значением. Ключи некорневых записей должны иметь уникальные значения только в экземплярах групповых отношений, т.е. на одном и том же уровне иерархии в разных ветвях дерева могут быть экземпляры записей с одинаковыми ключами. Это объясняется тем, что каждая запись идентифицируется полным сцепленным ключом, который образуется путём конкатенации всех ключей экземпляров родительских записей. Например, для студента (рис. 2.6) ключ – это (Шифр_факультета+Номер_курса+Номер_группы+Номер_зачётной_книжки).

Основным недостатком ИМД является дублирование данных. Оно вызвано тем, что каждая сущность (атрибут) может относиться только к одной родительской сущности. Например, если в БД хранятся данные о детях сотрудников, а на предприятии работает и отец, и мать ребёнка, то сведения об этом ребёнке нужно хранить дважды. Аналогичная ситуация возникает, если нужно отразить в БД связь «многие-ко-многим». Дублирование данных может вызвать нарушение логической целостности БД при внесении изменений в эти данные.

Если данные имеют естественную древовидную структуризацию, то ис-пользование иерархической модели данных не вызывает проблем. Но на практике часто требуется реализовать структуры данных, отличные от иерархической. Для решения этих задач конкретные СУБД, основанные на ИМД, включают дополнительные средства, облегчающие представление произвольно организованных данных.

Реляционные базы данных

как мы уже знаем, состоят из таблиц. Каждая таблица состоит из столбцов (их называют полями или атрибутами) и строк (их называют записями или кортежами). Таблицы в реляционных базах данных обладают рядом свойств. Основными являются следующие:

В таблице не может быть двух одинаковых строк. В математике таблицы, обладающие таким свойством, называют отношениями — по-английски relation, отсюда и название — реляционные.

Столбцы располагаются в определенном порядке, который создается при создании таблицы. В таблице может не быть ни одной строки, но обязательно должен быть хотя бы один столбец.

У каждого столбца есть уникальное имя (в пределах таблицы), и все значения в одном столбце имеют один тип (число, текст, дата…).

На пересечении каждого столбца и строки может находиться только атомарное значение (одно значение, не состоящее из группы значений). Таблицы, удовлетворяющие этому условию, называют нормализованными.

Все будет понятнее на примере. Предположим, мы захотели создать базу данных для форума. У форума есть зарегистрированные пользователи, которые создают темы и оставляют сообщения в этих темах. Эта информация и должна храниться в базе данных.

Теоретически (на бумаге) мы можем все это расположить в одной таблице, например, так:

Но это противоречит свойству атомарности (одно значение в одной ячейке), а в столбцах Темы и Сообщения у нас предполагается неограниченное количество значений. Значит, нашу таблицу надо разбить на три: Пользователи, Темы и Сообщения.

Наша таблица Пользователи удовлетворяет всем условиям. А вот таблицы Темы и Сообщения — нет. Ведь в таблице не может быть двух одинаковых строк, а где гарантия, что один пользователь не оставит два одинаковых сообщения, например:

Кроме того, мы знаем, что каждое сообщение обязательно относится к какой-либо теме. А как это можно узнать из наших таблиц? Никак. Для решения этих проблем, в реляционных базах данных существуют ключи.

Первичный ключ (сокращенно РК — primary key) — столбец, значения которого во всех строках различны. Первичные ключи могут быть логическими (естественными) и суррогатными (искусственными). Так, для нашей таблицы Пользователи первичным ключом может стать столбец e-mail (ведь теоретически не может быть двух пользователей с одинаковым e-mail). На практике лучше использовать суррогатные ключи, т.к. их применение позволяет абстрагировать ключи от реальных данных. Кроме того, первичные ключи менять нельзя, а что если у пользователя сменится e-mail?

Суррогатный ключ представляет собой дополнительное поле в базе данных. Как правило, это порядковый номер записи (хотя вы можете задавать их на свое усмотрение, контролируя, чтобы они были уникальны). Давайте внесем поля первичных ключей в наши таблицы:

Теперь каждая запись в наших таблицах уникальна. Нам осталось установить соответствие между темами и сообщениями в них. Делается это также при помощи первичных ключей. В таблицу сообщения мы добавим еще одно поле:

Теперь понятно, что сообщение с id=2 принадлежит теме "О рыбалке" (id темы = 4), созданной Васей, а остальные сообщения принадлежать теме "О рыбалке" (id темы = 1), созданной Кириллом. Такое поле называется внешний ключ (сокращенно FK — foreign key). Каждое значение этого поля соответствует какому-либо первичному ключу из таблицы "Темы". Так устанавливается однозначное соответствие между сообщениями и темами, к которым они относятся.

Последний нюанс. Предположим, у нас добавился новый пользователь, и зовут его тоже Вася:

Как мы узнаем, какой именно Вася оставил сообщения? Для этого поля автор в таблицах "Темы" и "Сообщения" мы сделаем также внешними ключами:

Наша база данных готова. Схематично ее можно представить так:

В нашей маленькой базе данных всего три таблички, а если бы их было 10 или 100? Понятно, что сразу невозможно представить все таблицы, поля и связи, которые нам могут понадобиться. Именно поэтому проектирование базы данных начинается с ее концептуальной модели, которую мы и рассмотрим в следующем уроке.

Достоинства и недостатки РМД

Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL (Structured Query Language, [3]).

Моделирование предметной области в рамках реляционной модели создаёт некоторые сложности, т.к. в этой модели нет специальных средств для отображения различных типов связей и агрегатов. Отсутствие агрегатов приводит к тому, что при проектировании реляционной БД приходится проводить нормализацию отношений. После нормализации данные об одной сущности предметной области распределяются по нескольким таблицам, что усложняет работу с БД. (Подробнее об этом рассказано в разделе 8.9.7).

Отсутствие специальных механизмов навигации (как в иерархической или сетевой моделях), с одной стороны, ведёт к упрощению модели, а с другой – к многократному увеличению времени на извлечение данных, т.к. во многих случаях требуется просмотреть всё отношение для поиска нужных данных.

В РМД нет понятий режим включения и класс членства. Но с помощью внешних ключей и дополнительных возможностей СУБД их можно эмулиро-вать. (Подробнее об этом рассказано в [3]).

Итак, реляционная модель данных – это модель данных, основанная на представлении данных в виде набора отношений, каждое из которых является подмножеством декартова произведения определённых множеств. Манипулирование данными в РМД осуществляется с помощью операций реляционной алгебры (РА) или реляционного исчисления [1]. Реляционная алгебра основана на теории множеств, а реляционное исчисление базируется на математической логике (вернее, на исчислении предикатов первого порядка). Изучение реляционного исчисления выходит за рамки данного пособия. Мы рассмотрим только операции реляционной алгебры.

Модель «сущность-связь» (entity-relationship model) предложена американским исследователем в области баз данных Питером Ченом в 1976 году. С тех пор она расширялась и модифицировалась как самим Ченом, так и многими другими исследователями. В различных вариантах она вошла в состав многих автоматизированных средств поддержки проектирования информационных систем. В настоящее время нет единого стандарта этой модели, но есть набор общих конструкций, лежащих в основе большинства её вариантов. Эти общие конструкции мы и изучим здесь.

Существует много различных систем построения моделей ER.

Какие бы системы ни использовались, ER-диаграмма наглядно и точно отражает представления автора о данных. Поэтому она является хорошим источником информации для проектировщика логической модели данных. Их очень удобно использовать при обсуждении требований к данным с конечными пользователями.

Цель инфологического моделирования – обеспечение наиболее естественных для человека способов сбора и представления той информации, которую предполагается хранить в создаваемой базе данных. Поэтому инфологическую модель данных пытаются строить по аналогии с естественным языком (последний не может быть использован в чистом виде из-за сложности компьютерной обработки текстов и неоднозначности любого естественного языка). Основными конструктивными элементами инфологических моделей являются сущности, связи между ними и их свойства (атрибуты).

Бинарная модель данных. Это графовая модель, в которой вершины являются представлениями простых однозначных атрибутов, а дуги — представлениями бинарных связей между атрибутами (рис. 5.12

Бинарная модель не получила особо широкого распространения, но в ряде случаев находит практическое применение.

Так, в области ИИ уже давно ведутся исследования с целью представления информации в виде бинарных отношений. Рассмотрим триаду (тройку) «объект — атрибут — значение» (более подробно об этом будет сказано в гл. 13). Триада «Кузнецов — возраст — 20» означает, что возраст некоего Кузнецова равен 20 годам. Эта же информация может быть выражена, например, бинарным отношением ВОЗРАСТ. Понятие бинарного отношения положено в основу таких моделей данных, как, например, Data Semantics и DIAM II.

Бинарные модели данных обладают возможностью представления связей любой сложности (и это их несомненное преимущество), но вместе с тем их ориентация на пользователя недостаточна [53].

Потенциальные ключи.Потенциальным ключом будем называть такую комбинацию столбцов, которая обладает следующими свойствами:

· УникальностьюВ таблице нет двух разных строк с одиноковыми значениями в нашем потенциальном ключе.

· Неизбыточностью.Нельзя убрать один из столбцом из ключа, так, чтобы он не потерял уникльности.

Ключи бывают разные — потенциальные, первичные, альтенативные, внешние, индексные, хеш-ключи, ключи сортировки, вторичные ключи, ключи шифрование и расшифровки и т.д.

Первичный ключ — это один из потенциальных ключей. Тот, который нам больше понравится. Вам какой больше нравиться? В реальной ситуации, новичок выберет номер паспорта. А что выберет профессионал? Профессионал добавит еще одно поле-счетчик, которое будет содержать уникальное для каждой записи значение. В Delphi такой тип поля называется AutoIncrement, в SQL Server есть целых 2 варианта — TimeStamp и свойтсво Identity поля. Подробнее этот момент мы рассмотрим в уроках по в взаимодействию с SQL Server’ом. Про полезность введения дополнительного поля, так называемого "суррогатного ключа", можно почитать здесь. Мы ведь собрались стать профессионалами? Вот и поучимся у умных людей.

Лиричекое отступление — умный человек, а тем более профессионал никогда не скажет "Я и так все знаю, ничему меня не научишь". Потому что он знает — всегда есть чему учиться.

Альтернативные ключи.Первичный ключ может быть только один на всю таблицу! После выбора первичного ключа из набора потенциальных ключей, оставшиеся ключи называются альтенативными. Это так, для знания терминологии. Пока нам о них больше ничего знать не надо.

Внешние ключи.Эта тема тесно связана со следующей — "Некоторые правилами построения баз данных" В частности с понятием нормализации Это будет потом, а сейчас только некоторые моменты.

Когда мы создаем какую-нибудь базу данных, например для начисления зарплаты, нам не удобно всех работников упоминать в одной таблице. Если, например, какой-нибудь из них упоминается там не один раз (зарплата, премия, надбавки, снятия, налоги и пр.), то при изменении его/ее фамилии надо будет пробежаться по всем строкам, и поменять все вхождения. Это неудобно. Есть и другие поводы разделить такую таблицу, о них читайте в следующем уроке, а пока просто примем как факт необходимость ее разделения. Так вот, имеем две таблицы:

В первой таблице — с деньгами — столбец "Код работника" называется внешним ключом. Ясно, что он не может существовать без соответствующей строки из второй таблицы, в которой столбец "Код работника" — уже знакомый нам обычный первичный ключ. Вторая таблица — с фамилиями — является как бы "справочником фамилий" для первой.

Хотя чистая реляционная теория требует, чтобы внешние ключи всегда ссылались на первичные ключи, мы это требование низведем до простой рекомендации: бывают ситуации, когда одна и та же таблица может служить справочником разным другим, причем в разном качестве. А первичный ключ, как мы знаем, пожет быть только один.

Внешний ключ – это ограничение целостности, в соответствии с которым множество значений внешнего ключа является подмножеством значений первичного или уникального ключа родительской таблицы.

Ограничение целостности по внешнему ключу проверяется в двух случаях:

при добавлении записи в подчинённую таблицу СУБД проверяет, что в родительской таблице есть запись с таким же значением первичного ключа;

при удалении записи из родительской таблицы СУБД проверяет, что в подчинённой таблице нет записей с таким же значением внешнего ключа.

Примечание: внешний ключ может ссылаться на первичный ключ этой же таблицы. Это позволяет описывать унарную связь – иерархию однотипных сущностей. Например, если в таблицу СОТРУДНИКИ добавить поле Руководитель и описать его как внешний ключ на эту же таблицу, то в этом поле будет храниться идентификатор руководителя данного сотрудника (рис. 2.9). Атрибут Руководитель является необязательным.

Реляционная модель данных включает следующие компоненты:

Структурный аспект (составляющая) — данные в базе данных представляют собой набор отношений.

Аспект (составляющая) целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

Аспект (составляющая) обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).

Общая характеристика СУБД MS Access

Microsoft Access в настоящее время является одной из самых популярных среди настольных (персональных) программных систем управления базами данных Среди причин такой популярности следует отметить:

— высокую степень универсальности и продуманности интерфейса, который рассчитан на работу с пользователями самой различной квалификации. В частности, реализована система управления объектами базы данных, позволяющая гибко и оперативно переходить из режима конструирования в режим их непосредственной эксплуатации;

— глубоко развитые возможности интеграции с другими программными продуктами, входящими в состав Microsoft Office, а также с любыми программными продуктами, поддерживающими технологию OLE;

— богатый набор визуальных средств разработки.

Нельзя не отметить, что существенной причиной такого широкого распространения MS Access является и мощная рекламная поддержка, осуществляемая фирмой Microsoft. В процессе разработки данного продукта на рынок представлялись его различные версии. Наиболее известными (в некотором смысле этапными) стали Access 2.0, Access 7.0 (он впервые был включен в состав программного комплекса MS Office 95). Позже появились версии Access 97 (в составе MS Office 97 и Access 2000 (в составе MS Office 2000).

Очевидно, что отправной точкой в процессе работы с любой СУБД является создание файла (или группы файлов) базы данных. На рис. 7.4 показано окно, которое появляется после создания новой базы.

Основные разделы главного окна соответствуют типам объектов, которые может содержать база данных Access. Это Таблицы, Запросы, Отчеты, Макросы и Модули. Заголовок окна содержит имя файла базы данных. В данном случае он называется TradeTest.

Интерфейс работы с объектами базы данных унифицирован. По каждому из них предусмотрены стандартные режимы работы:

— Создать — предназначен для создания структуры объектов;

— Конструктор — предназначен для изменения структуры объектов;

— Открыть (Просмотр, Запуск) — предназначен для работы с объектами базы данных.

Важным средством, облегчающим работу с Access для начинающих пользователей, являются мастера — специальные программные надстройки, предназначенные для создания объектов базы данных в режиме последовательного диалога. Для опытных и продвинутых пользователей существуют возможности более гибкого управления ресурсами и возможностями объектов СУБД в режиме конструктора.

Специфической особенностью СУБД Access является то, что вся информация, относящаяся к одной базе данных, хранится в едином файле. Такой файл имеет расширение *.mdb. Данное решение, как правило, удобно для непрофессиональных пользователей, поскольку обеспечивает простоту при переносе данных с одного рабочего места на другое. Внутренняя организация данных в рамках mdl формата менялась от версии к версии, но фирма Microsoft поддерживала их ее вместимость снизу вверх, то есть базы данных из файлов в формате ранних вер сии Access могут быть конвертированы в формат, используемый в версиях боле поздних.

Объекты СУБД

Таблицы создаются пользователем для хранения данных об одной сущности – одном информационном объекте модели данных предметной области. Таблица состоит из полей (столбцов) и записей (строк). Каждое поле содержит одну характеристику информационного объекта предметной области. В записи собранны сведения об одном экземпляре информационного объекта.

База данных Access может включать до32768 объектов (включая формы, отчеты и т.д.). одновременно может открываться до 2048 таблиц. Таблицы можно импортировать из баз данных dBase, FoxPro, Paradox и других приложений, из базы данных архитектуры клиент-сервер, таких как Microsoft SQL Server, или из электронных таблиц, таких как Excel и Lotus 1-2-3. база данных Access позволяет работать с таблицами перечисленных источников путем организации связи с ними.

Запросы. Запросы на выборку служат для выборки нужных данных из одной или нескольких связанных таблиц. Результатом выполнения запроса является таблица, которая может быть использована наряду с другими таблицами базы данных при обработке данных. В запросе можно указать, какие поля выбранных таблиц нужно выбрать, как на их основе сформировать записи и выбрать нужные. Запрос может формироваться с помощью QBE-запросов (Query By Example, Запрос по образцу)или посредством инструкции SQL. Запросы действия позволяют обновлять, удалять или добавлять данные в таблицы, а также создавать новые таблицы на основе уже существующих.

Схемы данных , определяют с помощью каких полей таблицы связываются между собой, как будет выполняться объединение данных этих таблиц, нужно ли проверять связную целостность при добавлении и удалении записей, изменении ключей таблиц. Схемы данных на панели объектов в окне базы данных отображаются только в проектах Access, работающих с базами данных сервера. Для их отображения в базах данных Access используется команда Сервис/Схема данных.

Формы являются основным средством создания диалогового интерфейса приложения пользователя. Форма может создаваться для ввода и просмотра взаимосвязанных данных базы на экране в удобном виде, соответствующем привычному для пользователя документу. Кнопочные формы могут использоваться для создания панелей управления в приложении. В формы могут вставляться рисунки, диаграммы, звуковые фрагменты, видео. Форма может включать подчиненные формы. В форму могут включаться процедуры обработки событий, которые позволяют управлять процессом ввода, просмотра и корректировки данных. Такие процедуры хранятся в модуле формы.

Отчеты предназначены для форматирования выходных документов любых форматов, содержащих результаты решения задач пользователя, и вывода их на печать. Использование графических объектов позволяет дополнять данные отчета иллюстрациями.

Страницы доступа к данным являются диалоговыми Web – страницами, которые поддерживают динамическую связь с базой данных и позволяют просматривать, редактировать и вводить данные в базу, работая в окне браузера.

Макросы позволяют автоматизировать некоторые действия в приложении пользователя. Макрос является программой, состоящей из последовательности макрокоманд, которая выполняется при наступлении некоторого события в объекте приложения или его элементе управления. Создание макросов осуществляется в диалоговом режиме путем выбора нужных макрокоманд и задании параметров, используемых ими при выполнении.

Модули содержат процедуры на языке Visual Basic for Applications. Могут создаваться процедуры-подпрограммы, процедуры-функции, которые разрабатываются пользователем для реализации нестандартных функций в приложении пользователя, и процедуры для обработки событий. Использование процедур позволяет создать законченное приложение, которое имеет собственный графический интерфейс, позволяющий запросить выполнение всех функций приложения.

Средства создания объектов СУБД MS Access:

Ручные (разработка объектов в режиме Конструктора) – обеспечивают максимальную гибкость;

Автоматизированные (разработка с помощью мастеров);

Автоматические – средства ускоренной разработки простейших объектов – наиболее производительные

Ручные средства более трудоёмкие, но обеспечивают максимальную гибкость. Автоматизированные и Автоматические средства являются наиболее производительными, но и наименее гибкими.

При разработке учебных таблиц и запросов рекомендуются использовать ручные средства – работать в режиме Конструктора.

При разработке учебных форм, отчётов лучше пользоваться автоматизированными средствами, предоставляемыми мастерами, т. к. для этих объектов большую роль играет внешний вид.

Окно конструктора является графическим бланком для создания и редактирования структуры таблиц. В первом столбце вводят имена полей , которые одновременно станут именами столбца будущей таблицы.

Тип поля выбирают из раскрывающегося списка, открываемого кнопкой выбора типа данных. Кнопка отображается только после щелчка на поле бланка. В MS Access очень много скрытых элементов управления, которые отображаются в момент ввода данных. Нижняя часть бланка содержит список свойств поля, выделенного в верхней части. Свойства поля можно настраивать по желанию.

Чтобы создать таблицу вручную:

щёлкнуть по значку Создание таблицы в режиме конструктора. Откроется окно Конструктора.

Заполнить имена полей, (перемещаясь по ячейкам с помощью клавиш Tab или стрелками управления курсором);

Выбрать из раскрывающегося списка типы данных;

Задать ключевое поле:

щёлкнуть на его имени правой кнопкой мыши и в открывшемся контекстном меню выбрать пункт

СУБД MS Access имеет особенности автоматизации и предоставляет несколько средств создания каждого из основных объектов базы.

Ключевое поле.

Бланк закрывают, после чего дают таблице имя.

Созданную таблицу открывают двойным щелчком на её значке. Новая таблица имеет только названия столбцов.

При закрытии бланка система выдаёт запрос на сохранение таблицы. Таблице дают имя и с этого момента она доступна в числе прочих таблиц в основном окне База данных. Её можно открыть при необходимости двойным щелчком в окне База данных.

Заполнить таблицу обычным порядком.

При перемещении по таблице с большим числом записей использовать панель кнопок перехода.

При заполнения таблицы данными сохранение их происходит автоматически. Но если произошло изменение макета таблицы (ширина столбцов), то СУБД попросит подтверждение сохранения этих изменений.

Для изменения структуры Таблицы её надо открыть в режиме Конструктора.

Создание межтабличных связей

Целостность данных — это набор правил, гарантирующих, что Access будет работать только с непротиворечивыми данными и разрешёнными операциями.

Активизировать команду Сервис Схема данных

В диалоговом окне Схема данных:

Щёлкнуть по кнопке Добавить таблицу.

В диалоговом окне из списков выбрать Таблицы, между которыми создаются связи. Закрыть окно Добавление таблицы. Искомые таблицы появятся в окне Схема данных..

Новая таблица не имеет записей – только названия столбцов, характеризующие структуру таблицы. Заполнение таблицы данными производится обычным порядком. Курсор ввода устанавливается в нужную ячейку указателем мыши. Переход к следующей ячейке можно выполнить клавишей TabДанные не всегда умещаются в ячейках таблицы. Шириной столбцов можно управлять методом перетаскивания их границ. Удобно использовать автоматическое форматирование столбцов по «содержимому». Для этого надо установить указатель мыши на границу между столбцами (в строке заголовков столбцов), дождаться, когда указатель сменит форму, и выполнить двойной щелчок.

Связи гарантируют сохранение целостности данных в таблицах. Access 2000 использует отношения, чтобы связать таблицы между собой. Это происходит с помощью окна Схема данных.

Между таблицами можно устанавливать отношения

1:1; 1:М; М:М.

Выделить в 1-й таблице ключевое поле и с помощью мыши перетащить его на одноименное поле 2-й таблицы. При отпускании кнопки мыши откроется диалоговое окно Связи.Установить флаг Обеспечение целостности данных. Щёлкнуть по кнопке Создать. Появится связь 1:1. Образовавшиеся межтабличные данные отображаются в окне Схема данных в виде линий, соединяющие 2 поля разных таблиц. Одна из таблиц считается главной, а другая – связанной. Главная – это та таблица, которая участвует в связи своим ключевым полем.

Связь между таблицами позволяет:

Исключить возможность удаления или изменения данных в ключевом поле главной таблицы, если с этим полем связаны поля других таблиц;

(Установить флаг ^ Обеспечение целостности данных).

При удалении данных в ключевом поле главной таблицы автоматически удалить соответствующие данные в полях связанных таблиц.

(Установить дополнительно флаги Каскадное обновление связанных полей и Каскадное удаление связанных записей).

Основные типы данных.

Данные, хранящиеся в памяти ЭВМ представляют собой совокупность нулей и едениц (битов). Биты объединяются в последовательности: байты, слова и т.д. Каждому участку оперативной памяти, который может вместить один байт или слово, присваивается порядковый номер (адрес).

Какой смысл заключен в данных, какими символами они выражены — буквенными или цифровыми, что означает то или иное число — все это определяется программой обработки. Все данные необходимые для решения практических задач подразделяются на несколько типов, причем понятие тип связывается не только с представлением данных в адресном пространстве, но и со способом их обработки.

Любые данные могут быть отнесены к одному из двух типов: основному (простому), форма представления которого определяется архитектурой ЭВМ, или сложному, конструируемому пользователем для решения конкретных задач.

Данные простого типа это — символы, числа и т.п. элементы, дальнейшее дробление которых не имеет смысла. Из элементарных данных формируются структуры (сложные типы) данных.

Некоторые структуры:

Массив(функция с конечной областью определения) — простая совокупность элементов данных одного типа, средство оперирования группой данных одного типа. Отдельный элемент массива задается индексом. Массив может быть одномерным, двумерным и т.д. Разновидностями одномерных массивов переменной длины являются структуры типа кольцо, стек, очередь и двухсторонняя очередь.

Запись(декартово произведение) — совокупность элементов данных разного типа. В простейшем случае запись содержит постоянное количество элементов, которые называют полями. Совокупность записей одинаковой структуры называется файлом. (Файлом называют также набор данных во внешней памяти, например, на магнитном диске). Для того, чтобы иметь возможность извлекать из файла отдельные записи, каждой записи присваивают уникальное имя или номер, которое служит ее идентификатором и располагается в отдельном поле. Этот идентификатор называют ключом.

Такие структуры данных как массив или запись занимают в памяти ЭВМ постоянный объем, поэтому их называют статическими структурами. К статическим структурам относится также множество.

Имеется ряд структур, которые могут изменять свою длину — так называемые динамические структуры. К ним относятся дерево, список, ссылка.

Важной структурой, для размещения элементов которой требуется нелинейное адресное пространство является дерево. Существует большое количество структур данных, которые могут быть представлены как деревья. Это, например, классификационные, иерархические, рекурсивные и др. структуры. Более подробно о деревьях рассказано в параграфе 1.2.1.

Свойства полей базы данных

Поля базы данных не просто определяют структуру базы — они еще определяют групповые свойства данных, записываемых в ячейки, принадлежащие каждому из полей.

Ниже перечислены основные свойства полей таблиц баз данных на примере СУБД Microsoft Access:

• Имя поля — определяет, как следует обращаться к данным этого поля при автоматических операциях с базой (по умолчанию имена полей используются в качестве заголовков столбцов таблиц).

• Тип поля — определяет тип данных, которые могут содержаться в данном поле.

• Размер поля — определяет предельную длину (в символах) данных, которые могут размещаться в данном поле.

• Формат поля — определяет способ форматирования данных в ячейках, принадлежащих полю.

• Маска ввода — определяет форму, в которой вводятся данные в поле (средство автоматизации ввода данных).

• Подпись — определяет заголовок столбца таблицы для данного поля (если подпись не указана, то в качестве заголовка столбца используется свойство Имя поля).

• Значение по умолчанию — то значение, которое вводится в ячейки поля автоматически (средство автоматизации ввода данных).

• Условие на значение — ограничение, используемое для проверки правильности ввода данных (средство автоматизации ввода, которое используется, как правило, для данных, имеющих числовой тип, денежный тип или тип даты).

• Сообщение об ошибке — текстовое сообщение, которое выдается автоматически при попытке ввода в поле ошибочных данных (проверка ошибочности выполняется автоматически, если задано свойство Условие на значение).

• Обязательное поле — свойство, определяющее обязательность заполнения данного поля при наполнении базы.

• Пустые строки — свойство, разрешающее ввод пустых строковых данных (от свойства Обязательное поле отличается тем, что относится не ко всем типам данных, а лишь к некоторым, например к текстовым).

• Индексированное поле — если поле обладает этим свойством, все операции, связанные с поиском или сортировкой записей по значению, хранящемуся в данном поле, существенно ускоряются. Кроме того, для индексированных полей можно сделать так, что значения в записях будут проверяться по этому полю на наличие повторов, что позволяет автоматически исключить дублирование данных.

Поскольку в разных полях могут содержаться данные разного типа, то и свойства у полей могут различаться в зависимости от типа данных. Так, например, список вышеуказанных свойств полей относится в основном к полям текстового типа. Поля других типов могут иметь или не иметь эти свойства, но могут добавлять к ним и свои. Например, для данных, представляющих действительные числа, важным свойством является количество знаков после десятичной запятой. С другой стороны, для полей, используемых для хранения рисунков, звукозаписей, видеоклипов и других объектов OLE, большинство вышеуказанных свойств не имеют смысла.

Создание таблиц

• Работа с любыми объектами начинается с окна База данных (рисунок 3). На левой панели данного окна сосредоточены элементы управления для вызова всех семи типов объектов программы. Создание таблиц начинается с выбора элемента управления Таблицы.

• На правой панели представлен список таблиц, уже имеющихся в составе базы, и приведены элементы управления для создания новой таблицы. Чтобы создать таблицу вручную, следует использовать значок Создание таблицы в режиме конструктора.

• При создании таблицы целесообразно (хотя и не обязательно) задать ключевое поле. Это поможет впоследствии, при организации связей между таблицами. Для задания ключевого поля достаточно щелкнуть на его имени правой кнопкой мыши и в открывшемся контекстном меню выбрать пункт Ключевое поле.

• Закончив создание структуры таблицы, бланк закрывают (при этом система выдает запрос на сохранение таблицы), после чего дают таблице имя, и с этого момента она доступна в числе прочих таблиц в основном окне База данных. Оттуда ее и можно открыть в случае необходимости.

• Созданную таблицу открывают в окне База данных двойным щелчком на ее значке. Новая таблица не имеет записей — только названия столбцов, характеризующие структуру таблицы (рисунок 4). Заполнение таблицы данными производится обычным порядком. Курсор ввода устанавливается в нужную ячейку указателем мыши. Переход к следующей ячейке можно выполнить клавишей TAB. Переход к очередной записи выполняется после заполнения последней ячейки.

В нижней части таблицы расположена Панель кнопок перехода. Ее элементами управления удобно пользоваться при навигации по таблице, имеющей большое число записей.

Начинающим пользователям Microsoft Access доставляет неудобство тот факт, что данные не всегда умещаются в ячейках таблицы. Шириной столбцов можно управлять методом перетаскивания их границ. Удобно использовать автоматическое форматирование столбцов «по содержимому». Для этого надо установить указатель мыши на границу между столбцами (в строке заголовков столбцов), дождаться, когда указатель сменит форму, и выполнить двойной щелчок. Это общесистемный прием Windows 98, и им можно пользоваться в данной программе, как и во многих других.

После наполнения таблицы данными сохранять их не надо — все сохраняется автоматически. Однако если при работе с таблицей произошло редактирование ее макета (например, изменялась ширина столбцов), СУБД попросит подтвердить сохранение этих изменений.

Если возникнет необходимость изменить структуру таблицы (состав полей или их свойства), таблицу надо открыть в режиме Конструктора. Для этого ее следует выделить в окне База данных и щелкнуть на кнопке Конструктор.

Если на этапе проектирования базы данных была четко разработана структура таблиц, то создание таблиц с помощью Конструктора происходит очень быстро и эффективно. Даже без использования автоматизированных средств создание основы для достаточно крупных проектов происходит в считанные минуты — это ценное свойство СУБД Microsoft Access, но оно реализуется при непременном условии тщательной предварительной подготовки.

Запросы как объекты СУБД

В целом все запросы решают проблему обновления базы данных. Существуют различные формы запросов. Выбор формы запросы зависит от решаемой рекламной задачи, от системы организации системы базы данных, а так же от пристрастий пользователя. В любом случае пользователь получает из базы данных информацию, требуемую в данный момент времени.

Работа с запросами

Запросы представляют собой набор выборочной информации из общей базы данных.

Если структура базы данных предприятия хорошо продумано, то исполнители, работающие с базой, должны навсегда забыть о том, что в базе есть таблицы, а ещё лучше, если они об этом вообще ничего не знают. Таблицы – слишком ценные объекты базы, чтобы с ними имел дело кто-либо, кроме разработчика базы.

Если исполнителю надо получить данные из базы, он должен использовать специальные объекты – запросы. Все необходимые запросы разработчик базы должен подготовить заранее. Если запрос подготовлен, надо открыть панель Запросы в окне базы данных, выбрать его и открыть двойным щелчком на значке – откроется результирующая таблица, в которой исполнитель найдёт то, что его интересует.

В общем случае результирующая таблица может не соответствовать ни одной из базовых таблиц базы данных. Её поля могут представлять набор из полей разных таблиц, а её записи могут содержать отфильтрованные и отсортированные записи таблиц, на основе которых формировался запрос. Лишь в тех случаях, когда исполнитель не находит нужных данных в результирующей таблице, возникает необходимость готовить новый запрос – это задача разработчика базы.

Управление отображением данных в результирующей таблице.

В нижней части бланка запроса по образцу имеется строка Вывод на экран . По умолчанию предполагается, что все поля, включённые в запрос, должны выводиться на экран, но это не всегда целесообразно. Например, бывают случаи, когда некое поле необходимо включить в запрос, на пример потому, что оно является полем сортировки, но в то же время, не желательно, чтобы пользователь базы видел его содержание. В таких случаях отображения содержимого на экране подавляют сбросом флажка Вывод на экран.

Упорядочение записей в результирующей таблице.

Если необходимо, чтобы данные, отобранные в результате работы запроса по образцу, были упорядочены по какому-либо полю, применяется сортировка. В нижней части бланка имеется специальная строка Сортировка . При щелчке на этой строке открывается кнопка раскрывающегося списка, в котором можно выбрать метод сортировки: по возрастанию или по убыванию. В результирующей таблице данные будут отсортированные по тому полю, для которого задан порядок сортировки.

В приведённом примере в поле Наименование изделия сортировка будит производиться по возрастанию, а в поле Рекламодатель – по убыванию.

Возможна многоуровневая сортировка – сразу по нескольким полям. В этом случае данные сначала сортируются по тому полю, которое в бланке запроса по образцу находится левее, за тем по следующему полю, для которого включена сортировка, и так далее слева направо. Соответственно, при формировании запроса надо располагать поля результирующей таблицы не как попало, а с учётом будущей сортировки. В крайнем случае, если запрос уже сформирован, и надо изменить порядок следования столбцов, пользуются следующим приёмом:

Выделяют столбец щелчком на его заголовке (кнопку мыши отпускают).

Ещё раз щёлкают на заголовке уже выделенного столбца (но кнопку не отпускают) Перетаскивают столбец уже в другое место.

Использование условия отбора.

Дополнительным средством, обеспечивающим отбор данных по заданному критерию, является так называемое Условие отбора . Соответствующая строка имеется в нижней части бланка запроса по образцу.

Вычисляемые поля в запросах.

Допустимо использование вычисляемых полей. Для этого применяется «построитель выражений». В этой структуре используются следующие обозначения:

Sum – определяет сумму значений числового поля.

Count – определяет количество группируемых записей.

Min и Max – определяют минимальное и максимальное значение поля.

First – выбирает первое значение.

Визуальные средства создания запросов.

Определяющим моментом формированием запросов является связь между таблицами. Связи в информационных технологиях показывают, какие поля, из каких таблиц связанны и каким образом. Синонимом слова Связь является слово Отношение.

В системе управления базы данных рассматриваются три типа отношений:

• «Один-к-одному». При данном типе отношения в запросе по образцу происходит объединение только совпадающих записей.

• «Один-ко-многим». При данном типе отношения происходит объединение всех записей из одной таблицы, с совпадающими записями из другой.

• «Многие-ко-многим».

Особенности запросов

Особенность запроса состоит в том, что по запросу выбираются данные из базовых таблиц, и на их основе создаются временные результирующие таблицы.

Эти временные таблицы находятся в оперативной памяти. При запросе пользователь имеет дело с отражением требуемых полей оперативной памяти, потому что работы с запросами происходит гораздо эффективнее, так как время доступа к базе данных, хранящейся на винчестере гораздо больше времени доступа к запросам в оперативной памяти.

В запрос заносятся только требуемые поля из общей таблицы, поэтому просмотр результата в значительной мере упрощается.

Работа с запросами

Запрос – это отбор записей в разнообразных формах, в соответствии с выбранными условиями.

Запросы служат для извлечения данных из таблиц и предоставления их пользователю в удобном виде.

Если запрос подготовлен, то надо:

· открыть панель Запросы в окне База данных;

· выбрать его и открыть двойным щелчком на его значке –

· откроется результирующая таблица, в которой исполнитель найдёт то, что его интересует.

Если нет нужных данных, то готовится новый запрос.

Самые простые запросы – запросы на выборку.

Все необходимые запросы разработчик базы должен подготовить заранее.

Сначала решают, какие таблицы надо включить в запрос.

Самые распространённые запросы на выборку.

Сначала определяются:

· поля, которые должны быть включены в запрос;

· каким образом должны быть отсортированы данные;

· условия отбора, которые должны быть использованы в запросе.

Для создания запроса в режиме Конструктора запроса:

Открыть окно БД;

Щёлкнуть на вкладке Запрос;

Щёлкнуть на кнопке Создать;

Появится диалоговое окно Новый запрос.

Щёлкнуть по кнопке ОК.

В диалоговом окне Таблица:

5. Выбрать из списка необходимую и щёлкнуть по кнопке Добавить. Access добавит эту таблицу в окно Конструктора запроса.

Щёлкнуть на кнопке Закрыть.

Структура таблицы

таблица появится сверху окна на экране конструктора.

Поле. Эта строка содержит поле из списка, которое включается в запрос;

Имя таблицы. Показывает имя таблицы из которого взято поле;

Сортировка. Позволяет указать, на основании каких полей будет производиться сортировка записей;

Вывод на экран. Определяет будет ли данное поле выводиться на экран;

Условие отбора. Позволяет включать или не включать записи в результирующую таблицу. Условия задаются с помощью операторов AND и OR.

Заполнение бланка запроса

С помощью контекстного меню в верхней половине бланка открываются те таблицы, к которым обращён запрос.

В них щёлкают двойными щелчками на названиях тех полей, которые должны войти в результирующую таблицу. При этом автоматически заполняются столбцы в нижней части бланка.

Сформировав структуру запроса, его закрывают.

Бланк запроса представлен на рисунке. Как видно, он состоит из двух областей. В верхней отражается структура таблиц, к которым запрос адресован, а нижняя область разбита на столбцы – по одному столбцу на каждое поле будущей результирующей таблицы.

Поле. Может быть вычисляемым (содержать выражение).

Имя таблицы полезно в тех случаях, когда запрос основан на нескольких таблиц.

Используется в случаях, когда поле с условием не должно появляться на экране.

В зависимости от типа запроса, строк может быть больше.

Сортировка данных в запросе

При щелчке на строке Сортировка открывается кнопка раскрывающегося списка, в котором можно выбрать метод сортировки: по возрастанию или по убыванию.

Возможна многоуровневая сортировка – сразу по нескольким полям, но в строгой очерёдности слева на право.

Поля надо располагать с учётом будущей сортировки, перетаскивать при необходимости на соответствующие места (с помощью мыши).

Управление отображением данных осуществляется установкой (или сбросом) флажка Вывод на экран.

Использование условий отбора обеспечивает отбор данных по заданному критерию. Для каждого поля можно записать индивидуальное условие.

Виды запросов:

· На выборку;

· Запрос с параметром (критерий задаёт сам пользователь)

· Итоговые запросы (производят вычисления по задан ному полю и выдают результат);

· Запросы на изменение (позволяют автоматизировать — заполнение полей таблиц);

· Перекрёстные запросы (позволяют создавать результирующие таблицы на основе результатов расчётов, полученных при анализе группы таблиц)

· Специфические запросы – запросы к серверу БД, написанные на языке запросов SQL.

Форма как объект СУБД

Смысл формы — пользователь получает возможность заполнять только некоторые из полей. Преимущество форм раскрывается особенно наглядно при вводе данных заполненных бланков. Здесь форма повторяет вид бланка. Это снижает количество ошибок, упрощает работу.

Работа с формами

С одной стороны, формы позволяют пользователям вводить данные в таблицы базы данных без непосредственного доступа к самим таблицам. С другой стороны, они позволяют выводить результаты работы запросов не в виде скупых результирующих таблиц, а в виде красиво оформленных форм. В связи с таким разделением существует два вида формирования структуры форм: на основе таблицы и на основе запроса, хотя возможен и комбинированный подход, — это вопрос творчества.

Автоформы

В отличие от таблиц и запросов, которые мы формировали вручную, формы удобнее готовить с помощью средств автоматизации. Полностью автоматическими являются средства, называемые автоформами.

Существует три вида автоформ:

• Автоформа «в столбец» отображает все поля одной записи — она удобна для ввода и редактирования данных.

• «Ленточная» автоформа отображает одновременно группу записей — ее удобно использовать для оформления вывода данных.

• Табличная автоформа по внешнему виду ничем не отличается от таблицы, на которой она основана.

Структура формы Форма имеет три основных раздела:

• область заголовка.

• область данных.

• область примечания.

Линии, разделяющие разделы, перетаскиваются по вертикали с помощью мыши — это позволяет изменять размеры разделов так, как требуется.

Разделы заголовка и примечания имеют чисто оформительское назначение — их содержимое напрямую не связано с таблицей или запросом, на котором основана форма. Раздел данных имеет содержательное значение — в нем представлены элементы управления, с помощью которых выполняется отображение данных или их ввод. Разработчик формы может разместить здесь дополнительные элементы управления для автоматизации ввода данных (переключатели, флажки, списки и другие, типичные для приложений Windows).

Общие сведения о построителе выражений

Построитель выражений предоставляет возможность поиска и вставки компонентов выражения, которые сложно запомнить, например идентификаторов (имен полей, таблиц, форм, запросов и т. д.), а также имен и аргументов функций.

С помощью построителя выражений можно написать выражение «с нуля» или выбрать одно из готовых выражений для отображения номеров страниц, текущей даты, а также текущей даты и времени.

Построитель выражений можно запускать из большинства областей Microsoft Office Access 2007, где выражения создаются вручную, например из свойства Данные элемента управления или свойства Условие на значение поля таблицы. Как правило, если отображается кнопка Построить, ее можно нажать для запуска построителя выражений.

Отчёт как объект СУБД

Отчёты отличаются от прочих объектов Access тем, что предназначены только для вывода данных на печатающее устройство, но не на экран. В них приняты специальные меры для группировки выходных данных и для вывода специальных элементов оформления, характерных для печатных документов.

Отчеты во многом похожи на формы и страницы доступа к данным, но имеют иное функциональное назначение — они служат для форматированного вывода данных на печатающие устройства и, соответственно, при этом должны учитывать параметры принтера и параметры используемой бумаги.

Здесь существуют средства ручного, автоматического и автоматизированного проектирования. Структура готового отчёта отличается от структуры формы только увеличенным количеством разделов. Кроме разделов заголовка, примечания и данных, отчёт может содержать разделы верхнего и нижнего колонтитулов. Если отчёт занимает более одной страницы, эти разделы необходимы для печати служебной информации, например номеров страниц.

Чем больше страниц занимает отчёт, тем важнее роль данных, выводимых на печать через эти разделы. Если для каких-то полей отчёта применена группировка, количество разделов отчёта увеличивается, поскольку оформление заголовков групп выполняется в отдельных разделах.

Структуру отчёта можно рассмотреть и отредактировать в режиме Конструктора. Она имеет следующие разделы:

· Область заголовка;

· Область данных;

· Область примечания;

· Область верхнего и нижнего колонтитулов (для печати номеров страниц и полного количества страниц).

Существуют два вида автоотчётов:

1. Автоотчёт в столбец и

2. Ленточный Автоотчёт

Этапы проектирования баз данных:

1. Системный анализ предметной области

2. Инфологическое проектирование

3. Выбор СУБД

4. Датологическое проектирование

5. Физическое проектирование

I Системный анализ предметной области

На первом этапе проектирования баз данных рассматриваются цели и задачи с помощью которой они будут решатся. Анализируются информационные потребности будущих пользователей баз данных. Рассматриваются формы входных и выходных потоков, которые будут составлять основу баз данных. Затем уточняются алгоритмы и процедуры обработки данных хранимой в базе данных. Формируются требования, которым должна удовлетворять проектируемая база данных и определяется примерный список объектов предметной области, свойства которых будут использоваться при разработке базы данных.

II Инфологическое проектирование

На второй стадии проектирования выполняется моделирование данных. Моделирование данных – это процесс создания логической структуры данных.

Существует два подхода к моделированию данных:

1. Модель «Сущность-связь»

2. Семантическая объектная модель

Эти модели представляют собой языки для описания структуры данных и их связей в представлениях пользователей. Моделирование данных, подобно блок-схемам, отражают логику программы.

III Выбор СУБД

При выборе СУБД руководствуются следующими соображениями:

— аппаратное обеспечение, на котором в дальнейшем будет работать проектируемая база данных;

— системное программное обеспечение, с которым будет в последствии работать проектируемая база данных и соответствующее ей приложения;

— методология и подходы, к программированию реализованные в той или иной СУБД;

— модель данных, которая встроена в конкретную СУБД;

Выбор СУБД полностью определяется на II этапе построения базы данных, т. к. оно зависит от той модели данных, которая встроена в выбранную СУБД.

IV Датологическое проектирование

После того, как выбор СУБД завершён, необходимо приступить к проектированию датологической модели базы данных. При формировании датологической схемы, каждая из определённых в концептуальной схеме сущностей отображается в таблицу, которая является одним отношением. При этом следует учитывать ограничения на размер таблиц, которые накладывает конкретная СУБД.

V Физическое проектирование

Этап физического проектирования заключается в увязке логической структуры БД и физической среды хранения с целью наиболее эффективного размещения данных, т.е. отображении логической структуры БД в структуру хранения. Решается вопрос размещения хранимых данных в пространстве памяти, выбора эффективных методов доступа к различным компонентам "физической" БД. Результаты этого этапа документируются в форме схемы хранения на языке определения данных (DDL). Принятые на этом этапе решения оказывают определяющее влияние на производительность системы.

Этапы развития БД:

1. БД на больших эвм:

Все СУБД базируются на мощных мультипрограммных ОС, поэтому в основном поддерживается работа с централизованно БД в режиме распределенного доступа. функции управления распределением ресурсов в основном осуществляются ОС. поддерживаются языки низкого уровня манипулирования данными, ориентированные на навигационные методы доступа к данным. значительная роль отводится администрированию данных. Проводятся серьезные работы по обоснованию и формализации модели данных( System R). Проводятся теоретические работы по оптимизации запросов и управлению распределенным доступом к БД, было введено понятие транзакций. появляются первые языки высокого уровня для работы с реляционной моделью данных, однако отсутствуют стандарты для этих языков.

2. Эпоха ПК:

Все субд были рассчитаны на создание бд с монопольным доступом. Большинство СУБД имели удобный и развитый пользовательский интерфейс. в большинстве существовал интерактивный режим работы с БД, как в рамках описания БД, так и в рамках проектирования запросов. Во всех настольных СУБД поддерживался только внешний уровень представления реляционной модели( только внешний табличный вид структуры данных). при наличии высокоуровневых языков манипулирования данными типа реляционной алгебры, в настольных СУБД поддерживались низкоуровневые языки манипулирования данными, на уровне строк и таблиц. в настольных субд отсутствовали средства поддержки ссылочной и структурной целостности БД. Эти функции должны были выполнять приложения, однако, скудность средств разработки приложений никогда не позволяла это сделать, и в этом случае функции выполнялись пользователем. Наличие монопольного режима работы фактически привело к рождению функций администрирования БД. В связи с этим отсутствовали инструментальные средства администрирования БД. Сравнительно скромные требования к аппаратному обеспечению со стороны настольных СУБД. (D Base, Fox Pro, Paradox, Cleepper).

3. Распределенные БД:

Практически все современные СУБД обеспечивают поддержку полной реляционной модели(структурная целостность(допустимыми являются только данные, представленные в виде отношения реляционной модели), языковой целостности, ссылочной целостности( контроль за соблюдением ссылочной целостности, и гарантия невозможности со стороны СУБД нарушить ограничения). Большинство современных СУБД рассчитаны на многоплатформенную архитектуру. Необходимость поддержки многопользовательской работы с БД. возможность децентрализованного хранения данных потребовалось развитие средств администрирования с реализацией общей концепции средств защиты данных. Для того, чтобы не потерять клиентов, которые ранее работали на настольных СУБД, практически все современные СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД и средств экспорта данных из форматов настольных СУБД 2 этапа развития. Разработан ряд стандартов, в рамках языков описания и манипулирования данными технологии по обмену данными между различными данными, к которым можно отнести протокол ODBC, предложенной фирмой Microsoft. К этому этапу можно отнести начало работ, связанных с концепцией объектно-ориентированных БД. Oracle7.3, 8.4., System 10-11, informix, DB2.

Перспективы развития СУБД.

Банк данных — система, специальным образом организованных данных — баз данных, программных, технических, языковых, организационно-методических, предназначенных для коллективного, многоцелевого использования данных.

БД — именованная совокупность данных, отражающих состояние объектов, и их отношений в рассматриваемой предметной области.

СУБД-совокупность языковых программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Основные требования к базам данных в рамках КИС

1.Распределенная обработка данных. Современные корпорации имеют всегда разветвленную географическую структуру, отдельные узлы которой распределяются в разных городах, странах и континентах. Распределенная сеть требует иного подхода, чем локальная. Стоит дорого, не всегда может обеспечить быструю и надежную связь между узлами, поэтому встает задача обеспечения определенной степени автономности рабочих узлов. Это степень обратно пропорциональна степени согласованности данных в различных узлах. Распределенная обработка данных диктуется не только географической структурой. но и желанием повысить производительность за счет распределенной нагрузки между серверами. Также. могут корпорации испытывать ряд программ, каждая из которых работает со своей базой данных, и эти базы данных нужно поддерживать в согласованном состоянии.

2.Масштабируемость. Обработка данных в корпорациях подразумевает:

большой объем информации, большую интенсивность транзакций, большое количество пользователей. Т.е. чтобы сделать работу высокопроизводительной, нужна не только быстрая и дорогая аппаратура, но и возможность использования одного и того же программного решения в узлах обработки данных разных масштабов (от настольных ЭВМ до мощных пластеров, обслуживающих корпорацию). При этом наращивание мощности аппаратуры должна адекватно отражаться на производительности программ.

3. Технология хранилищ данных. Любая корпорация должна анализировать накопленные данные, т.к. без анализа нельзя принять правильные управленческие решения. Анализ должен быть всесторонним, средства анализа гибкими и понятными пользователям.

Выполнять требования невозможно без организации хранилищ данных и построения на его базе систем поддержки принятия решений (СППР), которые базируются на OLAP технологиях, так как они обеспечивают интуитивно понятный анализ, хорошую скорость обработки больших объемов данных.

4.Снижение стоимости владения. Это показатель, который учитывает не только начальные вложения в систему обработки данных: приобретение аппаратуры и системного программного обеспечения, прикладного программного обеспечения, но и конечные затраты: разработку специализированного программного обеспечения, внедрение ПО, обучение пользователей, текущее сопровождение, модернизация.

Стоимость владения определяется совокупностью количества продуктов. Не обязательно, что дешевый программный продукт обеспечит минимальную стоимость владения, так как его поддержка и модернизация может обойтись дороже, чем приобретение программы у более дорогих конкурентов.

Очевидная выгода использования интранет в туристических информационных системах:

* Высокая производительность при совместной работе над какими-то общими проектами

* Легкий доступ персонала к данным

* Гибкий уровень взаимодействия: можно менять бизнес-схемы взаимодействия как по вертикали, так и по горизонтали.

* Мгновенная публикация данных на ресурсах интранет позволяет специфические корпоративные знания всегда поддерживать в форме и легко получать отовсюду в компании, используя технологии Сети и гипермедиа. Например: служебные инструкции, внутренние правила, стандарты, службы рассылки новостей, и даже обучение на рабочем месте.

* Позволяет проводить в жизнь общую корпоративную культуру и использовать гибкость и универсальность современных информационных технологий для управления корпоративными работами.

Интранет (англ. Intranet, также употребляется термин интрасеть) — в отличие от сети Интернет, это внутренняя частная сеть организации. Как правило, интранет — это Интернет в миниатюре, который построен на использовании протокола IP для обмена и совместного использования некоторой части информации внутри этой организации. Это могут быть списки сотрудников, списки телефонов партнёров и заказчиков. Чаще всего под этим термином имеют в виду только видимую часть интранет — внутренний веб-сайт организации. Основанный на базовых протоколах HTTP и HTTPS и организованный по принципу клиент-се́рвер, интранет-сайт доступен с любого компьютера через браузер. Таким образом, интранет — это «частный» Интернет, ограниченный виртуальным пространством отдельно взятой организации. Intranet допускает использование публичных каналов связи, входящих в Internet, (VPN), но при этом обеспечивается защита передаваемых данных и меры по пресечению проникновения извне на корпоративные узлы.

Приложения в intranet основаны на применении Internet-технологий и в особенности Web-технологии: гипертекст в формате HTML, протокол передачи гипертекста HTTP и интерфейс се́рверных приложений CGI. Составными частями Intranet являются Web-се́рверы для статической или динамической публикации информации и браузеры для просмотра и интерпретации гипертекста.

Интранет в туристических информационных системах построен на базе тех же понятий и технологий, которые используются для Интернета, такие как архитектура клиент-сервер и стек протоколов Интернет (TCP/IP). В интранете встречаются все из известных интернет-протоколов, например, протоколы HTTP (веб-службы), SMTP (электронная почта), и FTP (передача файлов). Интернет-технологии часто используются для обеспечения современными интерфейсами функции информационных систем, размещающих корпоративные данные.

Интранет можно представить как частную версию Интернета, или как частное расширение Интернета, ограниченного организацией с помощью брандмауэра. Первые интранет-веб-сайты и домашние страницы начали появляться в организациях в 1990—1991. Однако по неофициальным данным, термин интранет впервые стал использоваться в 1992 году в таких учреждениях, как университеты и корпорации, работающие в технической сфере.

Интранет также противопоставляют Экстранету; доступ к интранету предоставлен только служащим организации, в то время как к экстранету могут получить доступ клиенты, поставщики, или другие утверждённые руководством лица. В Экстранет-технологии помимо частной сети, пользователи имеют доступ к Интернет ресурсам, но при этом осуществляются специальные меры для безопасного доступа, авторизации, и аутентификации.

Интранет туристической компании не обязательно должен обеспечивать доступ к Интернету. Когда такой доступ всё же обеспечивается, обычно это происходит через сетевой шлюз с брандмауэром, ограждая интранет от несанкционированного внешнего доступа. Сетевой шлюз часто также осуществляет пользовательскую аутентификацию, шифрование данных, и часто — возможность соединения по виртуальной частной сети (VPN) для находящихся за пределами предприятия сотрудников, чтобы они могли получить доступ к информации о компании, вычислительным ресурсам и внутренним контактам.

Что такое КИП?

Корпоративный информационный портал (КИП) предназначен для создания единого информационного пространства компании и позволяет интегрировать в единое целое разнородные корпоративные приложения, предоставляя им единый интерфейс доступа.

Функциональность портала определяется потребностями заказчика. Обычно в рамках КИП осуществляются следующие процессы и оказываются следующие сервисы:

• обеспечение информационной поддержки сотрудников и клиентов компании;

• организация коллективной работы и взаимодействия удаленных рабочих групп;

• управление правами доступа, персонализация предоставляемых данных;

• управление публикациями (размещением и редактированием информации);

• организация доступа к приложениям и данным через web-браузер с любого компьютера, подключенного к Интернету.

Корпоративные порталы – это сложные технологические решения, включающие в себя организацию взаимодействия с существующими приложениями, хранилищами данных, OLAP-системами, системами электронного документооборота и поддержки принятия решений и т. д. При разработке подобных систем используются современные методы и технологии, например, CORBA и DCOM.

При проектировании и разработке КИП должны учитываться управленческая структура и политика информационной безопасности компании, должностные инструкции сотрудников, формы и методы работы с клиентами и многое другое.

Основная задача корпоративного портала – создание и поддержка единой интегрированной среды для ежедневной работы сотрудников с корпоративными ресурсами и информационными ресурсами Интернета.

Способы аналитической обработки данных

Для того чтобы существующие хранилища данных способствовали принятию управленческих решений, информация должна быть представлена аналитику в нужной форме, то есть он должен иметь развитые инструменты доступа к данным хранилища и их обработки.

Полная структура информационно-аналитической системы, построенной на основе хранилища данных. В конкретных реализациях отдельные компоненты этой схемы часто отсутствуют.

Оперативная аналитическая обработка данных

В основе концепции OLAP лежит принцип многомерного представления данных. В 1993 году в статье [11] E. F. Codd рассмотрел недостатки реляционной модели, в первую очередь указав на невозможность "объединять, просматривать и анализировать данные с точки зрения множественности измерений, то есть самым понятным для корпоративных аналитиков способом", и определил общие требования к системам OLAP, расширяющим функциональность реляционных СУБД и включающим многомерный анализ как одну из своих характеристик.

В большом числе публикаций аббревиатурой OLAP обозначается не только многомерный взгляд на данные, но и хранение самих данных в многомерной БД [6]. Вообще говоря, это неверно, поскольку сам Кодд отмечает, что "Реляционные БД были, есть и будут наиболее подходящей технологией для хранения корпоративных данных. Необходимость существует не в новой технологии БД, а, скорее, в средствах анализа, дополняющих функции существующих СУБД и достаточно гибких, чтобы предусмотреть и автоматизировать разные виды интеллектуального анализа, присущие OLAP". Такая путаница приводит к противопоставлениям наподобие "OLAP или ROLAP", что не совсем корректно, поскольку ROLAP (реляционный OLAP) на концептуальном уровне поддерживает всю определенную термином OLAP функциональность. Более предпочтительным кажется использование для OLAP на основе многомерных СУБД специального термина MOLAP, как это и сделано в [4, 9].

По Кодду, многомерное концептуальное представление (multi-dimensional conceptual view) представляет собой множественную перспективу, состоящую из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ. Каждое измерение включает направления консолидации данных, состоящие из серии последовательных уровней обобщения, где каждый вышестоящий уровень соответствует большей степени агрегации данных по соответствующему измерению. Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения "предприятие — подразделение — отдел — служащий". Измерение Время может даже включать два направления консолидации — "год — квартал — месяц — день" и "неделя — день", поскольку счет времени по месяцам и по неделям несовместим. В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up) означает движение от низших уровней к высшим.

Требования к средствам оперативной аналитической обработки

Кодд определил 12 правил, которым должен удовлетворять программный продукт класса OLAP

1. Многомерное концептуальное представление данных

2. Прозрачность

3. Доступность

4. Устойчивая производительность

5. Клиент — серверная архитектура

6. Равноправие измерений

7. Динамическая обработка разреженных матриц

8. Поддержка многопользовательского режима

9. Неограниченная поддержка кроссмерных операций

10. Интуитивное манипулирование данными

11. Гибкий механизм генерации отчетов

12. Неограниченное количество измерений и уровней агрегации

Набор этих требований, послуживших фактическим определением OLAP, следует рассматривать как рекомендательный, а конкретные продукты оценивать по степени приближения к идеально полному соответствию всем требованиям.

OLAP-системы

Ключевую роль в управлении компанией играет информация. Как правило, даже небольшие компании используют несколько информационных систем для автоматизации различных сфер деятельности. Получение аналитической отчётности в информационных системах, основанных на традиционных базах данных сопряжено с рядом ограничений:

Разработка каждого отчёта требует работы программиста.

Отчёты формируются очень медленно (зачастую несколько часов), замедляя при этом работу всей информационной системы.

Данные, получаемые от различных структурных элементов компании не унифицированы и часто противоречивы.

OLAP-системы, самой идеологией своего построения предназначены для анализа больших объёмов информации, позволяют преодолеть ограничения традиционных информационных систем.

Электронная аналитическая обработка (OLAP) баз данных упрощает обработку запросов бизнес-аналитики. OLAP — это технология организации баз данных, оптимизированная для обработки запросов и получения отчетов, вместо обработки транзакций. Источником данных для OLAP являются базы данных систем оперативной обработка транзакций (OLTP), обычно размещенные в хранилищах данных. Данные OLAP выводятся из этих данных за длительный период времени и объединяются в структуры, дающие возможность сложного анализа. Данные OLAP организуются иерархически и хранятся в кубах вместо таблиц. Это сложная технология, использующая многомерные структуры для обеспечения быстрого доступа к данным для анализа. Такая организация позволяет легко создавать отчеты сводных таблиц и сводных диаграмм для отображения высокоуровневых сводок, таких как совокупность продаж по всей стране, а также отображать подробности для мест, где продажи чрезвычайно велики или малы.

Базы данных OLAP предназначены для ускорения поиска данных. Поскольку сервер OLAP, в отличие от Microsoft Office Excel, вычисляет итоговые значения, требуется меньше данных для пересылки в Excel при создании или изменении отчета. Такой подход дает возможность работать с гораздо большим объемом исходных данных, нежели когда данные организованы как традиционная база данных, в которой Excel отыскивает все отдельные записи и затем вычисляет итоговые значения.

Базы данных OLAP содержат два основных типа данных: показатели, являющиеся числовыми данными, количества и средние значения, используемые для для разработки обоснованных деловых решений, и размерности, являющиеся категориями, используемыми для организации этих показателей. Базы данных OLAP помогают организовать данные по многим уровням детализации, используя знакомые категории для анализа данных.

Data Mining — это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации).

Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Методы Data Mining имеет смысл применять только для достаточно больших баз данных. Развитие технологий баз банных сначала привело к созданию специализированного языка – языка запросов к базам данных. Для реляционных баз банных – это язык sql, который предоставил широкие возможности для создания, изменения и извлечения хранимых данных. Затем возникла необходимость в получении аналитической информации, и тут оказалось, что традиционные реляционные базы данных плохо приспособлены для проведения анализа. Это привело к созданию «хранилищ данных», сама структура которых наилучшим способом соответствует проведению всестороннего математического анализа.

Отличия Data Mining от других методов анализа данных

Традиционные методы анализа данных (статистические методы) и OLAP в основном ориентированы на проверку заранее сформулированных гипотез и на разведочный анализ, составляющий основу оперативной аналитической обработки данных, в то время как одно из основных положений Data Mining — поиск неочевидных закономерностей. Инструменты Data Mining могут находить такие закономерности самостоятельно и также самостоятельно строить гипотезы о взаимосвязях. Большинство статистических методов для выявления взаимосвязей в данных используют концепцию усреднения по выборке, приводящую к операциям над несуществующими величинами, тогда как Data Mining оперирует реальными значениями. OLAP больше подходит для понимания ретроспективных данных, Data Mining опирается на ретроспективные данные для получения ответов на вопросы о будущем.

Корпоративная информационная система (КИС) – это вся инфраструктура предприятия, задействованная в процессе управления всеми информационно-документальными потоками, включающая в себя следующие обязательные элементы:

-Информационная модель, представляющая собой совокупность правил и алгоритмов функционирования ИС. Информационная модель включает в себя все формы документов, структуру справочников и данных, и т.д.

-Регламент развития информационной модели и правила внесения в неё изменений.

-Кадровые ресурсы (департамент развития, привлекаемые консультанты), отвечающие за формирование и развитие информационной модели.

-Кадровые ресурсы, отвечающие за конфигурирование ПК, и его соответствие утвержденной информационной модели.

-Аппаратно-техническая база, соответствующая требованиям по эксплуатации ПК (компьютеры на рабочих местах, периферия, каналы телекоммуникаций, системное ПО и СУБД)

-Эксплуатационно-технические кадровые ресурсы, включая персонал по обслуживанию аппаратно-технической базы.

-Правила использования ПК и пользовательские инструкции, регламент обучения и сертификации пользователей.

Структура корпоративной информационной системы

Этап I. Информационное обследование

Информационная система нужна организации для того, чтобы обеспечивать информационно-коммуникационную поддержку ее основной и вспомогательной деятельности. Поэтому прежде, чем вести речь о структуре и функциональном наполнении информационной системы, необходимо разобраться в целях и задачах самой организации, чтобы понять, что же нужно автоматизировать.

Этап II. Архитектура

По результатам обследования необходимо выбрать архитектуру системы. Для корпоративных систем мы рекомендуем архитектуру клиент/сервер.

Этап III. Выбор СУБД

Выбор системы управления для корпоративной базы данных — один из ключевых моментов в разработке информационной системы. На Российском рынке присутствуют практически все СУБД, принадлежащие к элитному классу — Oracle, Informix, Sybase, Ingres. Вопрос, какую СУБД использовать, можно решить только по результатам предварительного обследования и получения информационных моделей деятельности компании.

Этап IV. Выбор системы автоматизации документооборота

Неразбериха с документами (их задержки, потери, дублирование, долгое перемещение от одного исполнителя к другому и т.д.) — болезненная проблема для любой компании. Поэтому система автоматизации документооборота, которая позволяет автоматизировать ручные, рутинные операции, автоматически передавать и отслеживать перемещение документов внутри корпорации, контролировать выполнение поручений, связанных с документами и т.д. — одна из важнейших составляющих информационной системы.

Можно выделить два класса подобных систем:

1. системы workflow

2. системы groupware

Основное назначение систем обоих классов — автоматизация и поддержка коллективной работы в офисе, однако, имеются некоторые различия в их идеологической направленности и, следовательно, в наборе реализуемых функций.

Этап V. Выбор программных средств для управления документами

Появление на рынке систем управления электронными документами — EDMS (Electronic Document Management Systems) вызвано стремлением сократить поток бумажных документов и хотя бы частично уменьшить сложности, возникающие в связи с их хранением, поиском и обработкой, и перенести центр тяжести на работу с электронными документами. В отличие от документов на бумажных носителях электронные документы обеспечивают экстраординарные преимущества при создании, совместном использовании, поиске, распространении и хранении информации

Этап VI. Выбор специализированных прикладных программных средств.

При всей описанной общности каждая компания имеет свою специфику, которая определяется родом ее деятельности. Выбор специализированных программных средств в значительной степени зависит от этой специфики.

Абсолютно для всех компаний необходимо иметь в составе информационной системы стандартный набор приложений, таких как текстовые редакторы, электронные таблицы, коммуникационные программы и т.д. Одним из критериев выбора подобных систем должна быть возможность их несложной интеграции в корпоративную информационную систему.

Этап VII.

Необходимо отметить специальный класс приложений — систем поддержки принятия решений, позволяющие моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Системы подобного класса основаны на технологиях искусственного интеллекта.

Различают два направления в развитии технологий искусственного интеллекта:

1. Технология вывода, основанного на правилах;

2. Технология вывода, основанного на прецедентах.