Автор: Автономова Наталия Владимировна
Должность: преподаватель Информатики
Учебное заведение: МЦК-ЧЭМК Минобразования Чувашии
Населённый пункт: Чебоксары
Наименование материала: Презентация
Тема: Понятие модели данных. Типы моделей данных
Раздел: среднее профессиональное
Основы проектирования баз данных
Преподаватель: Автономова Н.В.
База
данных
—
именованная
совокупность
взаимосвязанных
используемых
несколькими пользователями данных, которая отражает состояние объектов и их
отношения в некоторой предметной области.
Система управления базами данных — совокупность языковых и программных
средств, предназначенных для создания, ведения и совместного использования БД
многими пользователями.
Можно выделить три свойства, которые отличают БД от простой совокупности
данных:
База данных хранится и обрабатывается в вычислительной системе.
Данные в БД хорошо структурированы, т.е. выделены основные элементы, их
типы и связи между элементами, а также ограничения на допустимые операции.
Обеспечивается поиск и обработка данных.
Ядром любой базы данных является модель данных.
Модель данных — это формальная теория представления и обработки данных в
системе управления базами данных.
Модель данных
аспект структуры:
методы описания
типов и логических
струк тур данных в
базе данных
аспект манипуляции:
методы
манипулирования
данными
аспект целостности:
методы описания и
поддержки целостно
сти базы данных
Эдгард Кодд
В теории БД модель данных описывает информационные объекты предметной
области, взаимосвязи между ними и позволяет:
1)Определить независимость данных;
2)Обеспечить коммуни кабельность;
3)Определить обработку множеств.
Иерархическая
Реляционная
Многомерная
Сетевая
Объектно-
ориентированная
Постреляционная
Разрабатываются также всевозможные системы, основанные на других моделях данных,
расширяющих
известные
модели:
объектно-реляционные,
дедуктивно-объект но-
ориентированные, семантические, концептуальные и ориентиро ванные модели.
В отдельных СУБД поддерживается одновременно несколько моделей данных.
Иерархическая
модель
данных —
логическая
модель
данных
в
виде
древовидной
структуры, представляющая собой совокупность элементов, расположенных в порядке их
подчинения
от
общего
к
частному.
Иерархическая
модель
позволяет
строить
БД
с
иерархической древовидной структурой.
Дерево — связный неориентированный граф, не содержащий циклов.
Конечные вершины, т.е. вершины, из которых не выходит ни одной дуги, называются
листьями дерева.
Дерево
как
ориентированный
граф
можно
определить следующим образом:
•
имеется
единственная
особая
вершина,
называемая корнем, в которую не заходит ни одно
ребро;
•
во все остальные вершины заходит только одно
ребро, а исходит произвольное количество ребер;
•
граф не содержит циклов;
•
ориентация определяется от корня.
Количество вер шин на пути от корня к листьям в разных ветвях дерева может
быть разным. В ИМД используется ориента ция древовидной структуры от корня к
листьям.
Графическая
диаграмма
схемы
базы
данных
называется
деревом
определения,
состоящим
из
объектов
различных
уровней.
Верхний
уровень
занимает один объект, второй - объекты второго уровня и так далее.
Данные в иерархической структуре не равноправны – одни жестко подчинены
другим.
Сущность иерархической модели данных:
Для описания структуры (схемы) иерархической БД на некотором язы ке программирования
используется тип данных «дерево». Тип «дерево» является составным. Он включает в себя
подтипы («подде ревья»), каждый из которых, в свою очередь, является типом «дерево».
Корневым называется тип, который имеет подчиненные типы и сам не является подтипом.
Подчиненный тип (подтип) является потомком по отно шению к типу, который выступает для
него в роли предка (родителя). Потом ки одного и того же типа являются близнецами по
отношению друг к другу.
В
целом
тип
«дерево»
представляет
собой иерархически организован ный набор
типов «запись».
Иерархическая
БД
представляет
собой
упорядоченную
совокупность
экземпляров
данных
типа
«дерево»
(деревьев),
содержащих
экземпляры
типа
«запись»
(записи).
Поля
записей
хранят
собствен но
числовые
или
символьные
значения,
составляющие
основное
содер жание
БД.
Обход
всех
элементов
иерархической
БД
обычно производится сверху вниз и слева
направо.
Основные понятия применяемые в иерархической модели данных:
Атрибут
(элемент
данных,
поле)
-
определяется
как
наименьшая
неделимая
единица данных, доступная пользователю. Обычно каждому элементу при описании
базы данных присваивается уникальное имя. По этому имени к нему обращаются
при обработке. Элемент данных также часто называют полем.
Запись (сегмент) - именованная совокупность атрибутов. Использование записей
позволяет за одно обращение к базе получить некоторую логически связанную
совокупность данных. Именно записи изменяются, добавляются и удаляются.
Тип сегмента — это поименованная совокупность входящих в него атрибутов.
Экземпляр записи - конкретная запись с конкретным значением элементов
Групповое отношение - иерархическое отношение между записями двух типов.
Родительская
запись
(владелец
группового
отношения)
называется
исходной
записью,
а
дочерние
записи
(члены
группового
отношения)
-
подчиненными.
Иерархическая база данных может хранить только такие древовидные структуры.
Для организации физического размещения иерархических дан ных в памяти ЭВМ
могут быть использованы следующие группы методов:
•
представление линейным списком с последовательным распределением памяти
(адресная арифметика, левосписковые структуры);
•
представление
связными
линейными
списками
(методы,
использующие
указатели и справочники).
К
основным
операциям
манипулирования
иерархически
орга низованными
данными относятся следующие:
•
поиск указанного экземпляра БД;
•
переход от одного дерева к другому;
•
переход от одной записи к другой внутри дерева;
•
вставка новой записи в указанную позицию;
•
удаление текущей записи и т. д.
Основными достоинствами ИМД являются:
эффективное использование памяти ЭВМ;
высокая скорость выполнения основных операций над данными;
удобство работы с иерархически упорядоченной информацией;
простота
при
работе
с
небольшим
объемом
данных
так
как,
иерархический
принцип
соподчиненности понятий является естественным для многих задач.
громоздкость
такой
модели
для
обработки информации с достаточно
сложными логическими связями;
трудность
в
понимании
ее
функционирования
обычным
пользователем.
трудность в применении к данным со
сложной внутренней взаимосвязью
исключительно
навигационный
принцип доступа к данным
К недостаткам ИМД относятся:
Сетевая
модель
данных —
логическая
модель
данных,
являющаяся
расширением
иерархического
подхода,
строгая
математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в сетевых базах
данных.
Особенности СМД:
Любой
объект
может
быть
одновременно
и
главным,
и
подчиненным. Он может участвовать в
образовании
любого
числа
взаимосвязей с другими объектами.
Состоит из набора записей и набора
связей между этими записями.
Является расширением иерархического.
«Потомок» может иметь любое число «предков».
Позволяет
отображать
разнообразные
взаимосвязи
элементов
данных
в
виде
произвольного графа.
Базовыми объектами модели являются элемент данных, агрегат данных, запись,
набор данных.
Элемент данных — минимальная информационная единица, доступная пользователю с использованием СУБД. Для каждого элемента данных должен быть определен его тип (например, символьный, числовой, логический и пр.)
Агрегат данных — именованная совокупность элементов данных внутри записи, которую можно рассматривать как единое целое. Агрегат может быть простым, включающим только элементы данных и составным, включающим наряду с элементами данных и другие агрегаты.
Запись — именованная совокупность элементов данных или элементов данных и агрегатов, моделирующая некоторый класс объектов реального мира. Различают тип записи и экземпляр записи, т. е. запись с конкретными значениями элементов данных. Одна запись описывает свойства одного объекта предметной области экземпляра.
Среди элементов данных выделяются один или несколько клю чевых. Значения ключевых элементов данных (ключевых атрибутов) позволяют классифицировать объект, к которому относится конкретная запись. Ключи с уникальными значениями называются потенциальными. Каждый ключ может представлять собой агрегат данных.
Один из ключей является первичным, остальные — вторичными.
Набор данных — именованная совокупность записей, образующих двухуровневую иерархическую структуру. Каждый тип набора представляет собой отношение (связь) между двумя или несколькими типами записей.
Операции с сетевыми данными можно разделить на две группы: навигационные операции с
данными и операции модификации данных.
Навигационные операции с данными
Навигационные операции сетевых БД осуществляют переход по связям, определенных в
схеме БД, в результате таких переходов определяется запись, которую называют текущей.
Найти конкретную запись в наборе однотипных записей и сделать ее текущей;
Перейти от записи-владельца к записи-члену в некотором наборе;
Перейти к следующей записи в некоторой связи;
Перейти от записи-члена к владельцу по некоторой связи.
Операции модификации данных
Операций модификации сетевых БД осуществляют добавление новых записей данных,
добавление новых наборов данных, удаление записей данных и наборов записей, модификация
агрегатов и элементов данных.
извлечь текущую запись в буфер прикладной программы для обработки;
заменить в извлеченной записи значения указанных элементов данных на заданные новые
их значения;
запомнить запись из буфера в БД;
создать новую запись;
уничтожить запись;
включить текущую запись в текущий экземпляр набора;
исключить текущую запись из текущего экземпляра набора.
Сетевые базы данных обладают рядом преимуществ:
гибкость. Множественные отношения предок/потомок позволяют сетевой базе
данных хранить данные, структура которых была сложнее простой иерархии;
стандартизация;
быстродействие.
Вопреки
своей
большой
сложности,
сетевые
базы
данных
достигали быстродействия, сравнимого с быстродействием иерархических баз
данных.
Недостатки сетевой модели данных:
высокая
сложность
и
жесткость
схемы
БД,
построенной
на
ее
основе,
что
вызывает
трудности в понимании и выполнении обработки
информации в БД обычным пользователем;
ослаблен
контроль
целостности
связей
вследствие
допустимости
установления
произвольных связей между записями.
Реляционная модель - совокупность данных, состоящая из набора двумерных
таблиц.
Реляционная
модель
относится
к
теоретико-множественным
моделям
данных
и
на
сегодняшний
день
является
самой
популярной
как
среди
пользователей,
так
и
среди
профессиональных разработчиков.
Реляционная
модель
обеспечивает
еди нообразие
представления
данных
(информационных
объектов)
в
виде
таблиц.
Каждая
таблица
БД
—
совокупность
строк
и
столбцов.
Строки
(записи)
соответствуют
экземпляру
объекта,
конкретному
событию
или
явлению.
Столбцы (поля) соответствуют атрибутам, т.
е.
признакам,
характеристикам
или
параметрам
объекта,
события
или
какого-
либо явления.
На пересечении строк и столбцов находятся конкретные значения данных. Для каждого
поля определяется множество его значений.
Особенности таблицы РБД:
может не содержать ни одной строки, т. е. может
быть пустой
все
строки
одной
таблицы
имеют
одинаковую
структуру
может содержать не менее одного столбца
каждый
столбец
имеет
конкретный
тип
данных,
используется некоторое количество типов данных
поля должны содержать неделимую информацию
необходимо наличие первичного ключа.
Первичный
ключ
—
поле
(набор
полей),
однозначно
идентифицирующее
каждый
экземпляр объекта или запись.
Значение первичного ключа в таблице БД должно быть уникальным, т. е. в таблице не
допускается наличие двух и более записей с одинаковыми значениями первичного ключа. Он
должен быть минимально до статочным, а значит не содержать полей, удаление которых не
отразится на его уникальности.
Достоинства РМД:
Изложение информации в простой и понятной для пользователя форме (таблица).
Реляционная модель данных основана на строгом математическом аппарате, что позволяет
лаконично описывать необходимые операции над данными.
Независимость данных от изменения в прикладной программе при изменении.
Позволяет создавать языки манипулирования данными не процедурного типа.
Для работы с моделью данных нет необходимости полностью знать организацию БД.
Недостатки РМД:
Относительно медленный доступ к данным.
Трудность
в
создании
БД
основанной
на
реляционной
модели
(сложность
описания
иерархических и сетевых связей).
Трудность в переводе в таблицу сложных отношений.
Требуется относительно большой объем памяти.
Постреляционная модель данных представляет
собой
расширенную
реляционную модель,
снимающую
ограничение
неделимости данных,
хранящихся
в
записях таблиц.
Эта
модель
допускает
составные
(многозначные)
поля,
т.
е.
значение
поля
может
состоять из подзначений. Набор значений многозначных полей считается самостоятельной
таблицей, встроенной в основную таблицу.
Недостатки ПРМД:
Сложность
решения
проблемы
обеспечения
целостности и непротиворечивости хранимых
данных.
Преимущества ПРМД:
Высокая
наглядность
представления
информации
(представление
совокупности
связанных реляционных таблиц) и повышение
эффективности ее обработки.
Многомерные СУБД – это узкоспециализированные СУБД, которые предназначены
для интерактивной аналитической обработки информации.
Многомерные
системы
позволяют
оперативно
обрабатывать
информацию
для
проведения
анализа
и
принятия
решения.
По
срав нению
с
реляционной
моделью
многомерная
организация
данных
обладает
более
высокой
наглядностью
и
информативностью.
В
многомерных
СУБД
данные
организованы
в
виде
упорядо ченных
многомерных массивов — гиперкубов.
Они
обеспечивают
более
быструю
реакцию
на
запросы данных за счет того, что обра щения
поступают к относительно небольшим блокам
данных, не обходимых для конкретной группы
пользователей.
Многомерность
модели
данных
означает
не
визуальное
пред ставление,
а
логическую
организацию структуры информации при описании и в операциях манипулирования данными.
Основные понятия ММД— измерение, мера и срез.
Реляционное представление
Многомерное представление
Измерение
—
множество
однотипных
данных,
образующих
одну
из
граней
гиперкуба.
Измерения
являются осями многомерной системы координат.
В ММД измерения играют роль индексов, служащих
для
идентификации
конкретных
значений
в
ячейках
гиперкуба.
Мера (ячейка, показатель) — поле, значение которого
одно значно
определяется
фиксированным
набором
измерений. Тип поля чаще всего определен как числовой.
Куб не обязательно должен быть трехмерным. Он может быть и двух-, и многомерным — в
зависимости от решаемой задачи.
Куб сам по себе для анализа не пригоден.
Для
визуализации
данных,
хра нящихся
в
кубе,
применяются
привычные
двумерные
табличные представления со сложными иерархическими заголов ками строк и столбцов. Эта
операция называется «разрезанием» куба. Аналитик словно «разрезает» измерения куба по
интересую щим
его
направлениям,
получает
двумерный
срез
куба
и
с
ним
работает.
Пользователь получает естественную, ин туитивно понятную модель данных.
Срез
представляет
собой
подмножество
гиперкуба,
полученное в результате фиксации одного или нескольких
измерений.
Преимущества ММД:
Системы на основе многомерных баз данных требуют меньше специальных навыков по
разработке и администрированию.
Быстрый поиск и выборка данных.
Относительно низкая общая стоимость владения, а также бы стрый возврат инвестиций.
Легко
справляются
с
задачами
включения
в информационную модель
разнообразных
встроенных функ ций,
Недостатки ММД:
Громоздкость для простейших задач обычной оперативной обработки данных.
Объектно-ориентированные СУБД— результат совмещения возможностей и особенностей
баз данных и возможностей объектно-ориентированных языков программирования.
Данные в объектно-ориентированном СУБД представляются как объекты в объектно-
ориентированных языках программирования.
ООМД дает возможность идентификации отдельных записей базы.
Между записями базы данных и функциями их обработки устанавливаются взаимосвязи с
помощью механизмов в ООЯП.
Графическим
представлением
структуры
ООБД
является
дерево,
узлы
которого
представляют объекты.
Свой ства
объектов
описываются
некоторым
стандартным
типом
(напри
мер,
строковым,
string)
или
типом,
конструируемым
пользователем
(определяется как class).
Логическая структура ООБД внешне похожа на структуру иерархической базы
данных.
Основ ное отличие между ними состоит в методах манипулирования дан ными. Для
выполнения
действий
над
данными
в
рассматриваемой
модели
базы
данных
применяются
логические
операции,
усилен ные
объектно-ориентированными
механизмами.
Для того чтобы называться объектно-ориентированной, СУБД должна обладать
следующими характеристиками:
поддержка сложных объектов.
поддержка уникальности объектов.
поддержка инкапсуляции.
поддержка типов и классов;
поддержка наследования типов и классов от их предков.
язык
манипулирования
данными
должен
быть
языком
програм мирования
общего назначения;
набор типов данных дол
жен быть расширяемым.
Преимущества ООМД:
возможность отобра жения информации о сложных взаимосвязях объектов.
позволяет
идентифицировать
от дельную
запись
базы
данных
и
определять
функции их обработки.
возможность повторного и совместного использования компонентов.
Недостатки ООМД:
высокая поня тийная сложность и неудобство обработки.
возможность повторного и совместного использования компонентов.