Особенность создания баз данных с пространственно - локализованными данными

Организация и хранение информации, связанной с пространственно локализацией имеет свои особенности, которые определяются разнообразными типами информации и наличием графических данных. Рассматривая три характеристики "место", "время", "тема", следует отметить, что особенность заключается в организации с хранением данных отражающих свойство "место". Данные "время" и "тема" хранятся традиционными способами в таблицах. Характеристика "место" определяет данные, которые хранят геометрическое местоположение пространственных объектов вместе с атрибутивной информацией об этих объектах. Характеристики "место" могут хранится в табличной и графической формах. Эта возможность двойственного представления данных этой группы служит основой привязки характеристик "время" и "тема" к группе характеристики "место". Графические данные о местоположении хранятся в векторных или растровом виде, а соответствующая атрибутивная информация во множестве таблиц, связанных с описываемыми объектами. Это называют пространст-венносвязаннон структурой данных. Пространственные данные могут быть организованы тематически в виде совокупности уровней (слоев), или тем. Одна тема представляет одно множество пространственных объектов или явлений, объединенных по каким-то общим признакам. Таким образом, база данных информационной системы с пространственной локализацией данных должна содержать табличную информацию, связанную с графическими объектами. Эта связь должна быть двухсторонней. Изменение табличных данных должны приводить к изменению графического представления пространственных объектов, а изменение графических объектов должно приводить к изменению содержимого таблиц или к появлению новых таблиц. Одним из методов работы с пространственными данными является использование индексов. Индекс - форма ссылки к данным, который ускоряет доступ к данным, упорядочивая значения по полю. Индекс может постоянно находиться как файл на диске - постоянный индекс, или это может быть индекс, созданный на время сеанса работы -временный индекс. Для индексации пространственных объектов применяют пространственные индексы, которые ускорят отображение графики. Индексы пространственных объектов могут выводиться как графические образы, что помогает при анализе и интерпретации локализованных данных. Индекс атрибута помогает быстрее найти записи в таблицах атрибутов. Он повышает эффективность операций поиска данных. Одним из подходов к организации индексов является использование техники хэширования. Идея методов хэширования заключается в применение к значению ключа некоторой функции свертки (хэш-функции), вырабатывающей значение меньшего размера. Свертка значения ключа затем используется для доступа к записи. В простейшем случае свертка ключа используется как адрес в таблице, содержащей ключи и записи. Основным требованием к хэш-функции является равномерное распределение значение свертки. При возникновении неоднозначности (одна и та же свертка для нескольких значений ключа) образуются цепочки переполнения. Главным ограничением этого метода является фиксированный размер таблицы. Если таблица заполнена слишком сильно или переполнена, но возникнет слишком много цепочек переполнения, и главное преимущество хэширования - доступ к записи почти всегда за одно обращение к таблице - будет утрачено. Расширение таблицы требует ее полной переделки на основе новой хэш-функции (со значением свертки большего размера). В случае баз данных такие действия являются неприемлемыми. Поэтому обычно вводят промежуточные таблицы-справочники, содержащие значения ключей и адреса записей, а сами записи хранятся отдельно. Тогда при переполнении справочника требуется его переделка, что вызывает меньше затрат по сравнению с переделкой базы данных. Для исключения полной переделки справочников при их организации используют технику бинарных деревьев с расщеплениями и слияниями. Хэш-функция при этом меняется динамически, в зависимости от глубины В-дерева. Путем дополнительных технических ухищрений удается добиться сохранения порядка записей в соответствии со значениями ключа. В целом методы В-деревьев и хэширования все более сближаются. При организации базы данных пространственно - локализованных информационных систем применяют три схемы. Первая условно называется внутренней.Она основана на использовании внутренней базы данных информационной системы, например ГИС. Вторая схема называется локальной. Она основана на подключении к информационной системе внешней базы данных с помощью соответствующего интерфейса. Третья схема называется глобальной. Она основана на создании базы данных на Web-сервере и создании интерфейсов, позволяющих обмениваться информацией через глобальную сеть.